Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   GUI-Design mit VCL / FireMonkey / Common Controls (https://www.delphipraxis.net/18-gui-design-mit-vcl-firemonkey-common-controls/)
-   -   Delphi HTML-Seite nach einzelnen Worten/Zahlen scannen Komponente? (https://www.delphipraxis.net/55104-html-seite-nach-einzelnen-worten-zahlen-scannen-komponente.html)

mschaefer 16. Okt 2005 22:15


HTML-Seite nach einzelnen Worten/Zahlen scannen Komponente?
 
N´abend

also ich suche eine Komponente, die aus einzelnen HTML-Seiten Stichworte und oder bestimmt Zahlen herausscannt und in ein StringGrid einträgt. Das Können Wetterdaten/ Preise oder Börsenkurse sein. Gibt es da schon eine Komponene, die eine solche Funktionalität aufweist oder ist da eigene Programmierung gefragt. Es ist eigentlich doch ein recht häufiges Unterfangen, aber mir ist da keine Kompo bekannt...

Grüße // Martin

Aenogym 16. Okt 2005 22:27

Re: HTML-Seite nach einzelnen Worten/Zahlen scannen Kompone
 
hi martin,

warum nicht einfach pos() und copy() nutzen? hab ich auch mal so gemacht.

aenogym

mschaefer 17. Okt 2005 12:01

Re: HTML-Seite nach einzelnen Worten/Zahlen scannen Kompone
 
Hallo Steffen,

das ist vom Prinzip natürlich ok!

Das da aber wirklich bisher keiner eine Komponente angegangen ist wundert mich halt etwas. Selbst brauche ich mehrere Werte/Textstellen aus einer Internetseite. Nun habe ich mir überlegt, das ich dies in eine Komponente auslagere um im Quelltext möglichst wenig davon zu haben.

dierljadflkjds Marke vorne dsfdfdfblalbaldfdlj 27.4° dfewelrkhewre Marke hinten murks wundsfsafsdflj

Im Moment plane ich noch etwas daran.
1. Brauche eine Stringliste für die "Textmarken" (feststehender Ausdruck im HTML-Code) vor meinem Zahlenwert.
2. Zwischen meinem Wert und der Eindeutigen Textmarke liegen eine Anzahl bekannter Zeichen. Also brauche ich eine Integerliste für den Versatz vor dem gesuchten Asdruck.

3. Textmarke hinter dem gesuchten Ausdruck. (wieder Stringliste)
4. Zeichenversatz hinter dem Ausdruck als Integerliste.

Da es mehrere Wertstellen sind, muß ich wohl mit Listen arbeiten ode in Memmory-Table (da war doch noch irgendwas..)
Ok, bin da noch im Rohbau und wird wohl noch etwas dauern...

Grüße // Martin

marabu 17. Okt 2005 12:13

Re: HTML-Seite nach einzelnen Worten/Zahlen scannen Kompone
 
Hallo Martin,

das Parsen eines HTML-Dokumentes ist immer eine Individuallösung, aber wenn du ein Muster zur Verfügung stellst, dann kann ich dir vielleicht einen Weg zeigen, der eine Ebene höher als Pos() und Copy() ansetzt.

Grüße vom marabu

Robert Marquardt 17. Okt 2005 13:20

Re: HTML-Seite nach einzelnen Worten/Zahlen scannen Kompone
 
Ich habe letztens die HTMLTidy-DLL in ein Programm eingebunden. Diese parst HTML zu einem Baum den man dann traversieren kann.
Zwar ist die Zielrichtung von HTMLTidy (SourceForge Projekt) die Korrektur fehlerhaften HTMLs, aber man kann auch aus dem Baum den Text ausserhalb der Tags ziehen.
Der Vorteil eines solchermassen geparsten HTML-Dokuments ist das man sich auf Teile beschraenken kann wie "innerhalb von Tabellen" usw.

mschaefer 17. Okt 2005 13:59

Re: HTML-Seite nach einzelnen Worten/Zahlen scannen Kompone
 
Hallo Robert, Hallo Marabu,

zunächst mal: Thanks for the Hints. Habe mir auch eine Parser-Komponente mit Baum angesehen, bin aber aktuell an dem Punkt angekommen, dass die Seiten auch veränderliche Teile haben. Werbeeinblendungen mit differierenden Textabsätzen und da komme ich mit dem Abzählen/Ablaufen vom Tags nicht richtig weiter. Versuche morgen ein Komponentengerüst zu bauen und einzustellen. Heute bin ich gerade "aufgabenmäßig" Platt/Kaltgestellt worden (kleine Nachmittagsüberraschung) :gruebel: .

Grüße in die Runde // Martin


Alle Zeitangaben in WEZ +1. Es ist jetzt 10:25 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz