Einzelnen Beitrag anzeigen

Delphi.Narium

Registriert seit: 27. Nov 2017
2.538 Beiträge
 
Delphi 7 Professional
 
#4

AW: Daten aus HTML-Code auslesen (RegEx,...)

  Alt Gestern, 11:13
Zuerst die Datei in eine Stringliste einlesen. Dann alle Zeilen von führenden und folgenden Leerzeichen befreien.

Dann die Datei in eine Stream schieben und diesen zeichenweise in einen zweiten Stream schreiben. Dabei vor allen < einen Zeilenumbruch schreiben und hinter jedem > ebenfalls einen Zeilenumbruch schreiben. Alle vorhandenen Zeilenumbrüche werden durch ein Leerzeichen ersetzt.

Das Ergebnis wieder in die Stringliste kopieren.

Dort hast Du dann alle Tags und Texte jeweils in einer eigenen Zeile.

Aus
HTML-Code:
            <tr>
                <td>
                    Diesel
                </td>
                <td><a href="/tankstelle/bft-1696" rel="nofollow">1,529</a></td>
            </tr>
wird dann
HTML-Code:
<tr>
<td>
Diesel
</td>
<td>
<a href="/tankstelle/bft-1696" rel="nofollow">
1,529
</a>
</td>
</tr>
Nun kannst Du am Anfang der Stringliste alle Zeilen bis einschließlich </thead> löschen.
Am Ende der Stringliste löschst Du alle Zeilen bis zum letzten </tr>.

Damit hast Du nun nur noch den Tabelleninhalt in der Stringliste.

Anschließend löschst Du alle Zeilen, die nicht mit einem < beginnen.
Die verbleibenden Zeilen befreist Du von führenden und folgenden Leerzeichen.
Leere Zeilen werden anschließend entfernt.

Übrig bleiben dann
Code:
Diesel
1,529
Super E10
1,359
Super E5
1,564
Lässt sich mit 'ner Reihe von For-Schleifen recht einfach und schnell realisieren.

Geändert von Delphi.Narium (Gestern um 11:25 Uhr)
  Mit Zitat antworten Zitat