Einzelnen Beitrag anzeigen

Robert Marquardt
(Gast)

n/a Beiträge
 
#5

Re: HTML-Seite nach einzelnen Worten/Zahlen scannen Kompone

  Alt 17. Okt 2005, 13:20
Ich habe letztens die HTMLTidy-DLL in ein Programm eingebunden. Diese parst HTML zu einem Baum den man dann traversieren kann.
Zwar ist die Zielrichtung von HTMLTidy (SourceForge Projekt) die Korrektur fehlerhaften HTMLs, aber man kann auch aus dem Baum den Text ausserhalb der Tags ziehen.
Der Vorteil eines solchermassen geparsten HTML-Dokuments ist das man sich auf Teile beschraenken kann wie "innerhalb von Tabellen" usw.
  Mit Zitat antworten Zitat