den kranken Härtetest mußte ich grad aufgeben
hab mal versucht Seiten der
DP zu parsen
aber bei sovielen Fehlern ... allerdings nicht im Parser ... unmöglich
OK, daß ich die Seitenquelltexte erstmal per Hand (mit Notepad
) in UTF-8 umwandeln und das eine Javascript in einen Kommentar einschließen mußte (da dort ein < drin vorkam) war ja zu verkraften, aber die vielen Syntaxfehler hier
von der PN-Inbox: schließendes span zuviel
Code:
Markierungen aufheben</a></span>
[b]</span>[/b]
und die Startseite ... tssss, wie kann man ein <a> nicht abschließen?
Code:
<td align="center" class="cc41">
<a href="http://www.delphi-tage.de" title="Delphi-Tage 2009" target="_blank">[img]./images/dt2009/dt09logo150px2.gif[/img]
</td>
und dann ging es imer so weiter...
zum Glück sind in Webbrowsern sehr fehlerresistente Parser drin