Einzelnen Beitrag anzeigen

nahpets
(Gast)

n/a Beiträge
 
#12

Re: In HTML-Dateien Umlaute / Sonderzeichen ersetzen

  Alt 3. Nov 2008, 10:38
Hallo,

eine kleine Anmerkung hätt' ich noch:
anstelle von'ä' : AppendString(OUTPUT_FILE, 'ä'); sollte auch'ä' : OUTPUT_FILE.Write('ä',5); funktionieren. Spart Laufzeit für die For-Schleife

Die Anmerkungen von Xong sind nicht ganz von der Hand zu weisen (Der IE kann im Title-Tag nicht in allen Versionen mit "übersetzten" Umlauten umgehen, so dass das Ausklammern von HTML-Tags nicht immer falsch ist.) Wenn in einem Link, also zwischen <a href=" und "> ein Umlaut vorkommt, so ist dieser selbstverständlich nicht zu ersetzen, da er ja Teil der URL ist. Also ist auch hier das Tag von der Umwandlung auszunehmen. Hier das & durch &amp; zu ersetzen wäre dann einfach nur noch falsch.

Habe selbst eine derartige Umwandlungsroutine geschrieben, um ausschließlich an den Text von HTML-Seiten zu kommen, alle Tags mussten entfernt werden und der Rest für die suchkonforme Speicherung in Datenbanken aufbereitet werden. Ganz unsinnig ist eine derartige Umwandlung also nicht. Es kommt darauf an, was man mit dem Ergebnis machen will.
  Mit Zitat antworten Zitat