Zitat von
nahpets:
Wenn in einem Link, also zwischen <a href=" und "> ein Umlaut vorkommt, so ist dieser selbstverständlich nicht zu ersetzen, da er ja Teil der
URL ist. Also ist auch hier das Tag von der Umwandlung auszunehmen.
Natürlich müssen die Umlaute ersetzt werden. Das geht aber auch aus der verlinkten
RFC hervor.
Beispiel aus der Wikipedia:
Der Link
http://de.wikipedia.org/wiki/Ä muss im Quellcode als
http://de.wikipedia.org/wiki/%C3%84 kodiert werden.
Auf der Seite
http://de.wikipedia.org/wiki/Deutsches_Alphabet kann man das beim verlinkten Ä auch beobachten. (z. B. im Firefox oder IE7: Rechtsklick auf das Ä -> Eigenschaften)
Näheres findet man auch unter
URL Encoding
Zitat von
nahpets:
Hier das & durch & zu ersetzen wäre dann einfach nur noch falsch.
Auch das stimmt nicht. Mit dem Ampersand
& werden in
HTML-Dokumenten Entities eingeleitet. Mit einem Semikolon
; werden sie abgeschlossen. Werden in einer
URL &-Zeichen verwendet, so müssen sie als
& kodiert werden, da der Parser ansonsten eine beginnende Entität vermutet. Das würde dann zu einem invaliden
HTML-Dokument führen.
Heutzutage noch mit invalidem
HTML zu arbeiten, wäre aber gar nicht gut, da die Browser dann mit hoher Wahrscheinlichkeit im Quirksmode arbeiten und Darstellung und Layout vom Zufall geleitet werden, oder aber zumindest in unterschiedlichen Browsern komplett unterschiedlich interpretiert werden.
LG,
Xong