Einzelnen Beitrag anzeigen

marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#6

Re: XmlDocument - Umlaute

  Alt 26. Feb 2006, 12:54
Hi folks.

Auch wenn das Problem von Walter scheinbar zu seiner eigenen Zufriedenheit gelöst ist - ein paar Anmerkungen hätte ich noch dazu.

Zitat von Garby:
ich lese einen XML-Stream direkt aus dem Internet.
Wäre es eine XML stream, dann käme er mit einer passenden DTD für die verwendeten entities. Soll aber lediglich well formed HTML als XML verarbeitet werden, dann hilft es im client nachzubessern und die benötigte DTD zu injizieren - beispielsweise über einen stream adapter - die Wahl der Methode hängt vom verwendeten XML Parser ab. Herauskommen muss das hier:

XML-Code:
<?xml version="1.0"?>
<!DOCTYPE html SYSTEM "html.dtd">
<html>
  <description>Fl&auml;chenbrand</description>
</html>
Es muss dann die Datei html.dtd mit folgendem Inhalt hinterlegt werden:

XML-Code:
<!ENTITY % isolat1 PUBLIC
  'ISO 8879:1986//ENTITIES Added Latin 1//EN//XML'
  'iso-lat1.ent' >
%isolat1;
Stört euch nicht an der Indirektion über eine Parameter-Entity - der Inhalt der Datei iso-lat1.ent kann in diesem stark vereinfachten Beispiel auch direkt in html.dtd abgelegt werden:

XML-Code:
<!ENTITY auml   "&#x00E4;">
<!ENTITY Auml   "&#x00C4;">
<!ENTITY ouml   "&#x00F6;">
<!ENTITY Ouml   "&#x00D6;">
<!ENTITY szlig   "&#x00DF;">
<!ENTITY uuml   "&#x00FC;">
<!ENTITY Uuml   "&#x00DC;">
Bei dieser Vorgehensweise werden die HTML character entities vom XML Parser automatisch korrekt umgesetzt.

Grüße vom marabu
  Mit Zitat antworten Zitat