Hallo Jürgen,
wenn du per
DOM auf den
HTML-Code zugreifst, dann erübrigt sich die Behandlung von character entities für dich - der Parser kennt sie alle und du bekommst sie garnicht mehr zu Gesicht. Ansonsten ist das Extrahieren aus der
Referenzliste sicher kein großes Problem für dich.
Grüße vom marabu