Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Netzwerke (https://www.delphipraxis.net/14-netzwerke/)
-   -   Delphi Entinitäten in Links in HTML Seiten umwandeln (https://www.delphipraxis.net/15731-entinitaeten-links-html-seiten-umwandeln.html)

Luckie 3. Feb 2004 13:41


Entinitäten in Links in HTML Seiten umwandeln
 
Also in URL's sind Sonderzeichen wie ">" erlaubt. Dies führt jedoch zu Problemen, wenn sie als Links im Quellcode einer HTML Seite stehen, da zum Beispiel ">" einen Tag schließt. Man löst dieses Problem, in dem man nicht ">" schreibt, sondern die Entinität: ">". Die Encodierung übernimmt dann der Browser, damit die Seite gefunden wird. Er wandelt die Entinität also wieder in das entsprechende Zeichen um.

Mein Problem: Ich habe eine HTML Seite deren Links ich extrahier. Diese Links enthalten solche Entinitäten. Folglich sind diese Links für mich unbrauchbar. Ich suche jetzt nach einer Möglichkeit den Link, den ich aus dem Quelltext der Seite extrahiert habe, so umzuformen, dass er wieder vom Browsewr verstanden wird. Gibt es eine Funktion, API oder ist eine Unit bekannt, die das erledigt? Ich würde ungerne alle bekannten Entinitäten per StringReplace ersetzten.

chris 3. Feb 2004 13:53

Re: Entinitäten in Links in HTML Seiten umwandeln
 
huhu,

http://philo.de/xml/entity/

hih

Luckie 3. Feb 2004 13:59

Re: Entinitäten in Links in HTML Seiten umwandeln
 
Genau sowas habe ich gesucht. Du bist spitze. Nur steht das unter der GPL. Leider nicht braucbar für mich. Ich bin selber schon auf der Suche mit Google.

Habe nun sowas gefunden: http://www.scalabium.com/faq/dct0126.htm . Aber das ist so nicht brauchbar, der wandelt mir alle Sonderzeichen in %xx um.

chris 3. Feb 2004 21:26

Re: Entinitäten in Links in HTML Seiten umwandeln
 
hi,

ich hatte das mal vor langer zeit gesehen und eben nochmal danach gesucht:

http://groups.google.de/groups?q=del...ics.tld&rnum=1

denke das sollte dir helfen

Luckie 3. Feb 2004 21:32

Re: Entinitäten in Links in HTML Seiten umwandeln
 
Du bist ein Schatz. :thumb: :thumb: :thumb: :thumb: :thumb: :thumb:

Das tut es, wie es aussieht.


Alle Zeitangaben in WEZ +1. Es ist jetzt 20:46 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz