![]() |
Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Hallo,
ich habe folgenden Code:
Delphi-Quellcode:
Damit lese ich also den HTML-Code einer URL aus. Jedoch habe ich das Problem, dass bei manchen Webseiten nur z.B. folgendes herauskommt:
var
HTMLCode: TStringList; [...] function DownloadHTML(URL: String): String; begin try Result := IndyHTTP.Get(URL); except Exit; end; Result := StringReplace(Result, #13, #13#10, [rfReplaceAll]); end; Zitat:
Ich habe bisher keine Fehlerlösung gefunden... Hat hier vielleicht jemand eine Idee? Have fun, MCXSC |
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Hallo Marcel,
nicht alle HTML-Seiten werden gleich passend im Windows ANSI Code ausgeliefert (CP1252). Probiere es mal so:
Delphi-Quellcode:
Grüße vom marabu
// ...
Result := Utf8ToAnsi(IndyHTTP.Get(URL)); // ... |
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Zitat:
|
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Muss man hier vor dem Aufruf von Utf8ToAnsi überprüfen, ob es utf8 kodiert ist, oder kann man bedenkenlos alles an die Funktion übergeben ?
|
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Hallo Christian,
es liegt in der Natur der Sache, dass ein AnsiString stets beides enthalten kann. Die Erkennung der UTF-8 Lead-Bytes ist genau die Spezialität der Ansi-Funktionen - und auch Utf8ToAnsi() beherrscht das gut. Freundliche Grüße |
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Wenn sie denn der Webserver ausliefert. Afaik kann der Internet Explorer nicht mit den BOMs umgehen.
|
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Zitat:
|
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Zitat:
|
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Du hast oben zwar eine Stringlist deklariert, aber benutzt keine, zumindest nicht in dem Code den du gepostest hast.
|
Re: Umlaute-Problem mit idHTTP.Get (Indy) => ö und Co.
Liste der Anhänge anzeigen (Anzahl: 1)
[Off-Topic]Thunderbird hat wohl etwas zu viel Automatismus bezüglich übereiliger UTF8-Decodierung eingebaut[/Off-Topic]
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:24 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz