AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

HTTP.Get/Post - Umlaute anzeigen

Ein Thema von TERWI · begonnen am 12. Nov 2019 · letzter Beitrag vom 17. Nov 2019
Antwort Antwort
Seite 3 von 3     123   
Incocnito

Registriert seit: 28. Nov 2016
223 Beiträge
 
#21

AW: HTTP.Get/Post - Umlaute anzeigen

  Alt 14. Nov 2019, 08:09
Falls es dort auch um den Programminhalt geht, wären weitere "Sonderzeichen" nicht auszuschließen.
Du solltest wenigstens prüfen, ob der französische Zeichensatz (é, è, á, â, oder was es dort gibt)
auch mit drin ist bei deiner Konvertierung. Gerade europäische Titel werden gerne mal übernommen.
Auch wenn mir (dafür schau ich zu wenig TV) kein Beispiel einfällt. Ich denke auch gerade an
Dokumentationen über berühmte Personen, da gibt es sicherlich genug mit "Nicht-Deutschen-Zeichen".
Ich würde beim Sender Arte anfangen, da das ein französisch-deutscher Sender ist.
Der ist sicher ein gutes Testfeld.

MfG Incocnito
  Mit Zitat antworten Zitat
Redeemer

Registriert seit: 19. Jan 2009
Ort: Kirchlinteln (LK Verden)
1.051 Beiträge
 
Delphi 2009 Professional
 
#22

AW: HTTP.Get/Post - Umlaute anzeigen

  Alt 14. Nov 2019, 21:14
Ich befürchte ein Fehler ist, dass es nur für \u0000 bis \u00FF funktioniert.
Wenn ich raten soll fehlt dir wenigstens \u0100 bis \uFFFF ... und wenn ich mich recht erinnere
hießen die Dinger "Multibyte-Zeichensätze", also könnte auch "\uFF1234" möglich sein, oder!?
Nein, gibt es nicht. Der Zeichensatz von JavaScript (intern und von \u-Escapes) ist UTF-16, der von Windows ist UTF-16 und der von WideString ist auch UTF-16. Ist zwar ein MBCS, interessiert aber nicht, da Quell- und Zielzeichensatz identisch sind. Da es anders als in HTML kein Abschlusszeichen gibt, muss die Länge der Sequenz von vornherein klar sein. Nach \u kommen immer vier Zeichen. C kennt \U mit acht Zeichen, JavaScript kennt das nicht: In Firefox gibt '\U00010400' keine sinnvolle Ausgabe, '\uD801\uDC00' hingegen schon. Somit ist es unmöglich, Zeichen als UCS-4BE (aka UTF-32BE) auszudrücken.

Der Thread ist doch eigentlich durch:
- Dem TE wurde ans Herz gelegt, eine richtige Bibliothek zu verwenden.
- Ich habe einen funktionierenden und korrekten Algorithmus gepostet.
Da muss man jetzt doch nicht weiter mit Halbwissen irritieren.
Janni
2005 PE, 2009 PA, XE2 PA
  Mit Zitat antworten Zitat
Benutzerbild von TERWI
TERWI

Registriert seit: 29. Mär 2008
Ort: D-49626
381 Beiträge
 
Delphi 11 Alexandria
 
#23

AW: HTTP.Get/Post - Umlaute anzeigen

  Alt 17. Nov 2019, 13:12
@Incocnito
Du hast recht - mir ist aufgefallen, das auch etliche andere Zeichen kommen.
Z.B. diese hier:
Zitat:
\u00c9 -> É
\u00b0 -> °
\u0141 -> Ł
\u017e -> ž
\u00e9 -> é
\u2013 -> –
\u00df -> ß
\u00dc -> Ü
\u00fc -> ü
\u00e4 -> ä
\u00df -> ß
\u00f6 -> ö
Ich habe meine kleine Routine mal etwas universeller gemacht.
Nimmt und gibt nun einen String.
Ist kein Sonderzeichen drin, kommt der Text unverändert zurück.
Evtl. vorhandene '\u....' werden entsprechend ersetzt.
Delphi-Quellcode:
function DecodeJString(text : string) : string;
var
  p, val : word;
begin
  result := ''; // !
  p := Pos('\u', text); // 1. Sonderzeichen suchen
  while (p > 0) do // Sonderzeichen vorhanden ?
  begin
    val := hextoint(text[p + 2] + text[p + 3] + text[p + 4] + text[p + 5]); // Wert ermitteln
    result := result + copy(text, 1, p - 1) + widechar(val); // 1. Teil-String + Sonderzeichen
    Delete(text, 1, p + 5); // zu 'Rest-String' löschen
    p := Pos('\u', text); // noch mehr Sonderzeichen vorhanden ?
  end;
  result := result + text; // (Rest-) String hinzufügen
end;
Viel einfacher & kürzer gehts wahrscheinlich nicht ...

Geändert von TERWI (17. Nov 2019 um 13:15 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 3 von 3     123   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:12 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz