Einzelnen Beitrag anzeigen

Gambit

Registriert seit: 28. Mai 2003
680 Beiträge
 
Delphi 7 Professional
 
#1

Text nach Umlauten parsen, knifflig?

  Alt 8. Apr 2004, 20:59
Moin,

ich habe 2 Datenbanken, eine wo nur Strings hinterlegt sind, die andere wo auch Strings hinterlegt sind allerdings noch andere dazugehörige Informationen.

Nun sind die Umlaute der Strings in der ersten Datenbank normal geschrieben, in der anderen als HTML Code also für "Ä" beispielsweise ä

Das ist allerdings nicht einheitlich der Fall sondern es kann vorkommen, dass manche Umlaute im Klartext stehen andere im HTML Code. Das schlimmste ist aber, dass es auch Mischformen gibt, wie "Cäer kümmerte sich nicht"

Ich möchte aus der ersten Datenbank den String entnehmen, suchen, ob der String in der anderen Datenbank vorhanden ist und die gefundenen Daten in eine neue Datenbank schreiben.

Wenn es keine Mischformen gäbe, würde folgender einfachen Code reichen:
Delphi-Quellcode:
S2:= s;
    If ansiContainsText(s2, 'ä') then
      s2:= ansiReplaceText(s2, 'ä', 'ä');
    If ansiContainsText(s2, 'ü') then
      s2:= ansiReplaceText(s2, 'ü', 'ü');
    If ansiContainsText(s2, 'ö') then
      s2:= ansiReplaceText(s2, 'ö', 'ö');
    If ansiContainsText(s2, 'ß') then
      s2:= ansiReplaceText(s2, 'ß', 'ß');
Wenn ich in der zweiten Datenbank nach s und s2 suchen würde, würden Strings gefunden, die ohne HTML Code vorhanden sind, als auch Strings, wo alle Umlaute durch HTML Code ersetzt sind.

Aber wie finde ich nun die Mischformen??

Gruß

Gambit
  Mit Zitat antworten Zitat