AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

equivalente Zeichen finden?

Ein Thema von himitsu · begonnen am 23. Sep 2010 · letzter Beitrag vom 23. Sep 2010
Antwort Antwort
Benutzerbild von himitsu
himitsu
Online

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.063 Beiträge
 
Delphi 12 Athens
 
#1

equivalente Zeichen finden?

  Alt 23. Sep 2010, 15:18
Mahlzeit,

gibt es eigentlich irgendeine API, welche mir alle "ähnliche" Zeichen liefert?

Wenn ich z.B. ein "e" hab, dann möchte ich eine Liste von Zeichen bekommen, welche z.B. é, è und ê enthalten.


Ich werde auch gleich mal ausprobieren, ob man z.B. sowas wie MSDN-Library durchsuchenCompareString dazu bringen kann, solche Zeichen als "gleich" zu erkennen, allerdings müßte ich dann ja quasi alle 65-tausend Zeichen durchprobieren.
Neuste Erkenntnis:
Seit Pos einen dritten Parameter hat,
wird PoSex im Delphi viel seltener praktiziert.
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.858 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: equivalente Zeichen finden?

  Alt 23. Sep 2010, 15:21
Bei Strings wäre der Levensthein-Algo passend
Markus Kinzler
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu
Online

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.063 Beiträge
 
Delphi 12 Athens
 
#3

AW: equivalente Zeichen finden?

  Alt 23. Sep 2010, 17:33
Levenstein passt garnicht
Zitat:
minimale Anzahl von Einfüge-, Lösch- und Ersetz-Operationen
Beim "e" wäre der Levenstein-Wert für "é" genauso groß, wie beim "x".
Und zwar immer genau eine Ersetzung., außer beim "e" selber.

Wenn, dann wohl eher SoundEx, wobei das leider auch keine passenden Ergebnisse liefert, da dieses mein "D" wäre gleich "T".
Neuste Erkenntnis:
Seit Pos einen dritten Parameter hat,
wird PoSex im Delphi viel seltener praktiziert.

Geändert von himitsu (23. Sep 2010 um 17:37 Uhr)
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.686 Beiträge
 
Delphi 2007 Enterprise
 
#4

AW: equivalente Zeichen finden?

  Alt 23. Sep 2010, 17:45
Phonetisch, oder optisch ähnlich? Es ginge sogar noch quasi semantisch ähnlich...
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu
Online

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.063 Beiträge
 
Delphi 12 Athens
 
#5

AW: equivalente Zeichen finden?

  Alt 23. Sep 2010, 18:04
Ich hab erstmal einen Q&D-Weg über WideCharToMultiByte+MultiByteToWideChar gefunden.

Also es geht um die sogenannte "equivalence class" [=...=] der POSIX-RegEx.

'#[[=e=]]#i' würde eEéÉèÈ... uws. finden.
Eine genaue Beschreibung was hierbei "gleich" ist, hab ich noch nicht entdeckt.
Aber ich vermute mal sehr stark, es geht um Zeichen, welche den selben "Stamm" besitzen.
"é" = "e" + "´"

Über WideCharToMultiByte würde ich jetzt erstmal die Basis bestimmen (durch Übersetzen nach ASCII) und dann alle Zeichen mit der selben Basis suchen.
Neuste Erkenntnis:
Seit Pos einen dritten Parameter hat,
wird PoSex im Delphi viel seltener praktiziert.
  Mit Zitat antworten Zitat
shmia

Registriert seit: 2. Mär 2004
5.508 Beiträge
 
Delphi 5 Professional
 
#6

AW: equivalente Zeichen finden?

  Alt 23. Sep 2010, 18:13
Wenn, dann wohl eher SoundEx
SoundEx ist ein völlig kranker Algorithmus der ausserdem nur für die englische Sprache zugeschnitten ist.
SoundEx vergleicht nicht zwei Strings auf Ähnlichkeit, sondern erstellt für jedes Wort einen Hashwert mit 4 Zeichen.
Das führt dann zu gleichen Hashwerten für völlig unterschiedliche Wörter.
Die Amis hatten damit grosse Probleme bei der Suche nach Terroristen
Andreas
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#7

AW: equivalente Zeichen finden?

  Alt 23. Sep 2010, 18:24
Was verstehst Du unter ähnlich?
bei eêé usw. liegt man mit ähnlich wohl ganz gut, da es sich hierbei "nur" um ein frisiertes e handelt. Aber wie sieht es z.B. mit Ungarisch aus?
Oder im Türkischen sind das i und das i ohne Punkt optisch zwar ähnlich aber genauso ähnlich wie D und T.
Und wenn wir uns schon auf das Glatteis der Umlaute und Sonderzeichen begeben, was ist mit Eszett und Beta? Oder ist oe das gleiche wie ö ? (Für Rheinländer und Niederländer auf keinen Fall)
Ohne einen sprachlichen und kulturellen Hintergrund können diese Annahmen gewaltig in die Irre führen.

Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:12 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz