Einzelnen Beitrag anzeigen

Furtbichler
(Gast)

n/a Beiträge
 
#7

AW: Phonetisch ähnlich klingende Wörter

  Alt 13. Mär 2014, 20:43
Mir fallen da auf Anhieb zwei Ansätze ein:
Ähnlichkeitssuche (string metric)
Levenshtein-Distanz,
Jaccard-Index
Jaro-Winkler
...
und Phonetische Suche
Kölner Phonetik
Metaphone

Soundex ist übrigens für die deutsche Sprache weniger geeignet. Warum dieses Verfahren immer wieder erwähnt wird, ist mir ein Rätsel. Ich habe noch nie sinnvolle Ergebnisse mit Soundex bekommen. Mein Favorit bei der Ähnlichkeitssuche ist Jaro-Winkler (allerdings eine tokenbasierte Variante), bei den phonetischen ist Metaphone-2 (V3 ist kostenpflichtig) sehr gut, da der Algorithmus nicht nur für die deutsche Sprache geeignet ist.

Probleme gibt es fast immer bei kurzen Wörtern, denn ist 'Wut' und 'Gut' ähnlich? immerhin stimmen nur nur 66% der Buchstaben überein.

Geändert von Furtbichler (13. Mär 2014 um 20:47 Uhr)
  Mit Zitat antworten Zitat