AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein Phonetisch ähnlich klingende Wörter
Thema durchsuchen
Ansicht
Themen-Optionen

Phonetisch ähnlich klingende Wörter

Ein Thema von Popov · begonnen am 13. Mär 2014 · letzter Beitrag vom 27. Mär 2014
Antwort Antwort
Furtbichler
(Gast)

n/a Beiträge
 
#1

AW: Phonetisch ähnlich klingende Wörter

  Alt 13. Mär 2014, 19:43
Mir fallen da auf Anhieb zwei Ansätze ein:
Ähnlichkeitssuche (string metric)
Levenshtein-Distanz,
Jaccard-Index
Jaro-Winkler
...
und Phonetische Suche
Kölner Phonetik
Metaphone

Soundex ist übrigens für die deutsche Sprache weniger geeignet. Warum dieses Verfahren immer wieder erwähnt wird, ist mir ein Rätsel. Ich habe noch nie sinnvolle Ergebnisse mit Soundex bekommen. Mein Favorit bei der Ähnlichkeitssuche ist Jaro-Winkler (allerdings eine tokenbasierte Variante), bei den phonetischen ist Metaphone-2 (V3 ist kostenpflichtig) sehr gut, da der Algorithmus nicht nur für die deutsche Sprache geeignet ist.

Probleme gibt es fast immer bei kurzen Wörtern, denn ist 'Wut' und 'Gut' ähnlich? immerhin stimmen nur nur 66% der Buchstaben überein.

Geändert von Furtbichler (13. Mär 2014 um 19:47 Uhr)
  Mit Zitat antworten Zitat
anro78

Registriert seit: 24. Okt 2005
25 Beiträge
 
#2

AW: Phonetisch ähnlich klingende Wörter

  Alt 14. Mär 2014, 13:54
Ich benutze die Kölner Phonetik für die Ähnlichkeitssuche. Anschließend wende ich die Damerau-Levenshtein-Distanz auf die Suchergebnisse an, in dem ich mit dem Suchbegriff vergleiche, um ein Ranking nach Relevanz zu erreichen. Klappt ganz gut.

Mir war bei der Auswahl der Algorithmen wichtig, dass keine phonetisch ähnlich klingenden Begriffe fälschlicherweise ausgeschlossen werden, weshalb ich auf den Einsatz eines zu selektiven Algorithmus wie Phonet verzichtet habe.
  Mit Zitat antworten Zitat
Popov
(Gast)

n/a Beiträge
 
#3

AW: Phonetisch ähnlich klingende Wörter

  Alt 27. Mär 2014, 15:31
Bedingt durch einen aktuellen Beitrag habe ich mir die StrUtils Unit genauer angeguckt und paar Funktionen zu SoundEx darin entdeckt. Gut dass ich sich das entdeckt habe, da ich kurz davor war es selbst zu programmieren (zumindest habe ich schon Material zusammengesucht). Da ich das nur für Namen brauche, reicht es.

Falls einer auch danach sucht...
Delphi-Quellcode:
uses
  StrUtils;

procedure TForm1.Button1Click(Sender: TObject);
const
  Vergleich: array[Boolean] of String = ('nicht ähnlich', 'ähnlich');
var
  s1, s2: String;
begin
  s1 := 'Maier';
  s2 := 'Müller';
  ShowMessage(Format('%s und %s sind %s', [s1, s2, Vergleich[SoundExSimilar(s1, s2)]]));

  s1 := 'Maier';
  s2 := 'Mayer';
  ShowMessage(Format('%s und %s sind %s', [s1, s2, Vergleich[SoundExSimilar(s1, s2)]]));

  s1 := 'Maier';
  s2 := 'Meyer';
  ShowMessage(Format('%s und %s sind %s', [s1, s2, Vergleich[SoundExSimilar(s1, s2)]]));

  s1 := 'Karl-Heinz';
  s2 := 'Karlheiz';
  ShowMessage(Format('%s und %s sind %s', [s1, s2, Vergleich[SoundExSimilar(s1, s2)]]));

  //aber auch...
  s1 := 'Britney Spears';
  s2 := 'Britney Superzicke';
  ShowMessage(Format('%s und %s sind %s', [s1, s2, Vergleich[SoundExSimilar(s1, s2)]]));
end;
  Mit Zitat antworten Zitat
Furtbichler
(Gast)

n/a Beiträge
 
#4

AW: Phonetisch ähnlich klingende Wörter

  Alt 27. Mär 2014, 16:27
Und was ist mit 'Halmackenreuther' und 'Zalmackenreuther' (Hupsa, nur den ersten Buchstaben vertippselt)
  Mit Zitat antworten Zitat
Popov
(Gast)

n/a Beiträge
 
#5

AW: Phonetisch ähnlich klingende Wörter

  Alt 27. Mär 2014, 16:47
Naja, bitte nicht missverstehen, SoundEx scheint alt zu sein und natürlich gibt es inzwischen genauere Algorithmen, aber darum geht es weniger, bzw. wer es genauer braucht, der kann etwas genaueres nehmen, aber das SoundEx ist kostenlos bei, und es hat seine Treffer. Und wer 'Zalmackenreuther' statt 'Halmackenreuther' schreibt, nun ja...
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:47 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz