AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Die Ähnlichkeit eines Strings messen?

Ein Thema von Dragon27 · begonnen am 15. Feb 2009 · letzter Beitrag vom 16. Feb 2009
Antwort Antwort
Seite 2 von 2     12   
Dragon27

Registriert seit: 20. Nov 2003
Ort: Aßling
543 Beiträge
 
Delphi XE6 Enterprise
 
#11

Re: Die Ähnlichkeit eines Strings messen?

  Alt 15. Feb 2009, 21:12
Also danke für Eure Antworten! Ich werde mal versuchen ob ich etwas zusammenzimmern kann was beider hernimmt
Delphi is ......... DELPHI!!
  Mit Zitat antworten Zitat
Namenloser

Registriert seit: 7. Jun 2006
Ort: Karlsruhe
3.724 Beiträge
 
FreePascal / Lazarus
 
#12

Re: Die Ähnlichkeit eines Strings messen?

  Alt 15. Feb 2009, 21:31
Zitat von quendolineDD:
Zitat:
Hinsichtlich des zweiten Kritikpunktes, der nur groben Analyse, hat sich in letzter Zeit das folgende Beispiel etabliert: Gemäß dem „soundex“-Verfahren sind die Begriffe „Britney Spears“ und „bewährten Superzicke“ phonetisch identisch:

Britney => BRTN => B635,
Spears => SPRS => S162,
bewährten => BRTN => B635,
Superzicke => SPRZCK => S16222 => S162.
Ist natürlich ein sehr gutes kritisches Beispiel
Also ich würde an deiner Stelle eher die Levenshtein-Distanz nehmen ...
Wieso, das spricht doch für SoundEx
  Mit Zitat antworten Zitat
Teekeks

Registriert seit: 19. Okt 2008
Ort: Dresden
765 Beiträge
 
FreePascal / Lazarus
 
#13

Re: Die Ähnlichkeit eines Strings messen?

  Alt 15. Feb 2009, 21:36
Und wiedermal siet man das Soundex recht hat
Peter
"Div by zero Error" oder auch: "Es geht auch ohne Signatur!".
  Mit Zitat antworten Zitat
Benutzerbild von KingIR
KingIR

Registriert seit: 19. Feb 2006
81 Beiträge
 
Delphi 2006 Professional
 
#14

Re: Die Ähnlichkeit eines Strings messen?

  Alt 16. Feb 2009, 00:46
Zitat von mkinzler:
Der Thread tut ja in sämtlichen Gehirnwindungen weh.

Google, mit Levenshtein Delphi gefüttert, liefert hingegen ein paar ganz gute Ansätze für eine eigene Implementierung. Zum Beispiel: http://www.koders.com/delphi/fid54DC...spx?s=download (unbekannte Lizenz).
  Mit Zitat antworten Zitat
omata

Registriert seit: 26. Aug 2004
Ort: Nebel auf Amrum
3.154 Beiträge
 
Delphi 7 Enterprise
 
#15

Re: Die Ähnlichkeit eines Strings messen?

  Alt 16. Feb 2009, 01:01
Hier ist auch noch eine andere Variante.
  Mit Zitat antworten Zitat
Benutzerbild von sx2008
sx2008

Registriert seit: 16. Feb 2008
Ort: Baden-Württemberg
2.332 Beiträge
 
Delphi 2007 Professional
 
#16

Re: Die Ähnlichkeit eines Strings messen?

  Alt 16. Feb 2009, 06:22
Also ich finde SoundEx ungeeignet für deutsche Sprache und Eigennamen.
Eigentlich ist der Algorithmus ziemlicher Schrott, denn er produziert jede Menge Fehler:
http://de.wikipedia.org/wiki/Soundex..._dem_Verfahren

Soundex ist untolerant gegenüber Fehler im 1. Buchstaben:
"Fehlerbeschreibung" und "ehlerbeschreibung" sind zwei sehr ähnliche Worte (Tippfehler im 2. Wort);
trotzdem haben sie andere Soudex Codes.
Allein schon die Idee, dass Wörter ähnlich klingen müssen um als gleich bewertet zu werden ist ungeeignet.
Fehler bei der Schreibweise kommen doch viel eher durch Fehler beim Tippen (Buchstabendreher, falsches Zeichen, fehlendes Zeichen) als durch Hörfehler bei der mündlichen Übermittlung zustande.

Ich kann wirklich nur von Soundex abraten und Levensthein empfehlen.
  Mit Zitat antworten Zitat
alzaimar
(Moderator)

Registriert seit: 6. Mai 2005
Ort: Berlin
4.956 Beiträge
 
Delphi 2007 Enterprise
 
#17

Re: Die Ähnlichkeit eines Strings messen?

  Alt 16. Feb 2009, 08:06
Leider vergisst Du bei dener Pauschalkritik den Einsatzbereich von Algorithmen zur Bestimmung der Ähnlichkeit: Sollen Schreibfehler, Tippfehler, Buchstabendreher erkannt, oder vielmehr die Aussprache verglichen werden? Grundsätzlich gebe ich Dir jedoch Recht, denn ich habe bisher auch keinen sinnvollen Einsatz für den Soundex alleine gesehen: In Kombination mit anderen Verfahren ist er jedoch geeignet, die Ähnlichkeit zweier Wörter zu beurteilen: Levenshtein z.B. ignoriert die phonetische Ähnlichkeit völlig: Für ihn ist 'KALT fast gleich KULT' aber 'BALD <> KALT'. Hier ist Soundex besser. Daneben gibt es noch andere Verfahren, die z.B. ein Wort zunächst in ihre Phoneme überführt und dann eine Ähnlichkeitssuche durchführt.

Weitergehende Informationen gibt es z.B. hier
"Wenn ist das Nunstruck git und Slotermeyer? Ja! Beiherhund das Oder die Flipperwaldt gersput!"
(Monty Python "Joke Warefare")
  Mit Zitat antworten Zitat
HeinzJ

Registriert seit: 17. Aug 2007
Ort: Bremen
84 Beiträge
 
Delphi 2007 Architect
 
#18

Re: Die Ähnlichkeit eines Strings messen? - Levenstein Komp.

  Alt 16. Feb 2009, 08:38
Hier eine Levenstein Komponente:

http://www.h-j-luecking.de/wiki/Einf...nstein_Distanz

HeinzJ
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 23:45 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz