AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Ähnliche strings finden (wie z.B. google Suche)

Ein Thema von user69 · begonnen am 14. Jan 2025 · letzter Beitrag vom 14. Jan 2025
Antwort Antwort
Seite 1 von 2  1 2      
user69

Registriert seit: 11. Dez 2004
115 Beiträge
 
#1

Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 06:05
Hallo,

Vielleicht kannmir da ja irgendwer weiterhelfen….

Gibt es eine Weg oder eine Komponente, wo ich ähnliche strings finden kann?
Also allgmein umz.B. Schreibfehler beseitigen bzw ähnliche schreibweisen zu finden (nicht per Rechtschribung).
  Mit Zitat antworten Zitat
Benutzerbild von Jasocul
Jasocul

Registriert seit: 22. Sep 2004
Ort: Delmenhorst
1.361 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 06:15
Meinst du etwas wie https://docwiki.embarcadero.com/Libr...rUtils.Soundex oder https://www.gausi.de/approxstrutils-en.html?
Peter
  Mit Zitat antworten Zitat
Benutzerbild von TigerLilly
TigerLilly
Online

Registriert seit: 24. Mai 2017
Ort: Wien, Österreich
1.214 Beiträge
 
Delphi 12 Athens
 
#3

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 08:30
Suche mal nach Levenshtein-Distanzwerte und dann lies das hier
https://xprofan.net/intl/de/quelltex...r-algorithmus/

Viuelleicht hilft das?
Certfied Delphi Developer (2025)
  Mit Zitat antworten Zitat
Benutzerbild von joachimd
joachimd

Registriert seit: 17. Feb 2005
Ort: Weitingen
684 Beiträge
 
Delphi 12 Athens
 
#4

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 09:04
Levenshtein und soundex sind nicht ganz so gut für deutsch. Kälner Phonetik bringt dich hier weiter.
Joachim Dürr
Joachim Dürr Softwareengineering
http://www.jd-engineering.de
  Mit Zitat antworten Zitat
Benutzerbild von Gausi
Gausi

Registriert seit: 17. Jul 2005
891 Beiträge
 
Delphi 11 Alexandria
 
#5

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 09:19
Warum sollte Levenshtein nicht gut sein für die deutsche Sprache? Das Verfahren ist doch komplett unabhängig von der Sprache, und zählt einfach die minmale Anzahl von Ersetzungen/Einfügen/Entfernen-Operationen auf Zeichenebene. Ob ich da deutsche oder englische Wörter oder ein Stück DNA-Code reinschmeiße, ist völlig egal.

Wenn man also ähnliche Strings finden möchte, ist das unabhängig von der Sprache gut geeignet. Für ähnlich klingende Worte (Meier, Mayer etc.) dann tatsächlich nicht unbedingt, und dafür sind dann sprachabhängige Algorithmen sinnvoll. Die Frage ist dann aber, inwiefern diese lautbasierten Verfahren Buchstabendreher erkennen können, oder wie diese mit anderen Zeichen (Klammern, Satzzeichen, ...) umgehen. Kommt halt auf den Anwendungsfall an.

Für die Titelsuche in meinem mp3-Player fahre ich mit Levenshtein (das ist ja in meinen oben verlinkten ApproxStrUtils implementiert) ganz gut - und da habe ich ja auch Fälle wie "Pink" und "P!nk" und ähnliche Scherze.

Edit: @TigerLilly: danke für den Link. Die Ergänzung mit "Verdreher als eine Operation zählen" muss ich mir mal genauer anschauen. Das scheint mir eine sinnvolle Ergänzung zu sein.
The angels have the phone box.

Geändert von Gausi (14. Jan 2025 um 09:27 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von joachimd
joachimd

Registriert seit: 17. Feb 2005
Ort: Weitingen
684 Beiträge
 
Delphi 12 Athens
 
#6

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 09:29
Warum sollte Levenshtein nicht gut sein für die deutsche Sprache?
Mit Levenshtein bildest Du nur die Anzahl der Ersetzungen ab, nicht unbedingt ähnlich klingende Worte. Dafür gibt es ja soundex - das aber nur im englischen richtig funktioniert. Oder eben die Kölner Phonetik, welche speziell für die deutsche Sprache entwickelt wurde.

Edit: Beispiel Maier und Meyr haben eine Distanz von 3, bei Kölner Phonetik sind beide identisch
Joachim Dürr
Joachim Dürr Softwareengineering
http://www.jd-engineering.de

Geändert von joachimd (14. Jan 2025 um 09:35 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.209 Beiträge
 
Delphi 12 Athens
 
#7

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 09:46
Warum sollte Levenshtein nicht gut sein für die deutsche Sprache?
Jupp, bei Levenstein wäre es praktisch egal, aber bei Soundex ....

Wenn man also ähnliche Strings finden möchte, ist das unabhängig von der Sprache gut geeignet. Für ähnlich klingende Worte (Meier, Mayer etc.) dann tatsächlich nicht unbedingt, und dafür sind dann sprachabhängige Algorithmen sinnvoll. Die Frage ist dann aber, inwiefern diese lautbasierten Verfahren Buchstabendreher erkennen können, oder wie diese mit anderen Zeichen (Klammern, Satzzeichen, ...) umgehen. Kommt halt auf den Anwendungsfall an.
z.B. 'ne KI/AI oder ein Embedding nutzen.
$2B or not $2B

Geändert von himitsu (14. Jan 2025 um 09:52 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Gausi
Gausi

Registriert seit: 17. Jul 2005
891 Beiträge
 
Delphi 11 Alexandria
 
#8

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 09:46
Das stimmt schon, aber dann ist die eigentliche Aussage ja, dass Levenshtein nicht gut geeignet ist für Sprache.

Levenshtein und SoundEx (und verwandte Verfahren) sind halt völlig verschiedene Ansätze - einmal reine Betrachtung der Zeichenketten, und dann die (sprachabhängige) Umsetzung dieser Zeichenketten in akkustische Signale. Was sinnvoller ist, hängt vom Anwendungsfall ab.

Nebenbei, semi-OT: Was macht eigentlich Soundex bei englischen Inkonsistenzen wie "tough" und "though"? Oder anders: Sollen diese beiden Worte als ähnlich gelten (sehr ähnliche Zeichenketten), oder als grundverschieden (völlig andere Aussprache)?
The angels have the phone box.
  Mit Zitat antworten Zitat
Benutzerbild von joachimd
joachimd

Registriert seit: 17. Feb 2005
Ort: Weitingen
684 Beiträge
 
Delphi 12 Athens
 
#9

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 09:52
Was macht eigentlich Soundex bei englischen Inkonsistenzen wie "tough" und "though"?
dasselbe T200 https://de.toolpage.org/tool/soundex
Joachim Dürr
Joachim Dürr Softwareengineering
http://www.jd-engineering.de
  Mit Zitat antworten Zitat
Frickler

Registriert seit: 6. Mär 2007
Ort: Osnabrück
602 Beiträge
 
Delphi XE6 Enterprise
 
#10

AW: Ähnliche strings finden (wie z.B. google Suche)

  Alt 14. Jan 2025, 10:29
Soundex ist für Englisch. Für deutsche Texte gibts die "Kölner Phonetik" (siehe Anhang; aus dem Delphi-Treff).
Angehängte Dateien
Dateityp: txt KoelnerPhonetik.txt (2,8 KB, 21x aufgerufen)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 08:36 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz