![]() |
Tags aus einem Text erstellen
Hallo,
ich denke schon seit längerem über folgendes nach: Angenommen, ich habe hier einen Text, der ziemlich lang ist. Gespeichert wird dieser in einer Firebird-DB. Nun möchte ich dem Benutzer die Möglichkeit geben, sehr effizient und detailliert zu suchen. Der Hintergrund dafür ist, dass in dieser DB sehr sehr sehr viele Texte vom Benutzer gespeichert werden. Eine normale Volltextsuche könnte hier zu ungenau sein - das ist meine Befürchtung. Deshalb wollte ich vom Programm beim Speichern des Textes automatisch Tags generieren lassen, die dann bei einer Suche durchsucht werden. Nur ist jetzt die Frage - Ist meine Befürchtung (bezgl. der Ungenauigkeit) berechtigt und wenn ja, wie gehe ich die Tag-Erstellung an? Ich kann ja später mal sagen, wie ich die Tags erstellen würde. Danke im Voraus |
Re: Tags aus einem Text erstellen
Aus eigener Erfahrung mit einem Web-Projekt (auf dessen Namen ich hier nicht näher eingehen möchte *g*) kann ich Dir sagen, dass Du auf jeden Fall eine Liste an sog. "Stop-Words" benötigen wirst, die nicht als Tags auftreten sollen. Damit kannst Du "alle" allgemeinen, häufigen Begriffe herausfiltern, die als Tag keinen Wert darstellen würden.
Grundsätzlich habe ich jedoch mit sog. "Auto-Taggern" gemischte Erfahrungen gemacht. //edit: Du könntest vielleicht den Spieß herumdrehen - und eine Menge an Tags vorgehen, die Du dann den Texten zuordnest. |
Re: Tags aus einem Text erstellen
Vielleicht hilft auch was Fertiges:
![]() ![]() |
Re: Tags aus einem Text erstellen
Danke für die Links.
Ihr ratet also auch von der normalen Volltextsuche als alleinige Suchmöglichkeit ab, oder? |
Re: Tags aus einem Text erstellen
Wenn es was kosten darf gibt es da noch "Rubion"
![]() Da gibt es u.a. auch die Stopworte und vieles mehr. |
Re: Tags aus einem Text erstellen
Hm. Mal sehen wie's weitergeht. Ein paar Links habe ich erstmal - dafür bedanke ich mich auch, aber ich denke ich versuche sowas selbst zu implementieren.
Muss noch sehen, auf welche Kriterien ich hier achte (Wortlänge / Vorkommnisse etc..) Vielleicht fällt euch dazu was ein. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 11:29 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz