Registriert seit: 23. Mai 2003
27 Beiträge
Delphi 3 Professional
|
27. Mai 2003, 17:19
Mhm... das erinnert mich ein wenig an das, was ich zur Zeit (hin und wieder) treib - einen Compiler bosseln.
Zunächstmal kommt es wirklich drauf an, welche Ziele Du Dir setzt, das müßte halt ganz klar abgegrenzt, vielleicht sogar reduziert werden, weil diese Idee schon in Richtung KI geht. Dir schwebt immerhin das Einfügen eines Erklärungstextes vor - das führt nur das Problem mit sich, daß dann das Endprodukt recht beliebig und wirr aussehen könnte, also Linkverweise wären da wohl die bessere Alternative.
Compilerbau hat ne ganze Menge mit Sprachtheorie zu tun und die Beschäftigung mit solcherlei Dingen kann sehr interessant sein. Vielleicht könntest Du Dir was dazu anlesen.
Ohne jetzt ein klares Ziel vor Augen zu haben, würde ich als ersten Schritt zunächstmal die Kurznachricht "tokenizen" wollen (verzeiht mir mein mieses Deutschenglisch :p). Also die kleinsten Sinneinheiten - Sprich Worte herausfiltern. Damit wärst Du dann schonmal die Leerzeichen los und Du kannst Dich dann den Einzelelementen des Satzes widmen.
So - leider, wie Du schon richtig erkannt hast - haben einzelne Worte im jeweiligen Kontext eine grundlegend andere Bedeutung. "UNO" kann genausogut das Kartenspiel sein. Und das bedeutet, daß Du schon eine gewisse Form einer KI brauchst, die den Kontext klar erkennt.
Das ginge in Richtung semantische Analyse und trotz allem bin ich mir noch nicht sicher, wie Du dann zielgerichtet nach dem Einzelbegriff, das erweitert erklärt werden soll, suchen willst, soferns automatisch abläuft. Die Suche nach "UNO" in der Datenbank könnte ja zuerst das Kartenspiel ausspucken. Um das zu vermeiden, mußt Du erkennen, daß die Nachricht eine politische Bedeutung hat. Also könntest Du Kategorien schaffen oder eine Art Assoziationsbaum, der eine gewisse Gewichtung je nach Satzkomponenten bekommt. Die Schlüsselworte "George" "W" "Bush" sprechen schon schwer von einer politischen Bedeutung, also erhöhst Du den entsprechend Politikzähler.
Das bedeutet Vorarbeit und eine Datenbank mit vordefinierten Begriffen, die für dieses Bewertungssystem vonnöten sind. Also bedeutet das wiederum ne ganze Menge Arbeit.
Also wie schon gesagt, ich hab kein Ziel vor Augen, wollte nur meine Gedanken mitteilen.
Find dieses Projekt halt sehr interessant!
|