AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Programmieren allgemein Wiederkehrende Patterns in einem Text finden
Thema durchsuchen
Ansicht
Themen-Optionen

Wiederkehrende Patterns in einem Text finden

Ein Thema von Meflin · begonnen am 26. Jul 2007 · letzter Beitrag vom 26. Jul 2007
Antwort Antwort
Seite 2 von 2     12   
Benutzerbild von Gausi
Gausi

Registriert seit: 17. Jul 2005
880 Beiträge
 
Delphi 11 Alexandria
 
#11

Re: Wiederkehrende Patterns in einem Text finden

  Alt 26. Jul 2007, 11:53
NP-vollständig würde ich nicht behaupten. Mein Ansatz löst auf den ersten Blick das Problem in Zeit O(N^2). Allerdings komprimiere ich nicht den Text, sondern -äh- expandiere(?) ihn. In meinem Baum speichere ich nur einzelne Zeichen, keine Muster. Muster bekomme ich aus Wegen in diesem Baum. Wenn man Muster suchen möchte, die z.B. mindestens dreimal im Text vorkommen, dann muss man die Wege nehmen, die an der Wurzel starten und Kantenwerte von mindestens 2 haben. Also anschaulich "die dicken Äste" in dem Baum. Oder übersehe ich da grade was?

Anschließend nen Multi-Pattern-Matcher drüberlaufen lassen, die iirc eine Zeitkomplexität von O(n*p) haben, wobei p die Gesamtlänge aller Muster ist. (p kann natürlich maximal n^2 werden, aber das dürfte in realen Texten nie passieren.)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:16 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz