Text bereinigen: kurze Wörter löschen

**erich.wanker**

Hallo,
eine Frage:

ich hab in einem Textfile einen Text (ziemlicher Buchstaben-Müll..)

Ich ignoriere die ganzen Sonderzeichen wie folgt:
(und schreibe den Text in ein Datenbankfeld..)

markieren

Code:

			for i := 0 to text_aus_file.Count - 1  do

begin

s:=text_aus_file.Strings[i];

neu:='';

for x := 0 to Length(s)-1 do

begin

 if (s[x] in ['0'..'9','a'..'z', 'A'..'Z','ä','ö','ü','ß','Ä','Ö','Ü',' ']) then neu:=neu+s[x];

end;

TEXT.Edit;

TEXT.FieldByName('TEXT').AsString:=TEXT.FieldByName('TEXT').AsString+neu;

TEXT.Post;

end;

im Text kommen sehr viel Müll vor - Rohdaten von einem EXTREMEN Beispiel:

Zitat:

Sie wurde den Kontrahenten,
weiche handlungs- und verfügungfähig sind, zur Kenntnis
gebracht und von denselben in seiner Gegenwart unterzeichnet.
seht EGHiig
W]Hp de age
EZ
gegen
Ir
sr
die
k ß
Angaben
PP
\
& S S
v RSS
$ k eigen (si i tik N n ut sl Win uit n r un de kn Si e W St We t d W s gene an Site
Eingetragen: Band:
gel ee
3 g i : “ .
& Ü S s ® m Hosen e dere nn In en h Wenn ie n se sh ln on {w'a_$‘ +3 RE

Meine Frage:
Wie kann ich nun Wörter (mit und ohne Zahlen) mit 1, 2, und 3 Wort-Länge auch noch löschen ... so kurze Wörter haben keine Relevanz... mich interessieren nur die Wörter und Zahlen ab 4 Stellen Länge

Vielen Dank für Hinweise

LiGrü
Erich

Text bereinigen: kurze Wörter löschen

Text bereinigen: kurze Wörter löschen

Forumregeln