Re: Wörter aus Text extrahieren beschleunigen

  3. Sep 2008, 07:03
Erfahrungsgemäß ist die größte Spaß/Performancegrenze (meistens) sowas wie
MyString := MyString + Character Ersetze das durch:
SetLength (MyString, AMaxLength+1);
iLength := 0;
While Text[i] in aAllowedChars Do begin
  inc (iLength);
  MyString[iLength] := Text[i];
  If (iLength > aMaxLength) and (aMaxLength > 0) Then Break;
Weiterhin solltest Du deine optimalen Min/Max-Längenangaben anpassen: So benötigst Du immer vier Abfragen, statt 2.
if ((AMinLength = 0) or (iLength >= AMinLength)) and ((AMaxLength = 0) or (iLength <= AMaxLength)) then
Am Anfang:
If aMaxLength=0 Then aMaxLength = MaxInt; Und dann
If (iLength>=aMinLength) And (iLength<=aMaxLength) Then aWords.Append(aWord); Auf 'aMinLength=0' musst Du nicht prüfen.

Dann vereinfacht sich die innere Schleife zu:
SetLength (MyString, AMaxLength+1);
iLen := 0;
While (Text[i] in aAllowedChars) And (iLen<=aMaxLength) Do begin
  inc (iLen);
  MyString[iLen] := Text[i];
So ist dann mein Vorschlag:
procedure ExtractWords(const AText: string; AMinLength, AMaxLength: Integer;
   AAllowedChars: SetOfChar; AWords: TStrings);
  i, iLength, TextLength: Integer;
  sWord : string;

  If aMaxLength=0 Then aMaxLength = MaxInt;

    i := 0;
    TextLength := Length(AText);
    while i < TextLength do begin
      if Text[i] in aAllowedChars then begin
        SetLength (MyString, AMaxLength+1);
        iLength := 0;
          inc (iLength);
          MyString[iLength] := Text[i];
        until (iLength > aMaxLength) or (not (Text[i] in aAllowedChars))
        if (iLength >= aMinLength) And (iLength <= aMaxLength) Then
Getippt und nicht getestet. Imho gehts noch schneller durch Verwendung von PChar und dynamischen Arrays statt einer TStringList.
