Registriert seit: 26. Jun 2005
131 Beiträge
|
Textstatistik Umsetzung
1. Apr 2007, 19:00
Hallo zusammen,
ich möchte von sehr großen Texten einen Art Wortstatistik erstellen. Dabei soll die Anzahl der einzelnen Wörter festgestellt werden. Bisher habe ich auch eine Idee, wie ich das umsetzen könnte. Ich finde die Ansatz aber selbst nicht so wirklich gut. Daher frage ich Euch, ob Ihr noch eine bessere Idee habt. Bis jetzt würde ich es so machen
1. Alle Steuerzeichen ersetzen, und damit jedes Wort in eine Zeile packen (gibt dafür schon irgendeine Funktion?)
2. Liste sortieren
3. Liste von oben durch gehen und mit den jeweils nächsten Wort vergleichen, wenn Treffer, dann Zähler um eins erhöhen. Treffer löschen!
Vielleicht gibt es je einen Komponente, die für Textanlaysen geeignet ist.
Danke für die Tips.
|