Einzelnen Beitrag anzeigen

omata

Registriert seit: 26. Aug 2004
Ort: Nebel auf Amrum
3.154 Beiträge
 
Delphi 7 Enterprise
 
#8

Re: Spracherkennung (Einzelworterkennung)

  Alt 30. Sep 2007, 15:35
Hallo,
Zitat von Go2EITS:
... Aber spannend wird es, wenn ich dem Programm z. B. sage: "Runterfahren" und das Programm fährt mir den Computer runter. Ich meine damit, dass, wenn ein Wort erkannt wird, eine definierte Aktion ausgeführt wird.
Das ist zwar eine Gute Idee, aber ich wollte hier nicht Microsoft Speech nachbauen.

Zitat von Relicted:
... jetzt noch ne komponente zum einsatz in anderen programmen und ich spring im kreis )
Zugegeben, schöne Idee. Aber so einfach ist das dann auch wieder nicht.

Zitat von Hador:
...Die erkennung ist noch nicht ganz so toll. Ich habe bei mir mal Sieben und Acht aufgenommen, und vorallem bei der Sieben hatte er erhebliche Probleme.
Die Erkennungrate hängt sehr stark von den Referenzmustern ab. Ich hatte auch schon Soundkarten (nur Laptops) bei denen so schlechte Signale von der Soundkarte kamen, dass damit keine guten Referenzmuster erstellt werden konnten. Die Signale werden zwar normalisiert, dies führt aber bei sehr leisen Amplituden zu verrauschten Signalen. In der Doku ist ja ein Bild von einer aufgenommenen Sieben zu sehen. Sieht sie bei dir auch so kräftig und satt aus?
Sieben sollte eigentlich immer sehr gut zu erkennen sein. Um die Trefferquote noch weiter zu erhöhen können auch mehrere Referenzmuster für ein Symbol aufgenommen werden.
Die Refenrenzmustern sollte man auf jeden Fall optimieren, falls eins nicht so gut geht -> löschen und neu aufnehmen. Deutlich sprechen und wie oben erwähnt, das Signal sollte nicht zu leise sein.
Spracherkennung ist hochkompliziert und immer garantiert nicht fehlerfrei. Trotzdem bin ich begeistert von der Erkennunggenauigkeit des Systems, weil ich mich mit mehreren Techniken beschätigt habe (Neuronale Netze, Dynamic Time Warping, LPC, Cepstrum, reine FFT, Spektrum). Und als ich das erstemal dieses Konzept getestet hatte, bin ich fast vom Stuhl gerutscht, weil die Erkennungrate bei 100% lag. Sie liegt in Wirklichheit bei <100% aber eben auch bei >95% und das will schon etwas heißen!

Zitat von Hador:
... Habe gerade gemerkt, dass der erste Prozess noch lief, hatte sich scheinbar beim beenden aufgehangen. Der fehler beim erneuten startet kam dann von der DB, auf die du 2x zugreifen willst. Dieser kommt auch, wenn du das Prgm. ganz normal 2x gleichzeitig startest.
Ups, sowas baue ich eigentlich in jedes Programm ein. Hier hab ich es irgendwie übersehen.

Zitat von RWarnecke:
  • Auswahl des Audiogerätes
  • Eine einfachere Bedienbarkeit, finde ich ziemlich umständlich
Wieso werden zwei Fenster geöffnet, wenn ich unter Optionen-->Einstellungen auswähle ?
Das mit den Soundkarten ist ebenfalls ein guter Hinweis, den Gedanken hatte ich auch schon mal kurz. Allerdings stand der nicht so hoch auf der Wunschliste, die restliche Funktion war mir da wichtiger.
Das mit den zwei Fenstern verstehe ich nicht so ganz. Es gibt ein Hauptfenster und ein Einstellungsfenster.


Vielen dank für eure Meinungen.
Bei der Entwicklung stand im Vordergrund das überhaupt ein einigermaßen funktionierendes Produkt zu stande kommt.
Es kann also durchaus sein, dass es noch Verbesserungen geben kann (gibt es die nicht immer), deshalb danke ich euch für die Hinweise. Allerdings sind in dieses Projekt bis jetzt >200 Stunden reingeflossen und ich muss ehrlich zugeben, ich kann es nicht mehr sehen. Deshalb wird es erstmal keine Änderungen geben.
Ich wollte es euch mal vorstellen, weil ich das Thema nach wie vor hoch interessant finde und ich mal zeigen wollte das es durchaus möglich ist soetwas zu realisieren.
Vielleicht finde ich irgendwann nochmal die Muße eure Wünsche mit einzubauen.

Gruss
Thorsten
  Mit Zitat antworten Zitat