Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Sonstige Werkzeuge (https://www.delphipraxis.net/63-sonstige-werkzeuge/)
-   -   Spracherkennung mit cmusphinx 4-1.0 beta 6 (https://www.delphipraxis.net/171814-spracherkennung-mit-cmusphinx-4-1-0-beta-6-a.html)

erich.wanker 26. Nov 2012 16:43

Spracherkennung mit cmusphinx 4-1.0 beta 6
 
Hallo Leute,

spiel jetzt schon eine Zeit lang mit cmusphinx4 rum, schaffe es aber nicht, meine eigene wav-Datei in eine text-Datei umzuwandeln..

Wenn jemand mit cmusphinx erfahrung hat und mir ein bisserl auf die Sprünge helfen könnte wäre das super:
Ich würde gerne via cmd eine *.wav Datei in eine Text Datei umwandlen.
Ich würde dafür gerne das "voxforge-de-0.1" Sprachmodul verwenden.


Vielen Dank für Hinweise

Verwende: WindowsXP, Delphi7, LMD Tools, Reportbuilder, Firebird 2.1, ZeosLib6.6.6, MadComponenten und so weiter ;-)



Bis dato hab ich folgendes gemacht:

Sphinx Version:
http://sourceforge.net/projects/cmus...n.zip/download

Accustic-Modul : http://sourceforge.net/projects/cmus...an%20Voxforge/

hab die Archive entpackt, in sphinx4-1.0beta6-bin\sphinx4-1.0beta6\lib das Programm jsapi.exe ausgeführt ... jsapi.jar erhalten.

Dann via cmd zum testen: java -mx256m -jar Transcriber.jar ausgeführt..
Als Ergeniss: one zero zero zero one ... erhalten

Dann dacht ich mir: suche ich mal nach der 10001-90210-01803.wav Datei und änder die mal um, aber die gibt es gar nicht..

Irgendwie check ich es nicht, was ich da wie und wo ein- und umstellen sollte / kann.

Unter http://cmusphinx.sourceforge.net/sph...tml#decode_wav wäre ein Beispiel, wie man eine wav-Datei in Text umwandelt - aber ich find keinen Ansatzpunkt, das zu verstehen :-(

In der Beschreibung steht: ..The default file, called "10001-90210-01803.wav", contains three utterances, separated ...
..Die Demo macht die richtige ausgabe, aber auf meinem PC befindet sich keine 10001-90210-01803.wav

Sinn und Zweck: ich würde gern eine Wav mit meinem Delphi-Programm aufnehmen - dann abspeichern - dann via LMDStarter einen Script ausführen, der die wav in txt umwandelt - und dann die txt wieder einlesen...bis dato Wunschdenken ;-) ...


Alle Zeitangaben in WEZ +1. Es ist jetzt 00:12 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz