Thema: FreePascal Sprachsteuerung

Einzelnen Beitrag anzeigen

jobo

Registriert seit: 29. Nov 2010
3.072 Beiträge
 
Delphi 2010 Enterprise
 
#8

AW: Sprachsteuerung

  Alt 13. Feb 2016, 23:44
Ich will Dir die Idee nicht vermiesen, aber das ist wirklich nicht einfach.
Vielleicht kannst Du Dir ganz einfach eine kleine Vorstellung davon machen, was auf Dich zukommt.
Nimm Dir den Audiorekorder von Windows und sprich etwas rein, "Hallo". Dann spiel es wieder ab und schau es Dir an, also die Visualisierung der Frequenzen.
Dann mach das nochmal, 1, 2, 3 Aufnahmen und vergleiche die Aufzeichnung.
Du wirst sicher einige Dinge dabei feststellen.
unterschiedliche Länge der Aufnahme
unterschiedliche Lautstärke
Störgeräusche
Und schon an der Visualisierung sieht man einiges davon, ohne das man es sich anhören muss.
Wenn Du also die Lautstärke vereinheitlicht hast, die Pausen rausgeschnitten, die Störgeräusche gefiltert hast, dann kannst Du Dich daran machen, die Audiodaten zu vergleichen. Dann geht der Spaß erst los.

Ein Handy macht es idR auch nicht selbst, sondern schickt diese Daten an google/apple, dort rechnen Server das durch. Die Mechanismen dahinter kenne ich nicht ansatzweise. Ich vermute(!) es ist einerseits ein Rechenzeitproblem und andererseits die Methodik, die vermutlich zu einem guten Teil auf statistischen Verfahren beruht.
Es ist noch nicht so viele Jahre her, da musste Spracherkennung am PC noch trainiert werden, also der Sprecher trainierte das Erkennungsprogramm.
Gruß, Jo
  Mit Zitat antworten Zitat