![]() |
Sprachsteuerung
Hallo, ich arbeite mit der neusten Version von Lazarus da ich kein Delphi habe, ich möchte mein Programm sprachsteuern, z.B sage ich:"Hallo" und der Pc (Lazarus) antwortet mir:"Hallo User" oder ähnliches. Wie ich eine den Pc zum sprechen bringe habe ich schon herausgefunden.
Delphi-Quellcode:
Das Problem ist wie der Pc(Lazarus) meine Stimme erkennt oder das Wort erkennt und mir dann was zurücksagt.
procedure TForm1.Button1Click(Sender: TObject);
begin SpVoice := CreateOleObject('SAPI.SpVoice'); SavedCW := Get8087CW; try Set8087CW(SavedCW or $4); SpVoice.Speak('Hallo',0); finally Set8087CW(SavedCW); end; Ich will das ganze nicht per Microsoft Speech oder so machen sondern wirklich mit Pascal(Lazarus). Danke im vorraus:) Da ich noch nicht gerade der Pro in Pascal bin (ich hab es jetzt seid einem halben Jahr in der Schule, bin 9.Klasse) wäre es nett wenn ihr das ganze ausführlich erklärt, da ich es ansonsten vielleicht nicht verstehe. Danke :-D |
AW: Sprachsteuerung
Moin...
Schau mal hier... Schnipp... Sollte der Link bei dir nicht funktionieren, gebe einfach "Spracherkennung" in die dp_reference ein. :thumb: |
AW: Sprachsteuerung
Leider funktioniert der Link nicht und was meinst du mit dp_reference? Ich bin noch nicht lang hier und in der Spracherkennung gibt es einiges in der Suche. Sry
|
AW: Sprachsteuerung
Moin...:P
Zitat:
dp_reference: ![]() dp_reference + Spracherkennung: ![]() ...und dann klickst du auf die Delphipraxis und halleluja 52 Themen mit Spracherkennung. :thumb: Nachtrag: Zitat:
|
AW: Sprachsteuerung
Ja aber die meisten schreiben es sei zu schwer für einen einzelnen und man bräuchte jahre und ein team dafür. Der einzige der des richtig hingekriegt hat war obama aber das ist sehr kompliziert, so dass ich es nicht verstehen und ich denke dass ich von delphi ein bisschen ahnung hab. Problem: In der Schule lernen wir nur wie man mathe formeln in delphi macht aber dass ist meiner Meinung nach zu einfach. Das schwerste was ich bis jetzt dort hatte (es war eig. leicht) war es Pac Man zu programmieren und das war für fortgeschrittene laut lehrer.:cry:
|
AW: Sprachsteuerung
Langweiliger Unterricht ist natürlich doof.
Was möchtest Du denn machen? "OK, google"...? Ich glaube, das kannst Du vergessen. Der Lerneffekt dürfte sich vermutlich auch da sein, wenn Du fertige API nutzt. Wenn Matheformeln einfach sind, wie sieht es dann mit einem Formel Parser aus? Dem kannst Du dann nachher Formeln diktieren. |
AW: Sprachsteuerung
Ich hab Info erst ein halbes ja und weiß nicht was Parser sind (bin 9.Klasse) aber wenn du es mir erklärst könnte ich es mal probieren.
Aber nochmal zu meiner Frage: Wäre es möglich einen Sound aufzunehmen und Lazarus überprüft dann ob der Sound im Micro dem aufgenommenen Sound zu z.B 90% gleicht, wenn dies der Fall ist führt es einen Befehl aus. Code z.B If //der aufgenommene Sound = Sound.a then //der Befehl Das ist nur eine grobe Vorstellung. Könnte mir jemand vielleicht so einen code sagen oder erklären |
AW: Sprachsteuerung
Ich will Dir die Idee nicht vermiesen, aber das ist wirklich nicht einfach.
Vielleicht kannst Du Dir ganz einfach eine kleine Vorstellung davon machen, was auf Dich zukommt. Nimm Dir den Audiorekorder von Windows und sprich etwas rein, "Hallo". Dann spiel es wieder ab und schau es Dir an, also die Visualisierung der Frequenzen. Dann mach das nochmal, 1, 2, 3 Aufnahmen und vergleiche die Aufzeichnung. Du wirst sicher einige Dinge dabei feststellen. unterschiedliche Länge der Aufnahme unterschiedliche Lautstärke Störgeräusche Und schon an der Visualisierung sieht man einiges davon, ohne das man es sich anhören muss. Wenn Du also die Lautstärke vereinheitlicht hast, die Pausen rausgeschnitten, die Störgeräusche gefiltert hast, dann kannst Du Dich daran machen, die Audiodaten zu vergleichen. Dann geht der Spaß erst los. Ein Handy macht es idR auch nicht selbst, sondern schickt diese Daten an google/apple, dort rechnen Server das durch. Die Mechanismen dahinter kenne ich nicht ansatzweise. Ich vermute(!) es ist einerseits ein Rechenzeitproblem und andererseits die Methodik, die vermutlich zu einem guten Teil auf statistischen Verfahren beruht. Es ist noch nicht so viele Jahre her, da musste Spracherkennung am PC noch trainiert werden, also der Sprecher trainierte das Erkennungsprogramm. |
AW: Sprachsteuerung
Du findest hier eine Möglichkeit so etwas über die Windows API zu lösen. Schon das ist nicht so einfach...
![]() Wenn du die Quelltexte verstehst und anwenden kannst, die in dem Artikel erklärt werden, bist du schon echt gut. Das ganze selbst zu machen, ist im Vergleich so ähnlich als wüsstest du wie du eine Mikrowelle anwendest, möchtest sie jetzt aber selbst ohne Vorlage bauen. ;-) |
AW: Sprachsteuerung
Ich habe selbst grade vor zwei Wochen zwei Schülerpraktikanten gehabt. Darum kann ich gewissermaßen aus Erfahrung sprechen. Die Lehrer an unseren Schulen vermitteln anscheinend nicht wirklich ein Gefühl für die "Kleinfuddeligkeit" der Softwareentwicklung. Dann nehmen sich die Schüler Ideen vor, die sie aus ihrem Alltag kennen. Bei "meinen" Praktikanten war es ein 3D-Spiel, in deinem Fall eine Sprachsteuerung.
Beide Beispiele sind für Schüler nicht unbedingt das richtige Ziel, denn die Arbeit ist mühsam, der erforderliche Zeitaufwand sprengt wahrscheinlich den Rahmen der Freizeit die man als Schüler hat (man muss ja auch noch andere Hausaufgaben machen), Erfolgserlebnisse kommen sehr spät und auf dem Weg dahin ist das Risiko groß, dass man enttäuscht hinschmeißt. Mein Rat: Versuche nicht, Dinge nachzubauen die es anderswo schon gibt. Denn woran du vermutlich noch gar nicht gedacht hast ist, dass hinter Sprachsteuerungen wie Siri und Cortana große Firmen mit sehr vielen, gut ausgebildeten Programmierern stecken. Schau dich lieber mal in deiner persönlichen Umgebung um, ob es da irgendwo ein Problem gibt dass man mit Software lösen könnte, die es noch nicht gibt. Meistens sind das spezifische Problemstellungen aus dem Alltag. Wenn du da eine Lösung präsentierst haben deine Freunde und deine Lehrer auch einen konkreten Bezug zur Praxis und der "Wow-Effekt" ist größer. |
AW: Sprachsteuerung
Danke für den Rat von allen, aber ich werde es trotzdem versuchen. Ich schau mir mal die links an die geschickt wurden. Mein Ziel ist es nicht Cortana, oder Siri nach zu bauen. Ich hoffe ich kling jetzt nicht wie ein idiot der sich irgendwas in den Kopf gesetzt hat und denkt er kann alles.
|
AW: Sprachsteuerung
Zitat:
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:01 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz