Hallo
DP!
Erstes Problem:
Habe schon seit Längerem mal die Idee eine Spracherkennung zu basteln.
Soweit ja löblich, aber ich bräuchte verwertbare Daten, zB Lautstärke&Frequenz, und das Ganze möglichst als Live-Mikrofon-Stream.
Also dass ich quasi direkt mit einer Art Variablen/Funktion arbeiten kann:
Delphi-Quellcode:
//Ein Passender Datentyp:
type
TSoundRec:record
Freq,
Volume:integer;
end;
//Das soll den wirklich AKTUELLEN Zustand am Mikrofon liefern:
function CurrentSound:TSoundRec;
//Testprogramm:
begin
while(CurrentSound.Volume<=cSCHWELLE)
do Application.ProcessMessages;
Windows.Beep;
end;
So dass ich dann die Daten über ein lineares neuronales Netz weiterverarbeiten kann...
Also bräuchte ich dafür nur die Möglichkeit, auf den aktuellen Zustand zuzugreifen zu können.
Habe schon Bass.dll und mciSendString gehört, mci ist
imho aber nicht dafür geeignet, bis ich eines Besseren belehrt werde, mit der Bass habe ich noch nie gearbeitet.
Zweites Problem:
Sprachsynthese, oder: Wie kann ich dynamisch Audiodateien generieren (ohne alle Ressourcen zu verbrauchen ist ein höheres Level
)
Also, hoffe mal dass wer was weiß, vielleicht hat unser 0v3rki113r ja was
Gruß vom LDer!
[edit]Titel geändert - nun passender[/edit]