Registriert seit: 25. Jun 2003
Ort: Thüringen
2.950 Beiträge
|
Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar
15. Jun 2005, 17:33
Hm, sehe ich nicht so. Wenn man eh schon mit FFT's arbeitet dann ist es ein leichtes mit den zusätzlichen DFT's über die erzeugten FFT Schnitte eine 3D Spektren-Analyse als Fingerabdruck zu benutzen.
Ich weis zwar nicht ob diese Methode in der Musikerkennung benutzt wird, ich weis aber mit Sicherheit das die Forscher der NASA exakt so den Kosmos abhorchen und auf dieses Art und Weise zB. die verschiedenen "Sounds" der unterschiedlichen Galaxien vergleichen.
Entscheidend ist doch das man die zeitliche Abhängigkeit verschiedener Melodien, Stimmen und Instrumente der Sounds "normalisieren" muß, sprich vergleichbar machen muß. Das würde bei der 3D FFT nur durch die letzten DFT's über die erzeugten zeitlichen Frequenzschnitte erfolgen. Es wäre dann eben "fast" egal ob man über den gleichen Sound nur teilweise oder vollständig den Fingerabdruck erzeugt hat.
Wählt man aber willkürlich einen 3 Sekunden Abschnitt eines Sounds als Fingerabdruck aus und vergleicht diesen mit den Durchschnittswerten der gesampelten Sounds so meine ich das das ja zwangsläufig zu Fehlerkennungen führen muß. Meiner Meinung nach vergleicht man dann nämlich zwei unterschiedliche Dinge miteinander. (Hagen eher skeptisch ist)
Gruß Hagen
|