AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Multimedia Delphi Grundsätzliche Funktionsweise von Musikerkennungssoftware
Thema durchsuchen
Ansicht
Themen-Optionen

Grundsätzliche Funktionsweise von Musikerkennungssoftware

Ein Thema von Schneider-Huetter · begonnen am 12. Jun 2005 · letzter Beitrag vom 9. Aug 2006
 
Benutzerbild von negaH
negaH

Registriert seit: 25. Jun 2003
Ort: Thüringen
2.950 Beiträge
 
#22

Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar

  Alt 14. Jun 2005, 12:51
Zitat:
Problematisch sehe ich noch den Einstiegspunkt der "Zeitscheiben". Dieser darf ansich nicht rein zufällig erfolgen um Varianzen durch das clipping (weglaufen der Tonspur und damit verschiebung der Hüllkurve) zu vermeiden. Ist natürlich auch davon abhängig wie lang so eine Zeitscheibe ist. Dafür bietet sich ansich der Takt als Segmentstartindikator (schönes Wort ) an.
Das dürfte sich bei größeren Zeitscheiben, zb. 3 Sekunden, wieder relativieren, eben auch auf grund der Eigenschaften der FFT selber. Desweiteren würde man zwar eine zb. 1024 Spektren FFT anwenden, aber nur sehr markante Einzelbänder dieser Spektren benutzen. Zb. geht man von 22KHz Samples aus, so ergibt das bei 1024 Punkte FFT's pro Frequenzband ca. 21 Hz. Statt nun 1024 "Frequenzspuren" zu benutzen würde man sich auf die Bänder 1000Hz bis 3000Hz als 1 Band festlegen, somit also den menschlichen Sprachbereich selektieren. Dann noch die Spektren in den Bereichen 50Hz-100Hz, 100Hz-1Khz und die oberen Frequenzen 10Khz usw. zusammenfassen. Statt also 16 gleichverteilte Frequenzspektren, erzeugt mit einer 16 Punkte FFT, zu benutzen, werden ganz spezielle Spektren einer 1024 Punkte FFT ausgewählt. Die große Frage dabei ist nur welche Frequenzbereiche am eindeutigsten einen Durchschnittssound markieren.

Die anschließenden DFT's über die so erzeugten Frequenzspuren dürfen natürlich nicht so bearbeitet werden.

Zitat:
Meine Befürchtung ist nur, dass sich die Fingerabdrücke duch das viele normalisieren viel zu sehr ähneln.
Naja, Ähnlichkeit ist ja im Grunde auch ein Ziel der Übung. Nachdem man ähnliche Songs gefunden hat kann man ja nochmals mit höherer Auflösung einen Vergleich starten. In der DB werden ja nicht nur der Fingerabdruck und der Interpret/Name gespeichert sondern auch das Musikstück.

Gruß Hagen
  Mit Zitat antworten Zitat
 


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:28 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz