DFT mit geometrisch beabstandeten Behältern?

  • Die traditionelle diskrete Fourier-Transformation (DFT) und ihr Verwandter, die FFT, produzieren Behälter, die gleichmäßig voneinander beabstandet sind. Mit anderen Worten, Sie erhalten so etwas wie die ersten 10 Hertz im ersten Bin, 10,1 bis 20 im zweiten usw. usw. Ich brauche jedoch etwas anderes. Ich möchte, dass der Frequenzbereich, der von jedem Bin abgedeckt wird, geometrisch zunimmt. Angenommen, ich wähle einen Multiplikator von 1,5. Dann haben wir 0 bis 10 im ersten Bin, ich möchte 11 bis 25 im zweiten Bin, 26 bis 48 im dritten usw. Kann man den DFT-Algorithmus so modifizieren, dass er sich auf diese Weise verhält?

    27 March 2012
    EmreBrannon
2 answers
  • So zitiere ich meine Dissertation:

    Eine Sammlung von Transformationen erhält die Namenskonstante Q und ähnelt der Fourier-Transformation .

    Die Berechnung der diskreten Fourier-Transformation kann sehr effizient sein, wenn Sie die schnelle Fourier-Transformation verwenden. Wir stellen jedoch fest, dass die Energie eines Signals über das Spektrum in gleichmäßig große Frequenzbereiche unterteilt wird. Während dies in vielen Fällen nützlich ist, stellen wir fest, dass diese gleichmäßige Verteilung nicht optimal ist. Ein wichtiges Beispiel für einen solchen Fall ist die Analyse der Musikfrequenzen. In der westlichen Musik sind die Frequenzen , aus denen sich die musikalischen Skalen zusammensetzen, geometrisch beabstandet. Wir sehen also, dass die Karte zwischen den Frequenzbereichen der diskreten Fourier-Transformation und den Frequenzen der musikalischen Skalen unzureichend ist in dem Gefühl, dass die Bereiche schlecht passen. Die konstante Q-Transformation behebt dieses Problem.

    Das Ziel der Konstanten Q ist die Erzeugung eines Satzes von logarithmisch beabstandeten Frequenzbereichen, in denen die Breite des Frequenzbereichs ein Produkt des vorherigen ist. Als Ergebnis können wir eine identische Anzahl von Bins pro Musiknote über das hörbare Spektrum erzeugen, wodurch ein konstanter Genauigkeitsgrad für jede Musiknote beibehalten wird. Die Frequenzfächer werden in Richtung der höheren Frequenzen breiter und in Richtung der niedrigeren Frequenzen schmaler. Diese Spreizung in der Genauigkeit der Frequenzerkennung ahmt die Art und Weise nach, in der das menschliche Gehörsystem auf Frequenzen reagiert.

    Außerdem macht die enge Übereinstimmung von Noten in westlichen Skalen die Konstante-Q für die Erkennung von Noten besonders nützlich. Identifizieren eines - Musiknotenwerts anstelle eines expliziten Frequenzwerts. Außerdem vereinfacht die Konstante Q den Prozess der Timbre-Analyse. Die Frequenzen einer von einem Instrument gespielten Musiknote sind häufig harmonisch sich beziehen

    27 March 2012
    PhononDeepak kumar Jha
  • Es gibt signifikante mathematische Annahmen in der DFT (FFT). Das wichtigste in diesem Fall ist, dass Sie eine abgeschnittene unendliche Zeitsinustransformation durchführen. Die zweite ist, dass angenommen wird, dass die abgeschnittenen Zeit- und abgeschnittenen Frequenzsignale modulo umwickelt sind (kreisförmig). Die in einer normalen FFT beabstandeten Bins bilden nur aufgrund dieser Annahmen (und des geraden Abstands zwischen den Rechensensoren) einen orthonormalen Satz Zeit & lt; - & gt; Frequenzpaare sind daher perfekt umkehrbar.

    Die Konstante-Q-Transformation wird nicht so gut abgeschnitten. Daher führt keine praktische Implementierung zu einer perfekten ortho-normalen Paarung. Der Kern ist ein unendlich langes exponentiell abklingendes Sinus und kann daher nicht den oben angegebenen zirkulären Vorteil haben. Wenn Sie nicht abschneiden, bilden sie eine orthonormale Menge.

    Die Wavelet-Transformationen sind in der Regel in Zweierpotenzen angeordnet, was bei feinkörnigen Frequenzen nicht sehr nützlich ist Schätzung.

    Der Vorschlag, eine Standard-Sinus-DFT ungleichmäßig zu beabstanden, wird Informationen in dem weit beabstandeten Bereich vermissen, während Informationen in dem dicht beabstandeten Bereich dupliziert werden. Wenn nicht für jede Frequenz eine andere Apodisationsfunktion verwendet wird ... sehr teuer.

    Eine praktische Lösung besteht darin, ein halbspektrum- & gt; -Dimimate-by-2-Verfahren durchzuführen Oktav-basierte Unterabschnitte, um einige Minimax-Schätzfehler pro Oktave zu erfüllen. Das Anteils-Spektrum-Dezimalzahl-für-Verhältnis kann auf ein beliebiges Verhältnis eingestellt werden, um jegliche Granularitätsanforderung zu erreichen. Immer noch ziemlich rechenintensiv.

    21 March 2017
    catraeus