Wie wichtig ist die Preemphase in MFCC?

  • Ich habe eine einfache MFCC-Routine geschrieben, die alle in der Literatur empfohlenen Schritte verwendet, mit Ausnahme der Preemphase. Wie wichtig ist diese Phase? Außerdem schlagen einige Autoren vor, dass die Verwendung von rechteckigen Fenstern anstelle von dreieckigen die MFCC-Leistung nicht beeinträchtigt (solange sich die Fenster überlappen), so dass alle Ideen zu diesem Thema willkommen sind.

    23 March 2012
    Terry Lorber
1 answer
  • Preemphase ist eine Möglichkeit, das schnell abklingende Spektrum der Sprache zu kompensieren. Das Experiment lohnt sich für echte Daten - Sie werden feststellen, dass die DCT-Basis besser geeignet ist, einen Satz dekorrelierter Koeffizienten zu extrahieren, wenn das Spektrum durch den Preemphasis-Filter aufgehellt wurde.

    Diese Begründung gilt nicht wirklich für Musik, bei der das Spektrum langsamer zerfällt. In MIR-Papieren ist es nicht ungewöhnlich, dass MFCC ohne den Preemphasis-Filter berechnet wird. Bei Musik spricht man für die Vorbetonung dafür, dass die Außenohrfilterung sehr grob angenähert wird. Einige Feature-Extraktionsmodule verwenden in der Tat MFCC-ähnliche Features mit einem geeigneten Außenohrfilter (Antwort nach Terhards Formel) anstelle der Vorbetonung. Zum Beispiel sieht es so aus, als würde dies vom Echo Nest Analyzer verwendet.

    23 March 2012
    RodeoClown