Europäische Fledermausrufe - Aufzeichnen und Bestimmen

FFT: Spektrum und Sonagramm

Zur Frequenz-Analyse von Lautaufnahmen werden mittels einer Fast Fourier Transformation1. die im Ton enthaltenen Frequenzen ermittelt. Diese können dann entweder ohne zeitliche Information als Spektrum oder mit zeitlicher Information als Sonagramm angezeigt werden. Meist werden diese Funktionen verwendet, ohne zu wissen, was genau berechnet wird. Und ohne zu wissen, welchen Einfluss die verschiedenen Einstellungen dieser Funktionen haben können. Durch ungünstige Parameter können jedoch die Ergebnisse stark verfälscht werden.

Das Verfahren der FFT ermöglicht die spektrale Zerlegung eines Signals und ist eines der gängigen Verfahren zur Frequenzextraktion bei Tonsignalen. Die FFT ist rechenintensiv, aber dank moderner Rechner mittlerweile sehr leicht durchzuführen. Bei dem Verfahren werden - vereinfacht - die Stärke aller im Signal vorhandener Frequenzen ermittelt. Die technischen Details sollen hier weitestgehend unangetastet bleiben, dennoch möchte ich das eine oder andere kurz vorstellen, da ein teils recht starker Einfluss auf die erhaltenen Daten besteht. Alle Rufanalyseprogramme nutzen FFTs, aber nicht immer kann man das als Benutzer direkt erkennen oder wissen. Wenn man aber auf Einstellungen wie Fenster, Fenstergröße, Fensterfunktion oder Überlappung stösst, dann ist es nicht unwahrscheinlich, dass eine FFT berechnet werden wird. Für ein Spektrum, also die Frequenzverteilung, und ein Sonagramm ist eigentlich immer eine FFT verantwortlich.

FFT-Parameter

Es gibt einige Parameter, die bei einer FFT eingestellt werden können. Diese beeinflussen, wie die Berechnungen durchgeführt werden und dadurch die Ergebnisse. Im Folgenden werden einige der Parameter dargestellt, auch in der bcAnalyze-Anleitung2 findet sich übrigens eine ähnliche Übersicht. Davor möchte ich kurz erläutern, wie die FFT funktioniert, damit die Parameter besser verstanden werden:

Bei einer FFT wird über ein Tonstück wählbarer Länge (=Fenstergröße) der Anteil aller enthaltenen Frequenzen ermittelt. Der Frequenzbereich geht von 0 Hz (= Offset des Tonsignals) bis zur halben Samplerate (Nyqist-Theorem3). Wird ein Spektrum berechnet, wird normalerweise ein großes Fenster berechnet, bei Sonagrammen werden viele kleine Fenster aneinandergereiht. Diese können sich auch Überlappen. Ein Fenster kann alle Daten gleich bewerten oder eine Gewichtung der Daten vornehmen (Fenster-Typ).

Fenster-Größe

Die Fenstergröße ist immer eine 2er Potenz, also z.B. 256, 512 oder 1024 Samplewerte. Je größer das Fenster, desto aufwendiger die Berechnung und desto feiner die Abstufung der ermittelten Frequenzen. Sollen Frequenzwerte möglichst fein aufgelöst weden, muss daher ein großes Fenster verwendet werden. Die Frequenzauflösung ergibt sich aus der Fenstergröße und der Samplerate. Die Auflösung wird berechnet wie folgt:

Auflösung [Hz] = (Samplerate[Hz] / 2) / (FFT-Größe/2)

Bei 500 kHz Samplerate und einem 1024 Sample großen FFT Fenster ergibt sich zum Beispiel eine Auflösung von ca. 488 Hz (250000 Hz / 512). Dass bedeutet auch, dass bei der Darstellung der Ergebnisse niemals eine Hz-genaue Frequenz gemessen werden kann, sondern eigentlich ein Bereich entsprechend der Auflösung. Wird ein kleines 256 Sample Fenster verwendet, dann würde die Auflösung bei der oben genannten Samplerate gerade mal 2 kHz betragen. Das bedeutet auch, dass zum Beispiel ein Pipistrellus-Ruf mit Hauptfrequenz 43 kHz auch 42 oder 44 kHz haben könnte und eine Unterscheidung von Zwerg- und Rauhautfledermaus schwieriger wird. Auch auf die zeitliche Auflösung bei Sonagrammen hat die Fenstergröße einen Einfluss. Auflösung [s] = (1/Samplerate) * Fenstergröße Bei 500 kHz Samplerate und 1024 Sample Fenster ergibt sich 2ms als zeitliche Auflösung. Um bei kurzen Signalstücken auch lange Fenster verwenden zu können, werden die Tondaten in der Regel vorne und hinten mit einer entsprechenden Anzahl 0en versehen (zero-padding).

Fenster-Typ

Der Fenster-Typ entscheidet, wie die Eingangsdaten gewichtet werden. Bei einer gleichen Wichtung aller Samplepunkte spricht man auch von einem Rechtecksfenster. Die anderen Fenster wichten in der Regel Sample am Anfang und Ende des Fensters geringer als die zentralen Samplepunkte. Manche Fenster sind besser geeignet, um konstantfrequente Signale zu untersuchen, andere besser für frequenzmodulierte Signale. Es kann durch das Fenster Änderungen im Spektrum geben, da eben manche Teile des Signals weniger gewichtet werden.

FFT-Fenster-Typen

Der Fenstertyp hat auch Einfluss auf die Darstellung im Sonagramm. Durch manche Fenster kommt es zu “verschmierten Rufen” oder die Ruflänge ändert sich scheinbar.

FFT-Fenster-Typen und Auswirkung aufs Sonagramm

Man sollte am besten für Spektren immer ein Rechtecksfenster verwenden, so gehen keine Signalteile verloren. Bei Sonagrammen sind Fenster mit guter zeitlicher und Frequenz-Auflösung zu bevorzugen. Flattop und 7-term Harris sind zum Beispiel solche passenden Fenster.

Überlappung

Dieser Parameter wird in der Regel bei einem Sonagramm angegeben. Er gibt an, wie weit ein Fenster vorangeschoben wird, um den nächsten Abschnitt des Tons zu analysieren. Werden Fenster direkt aneinandergereiht, dann ist der Überlapp 0%. Da sich durch den Überlapp die zeitliche Auflösung verbessert, ist es sinnvoll einen recht hohen Wert zu wählen. Dann werden die Sonagramme jedoch auch aufwendiger zu berechnen und länger. Auflösung [s] = (1/Samplerate) * (Fenstergröße * (1-Überlapp)) Vor allem bei Frequenz-modulierten Rufen ist ein hoher Überlapp wichtig für eine gute Darstellung. Bei Echtzeitaufnahmen (500 kHz Samplerate) liegt die zeitliche FFT-Äuflösung im Bereich von 0,01ms bis 1ms bei gängigen Einstellungen.

Empfehlungen

Am besten erarbeitet man sich die eigenen Einstellungen, mit denen man dann möglichst alle Rufe betrachtet. Nur so kann man dauerhaft Unterschiede zwischen Rufen unterscheiden. Geänderte Einstellungen lassen Rufe schnell auch ganz anders aussehen, so dass die Erkennung schwerig wird. Ich empfehle die die folgenden Einstellungen als Richtwerte.

Spektrum

Als Fenstertyp empfiehlt sich ein Rechtecksfenster möglichst berechnet über die gesamte Breite ohne Mittelung über mehrere kleine FFT-Fenster. Wenn eine Reduzierung der Daten gewünscht ist, dann kann dies auch nach der FFT erfolgen. Nur so stehen auch hich aufgelöste Frequenzspektren zur Analyse zur Verfügung.

Sonagramm

Das Sonagramm soll Rufe möglichst gut abbilden. Daher sollte hierfür ein Fenstertyp gewählt werden, der wenig verschmirrt und ausreichend gut Frequenz und Zeit auflöst. Am besten ist hier ein 7- oder 11-term Harris Fenster. Wahlweise geht auch ein Flattop-Fenster. Eine Fenstergröße von 1024 oder 2048 sowie eine Überlappung von 96 bis 98 Prozent sind für alle Rufe mit Längen unter 10ms und vor allem bei frequenzmodulierten Rufen sehr gut. Für längere Rufe eignet sich ein 1024 Sample Fenster mit 75 bis 96% Überlappung.

  1. Hintergründe zur FFT auf Wikipedia.

  2. Anleitung bcAnalyze 2.0.

  3. Nyquist-Theorem bei der Verarbeitung digitaler Tonsignale: Wikipedia.

- - Kategorien: