From d124e8465ed1d7b9e2482760de979fbd0359f438 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Matt=C3=A9o=20Delabre?= Date: Sun, 20 Dec 2020 01:36:12 +0100 Subject: [PATCH] Ajout stft-decode --- README.md | 6 +++--- fft-decode.py | 4 ++-- stft-decode.py | 33 +++++++++++++++++++++++++++++++++ 3 files changed, 38 insertions(+), 5 deletions(-) create mode 100644 stft-decode.py diff --git a/README.md b/README.md index 21ad7ff..4be2d12 100644 --- a/README.md +++ b/README.md @@ -13,10 +13,10 @@ Une première approche consiste à étudier le spectre du signal en utilisant un ![Spectre du son produit par le synthétiseur](fig/synth-fft.png) -Ce spectre permet de lire les différentes fréquences qui composent le son étudié. -On y distingue, parmi les fréquences les plus représentées, un *sol₂* (192 Hz), un *do₂* (131 Hz), un *la₂* (220 Hz) et un *la₃* (440 Hz). +Sur ce spectre peuvent être distinguées les douze notes qui composent le morceau : +_do₂, sol₂, la₂, do₃, mi₃, fa₃, sol₃, la₃, si₃, do₄, re₄, mi₄._ Une information cruciale manque cependant, celle de l’évolution du signal dans le temps. -Une façon de l’obtenir consiste à découper le signal en courtes fenêtres de temps et d’appliquer la transformation de Fourier sur les morceaux obtenus : c’est [la transformée de Fourier à court terme](https://fr.wikipedia.org/wiki/Transform%C3%A9e_de_Fourier_%C3%A0_court_terme). +Une façon de l’obtenir consiste à découper le signal en courtes fenêtres de temps et d’appliquer la transformation de Fourier sur les segments obtenus : c’est [la transformée de Fourier à court terme](https://fr.wikipedia.org/wiki/Transform%C3%A9e_de_Fourier_%C3%A0_court_terme). On obtient ainsi un [sonagramme](https://fr.wikipedia.org/wiki/Sonagramme) qui montre l’évolution des fréquences du signal dans le temps (produit par [ce script Python](stft-graph.py)). ![Évolution dans le temps du spectre du son produit par le synthétiseur](fig/synth-stft.png) diff --git a/fft-decode.py b/fft-decode.py index b8908c1..81ca093 100644 --- a/fft-decode.py +++ b/fft-decode.py @@ -14,10 +14,10 @@ source_file = sys.argv[1] # Calcul du FFT signal = soundbox.load_signal(source_file) -freq_scale = soundbox.samp_rate / len(signal) - vecs = np.fft.fft(signal)[:soundbox.samp_rate // 2] + values = np.absolute(vecs) / np.max(np.absolute(vecs)) +freq_scale = soundbox.samp_rate / len(signal) freq = np.arange(len(values)) # Calcul de la fenêtre des fréquences intéressantes diff --git a/stft-decode.py b/stft-decode.py new file mode 100644 index 0000000..72e604b --- /dev/null +++ b/stft-decode.py @@ -0,0 +1,33 @@ +import soundbox +import numpy as np +import scipy.signal as sig +import sys + +if len(sys.argv) != 2: + print(f"""Utilisation: {sys.argv[0]} [source] + +Détermine les notes jouées dans le fichier [source] en utilisant +la transformation de Fourier à court terme.""") + sys.exit(1) + +source_file = sys.argv[1] + +# Calcul du STFT +signal = soundbox.load_signal(source_file) +freq, time, vecs = sig.stft(signal, soundbox.samp_rate, nperseg=soundbox.samp_rate * 0.25) + +values = np.absolute(vecs) / np.max(np.absolute(vecs)) +time_scale = len(signal) / soundbox.samp_rate / values.shape[1] + +# Calcul de la fenêtre des fréquences intéressantes +high_enough = np.where(values.max(axis=1) >= 0.01) +left = high_enough[0][0] +right = high_enough[0][-1] + +freq = freq[left:right] +values = values[left:right] + +# Recherche des pics +for i in range(values.shape[1]): + peaks, _ = sig.find_peaks(values[:, i], height=0.1, distance=10) + print(f'{i * time_scale:.2f} s', list(map(soundbox.freq_note, freq[peaks])))