From d124e8465ed1d7b9e2482760de979fbd0359f438 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Matt=C3=A9o=20Delabre?= <spam@delab.re>
Date: Sun, 20 Dec 2020 01:36:12 +0100
Subject: [PATCH] Ajout stft-decode

---
 README.md      |  6 +++---
 fft-decode.py  |  4 ++--
 stft-decode.py | 33 +++++++++++++++++++++++++++++++++
 3 files changed, 38 insertions(+), 5 deletions(-)
 create mode 100644 stft-decode.py

diff --git a/README.md b/README.md
index 21ad7ff..4be2d12 100644
--- a/README.md
+++ b/README.md
@@ -13,10 +13,10 @@ Une première approche consiste à étudier le spectre du signal en utilisant un
 
 ![Spectre du son produit par le synthétiseur](fig/synth-fft.png)
 
-Ce spectre permet de lire les différentes fréquences qui composent le son étudié.
-On y distingue, parmi les fréquences les plus représentées, un *sol₂* (192 Hz), un *do₂* (131 Hz), un *la₂* (220 Hz) et un *la₃* (440 Hz).
+Sur ce spectre peuvent être distinguées les douze notes qui composent le morceau :
+_do₂, sol₂, la₂, do₃, mi₃, fa₃, sol₃, la₃, si₃, do₄, re₄, mi₄._
 Une information cruciale manque cependant, celle de l’évolution du signal dans le temps.
-Une façon de l’obtenir consiste à découper le signal en courtes fenêtres de temps et d’appliquer la transformation de Fourier sur les morceaux obtenus : c’est [la transformée de Fourier à court terme](https://fr.wikipedia.org/wiki/Transform%C3%A9e_de_Fourier_%C3%A0_court_terme).
+Une façon de l’obtenir consiste à découper le signal en courtes fenêtres de temps et d’appliquer la transformation de Fourier sur les segments obtenus : c’est [la transformée de Fourier à court terme](https://fr.wikipedia.org/wiki/Transform%C3%A9e_de_Fourier_%C3%A0_court_terme).
 On obtient ainsi un [sonagramme](https://fr.wikipedia.org/wiki/Sonagramme) qui montre l’évolution des fréquences du signal dans le temps (produit par [ce script Python](stft-graph.py)).
 
 ![Évolution dans le temps du spectre du son produit par le synthétiseur](fig/synth-stft.png)
diff --git a/fft-decode.py b/fft-decode.py
index b8908c1..81ca093 100644
--- a/fft-decode.py
+++ b/fft-decode.py
@@ -14,10 +14,10 @@ source_file = sys.argv[1]
 
 # Calcul du FFT
 signal = soundbox.load_signal(source_file)
-freq_scale = soundbox.samp_rate / len(signal)
-
 vecs = np.fft.fft(signal)[:soundbox.samp_rate // 2]
+
 values = np.absolute(vecs) / np.max(np.absolute(vecs))
+freq_scale = soundbox.samp_rate / len(signal)
 freq = np.arange(len(values))
 
 # Calcul de la fenêtre des fréquences intéressantes
diff --git a/stft-decode.py b/stft-decode.py
new file mode 100644
index 0000000..72e604b
--- /dev/null
+++ b/stft-decode.py
@@ -0,0 +1,33 @@
+import soundbox
+import numpy as np
+import scipy.signal as sig
+import sys
+
+if len(sys.argv) != 2:
+    print(f"""Utilisation: {sys.argv[0]} [source]
+
+Détermine les notes jouées dans le fichier [source] en utilisant
+la transformation de Fourier à court terme.""")
+    sys.exit(1)
+
+source_file = sys.argv[1]
+
+# Calcul du STFT
+signal = soundbox.load_signal(source_file)
+freq, time, vecs = sig.stft(signal, soundbox.samp_rate, nperseg=soundbox.samp_rate * 0.25)
+
+values = np.absolute(vecs) / np.max(np.absolute(vecs))
+time_scale = len(signal) / soundbox.samp_rate / values.shape[1]
+
+# Calcul de la fenêtre des fréquences intéressantes
+high_enough = np.where(values.max(axis=1) >= 0.01)
+left = high_enough[0][0]
+right = high_enough[0][-1]
+
+freq = freq[left:right]
+values = values[left:right]
+
+# Recherche des pics
+for i in range(values.shape[1]):
+    peaks, _ = sig.find_peaks(values[:, i], height=0.1, distance=10)
+    print(f'{i * time_scale:.2f} s', list(map(soundbox.freq_note, freq[peaks])))