- ¿Cómo se lee un espectrograma MEL??
- ¿Qué es la escala MEL en audio??
- ¿Qué es Mel Power Spectrogram??
- ¿Por qué es importante la escala MEL??
¿Cómo se lee un espectrograma MEL??
Un espectrograma MEL logarítmicamente hace frecuencias por encima de cierto umbral (la frecuencia de la esquina). Por ejemplo, en el espectrograma a escala lineal, el espacio vertical entre 1,000 y 2,000Hz es la mitad del espacio vertical entre 2,000Hz y 4,000Hz.
¿Qué es la escala MEL en audio??
La escala MEL es una escala de lanzamientos juzgados por los oyentes para ser igual en distancia de otro. El punto de referencia entre esta escala y la medición de frecuencia normal se define al igualar un tono de 1000 Hz, a 40 dB por encima del umbral del oyente, con un tono de 1000 mels.
¿Qué es Mel Power Spectrogram??
El espectrograma MEL es el resultado de la siguiente tubería: separado a Windows: muestree la entrada con ventanas de tamaño n_fft = 2048, haciendo lúpulo de tamaño hop_length = 512 cada vez para probar la siguiente ventana. Calcule FFT (transformación rápida de Fourier) para que cada ventana se transforme del dominio del tiempo al dominio de frecuencia.
¿Por qué es importante la escala MEL??
La escala MEL
Somos mejores para detectar diferencias en frecuencias más bajas que las frecuencias más altas. Por ejemplo, podemos notar fácilmente la diferencia entre 500 y 1000 Hz, pero difícilmente podremos notar una diferencia entre 10,000 y 10,500 Hz, a pesar de que la distancia entre los dos pares es la misma.