- ¿Cuántos coeficientes MFCC debo usar??
- ¿Cuál es la salida de MFCC??
- ¿Qué es la longitud del salto en MFCC??
¿Cuántos coeficientes MFCC debo usar??
En la práctica, los primeros coeficientes de 8–13 MFCC se utilizan para representar la forma del espectro. Sin embargo, algunas aplicaciones requieren más coeficientes de orden superior para capturar información de tono y tono. Por ejemplo, en el reconocimiento de voz chino hasta 20 coeficientes cepstrales pueden ser beneficiosos [130].
¿Cuál es la salida de MFCC??
La salida después de aplicar MFCC es una matriz que tiene vectores de características extraídos de todos los marcos. En esta matriz de salida, las filas representan los números de cuadro correspondientes y las columnas representan coeficientes de vectores de características correspondientes [1-4]. Finalmente, esta matriz de salida se utiliza para el proceso de clasificación.
¿Qué es la longitud del salto en MFCC??
MFCC tiene dos argumentos (que en realidad pasan al STFT subyacente). win_length es el número de muestras incluidas en cada marco de tiempo; El valor predeterminado es 2048, o ~ 93 ms a 22 kHz SR. Hop_length es el número de muestras entre ventanas sucesivas; Su valor predeterminado es 512, o los 23 ms que calculó.