- ¿Qué es DCT en MFCC??
- ¿Cómo se explica MFCC??
- ¿Cuál es la salida de la extracción de características MFCC??
- ¿Por qué usamos transformación de coseno discreta??
¿Qué es DCT en MFCC??
DCT es el último paso del proceso principal de extracción de características MFCC. El concepto básico de DCT es correlacionar el valor del espectro MEL para producir una buena representación de la propiedad Spectral Local. Básicamente, el concepto de DCT es el mismo que la transformación inversa de Fourier.
¿Cómo se explica MFCC??
Los coeficientes cepstrales de frecuencia MEL (MFCC) de una señal son un pequeño conjunto de características (generalmente alrededor de 10-20) que describen de manera concisa la forma general de una envoltura espectral. En Mir, a menudo se usa para describir el timbre.
¿Cuál es la salida de la extracción de características MFCC??
La salida después de aplicar MFCC es una matriz que tiene vectores de características extraídos de todos los marcos. En esta matriz de salida, las filas representan los números de cuadro correspondientes y las columnas representan coeficientes de vectores de características correspondientes [1-4]. Finalmente, esta matriz de salida se utiliza para el proceso de clasificación.
¿Por qué usamos transformación de coseno discreta??
La transformación de coseno discreta se usa en la compresión de imagen con pérdida porque tiene una compactación energética muy fuerte, yo.mi., Su gran cantidad de información se almacena en un componente de muy baja frecuencia de una señal y repunte de otra frecuencia que tiene datos muy pequeños que se pueden almacenar utilizando muy menor número de bits (generalmente, como máximo 2 ...