Problema con el MFCC y GMM para el reconocimiento de audio

¿Por qué es importante MFCC en el reconocimiento de voz??
Cómo se extraen las características de MFCC para el reconocimiento de voz?
¿Por qué es tan popular MFCC??
¿Cuáles son las ventajas de MFCC??

¿Por qué es importante MFCC en el reconocimiento de voz??

MFCC son características populares extraídas de señales de habla para su uso en tareas de reconocimiento. En el modelo de habla de origen de origen, se entiende que MFCC representa el filtro (tracto vocal). La respuesta de frecuencia del tracto vocal es relativamente suave, mientras que la fuente del habla expresa se puede modelar como un tren de impulso.

Cómo se extraen las características de MFCC para el reconocimiento de voz?

La técnica de extracción de características de MFCC básicamente incluye ventana la señal, aplicar el DFT, tomar el registro de la magnitud y luego deformar las frecuencias en una escala MEL, seguido de la aplicación del DCT inverso.

¿Por qué es tan popular MFCC??

La técnica MFCC es la más popular, tiene un gran logro y se utiliza ampliamente en los sistemas de reconocimiento de altavoces y de voz [35, 36]. Se basa en una escala logarítmica y puede estimar la respuesta auditiva humana de una mejor manera que las otras técnicas de extracción de características cepstrales [37,38]. ...

¿Cuáles son las ventajas de MFCC??

La ventaja de MFCC es que es bueno en la reducción de errores y puede producir una característica robusta cuando la señal se ve afectada por el ruido. La técnica SVD/PCA se utiliza para extraer las características importantes de la representación de distribución B.