- ¿Cómo se explica MFCC??
- ¿Qué hacen los MFCC??
- ¿Cómo se usa MFCC en el reconocimiento de voz??
- ¿Por qué se usa MFCC para la extracción de funciones??
¿Cómo se explica MFCC??
Los coeficientes cepstrales de frecuencia MEL (MFCC) de una señal son un pequeño conjunto de características (generalmente alrededor de 10-20) que describen de manera concisa la forma general de una envoltura espectral. En Mir, a menudo se usa para describir el timbre.
¿Qué hacen los MFCC??
Los MFCC se usan comúnmente como características en los sistemas de reconocimiento de voz, como los sistemas que pueden reconocer automáticamente los números hablados en un teléfono. Los MFCC también encuentran cada vez más usos en aplicaciones de recuperación de información musical, como clasificación de género, medidas de similitud de audio, etc.
¿Cómo se usa MFCC en el reconocimiento de voz??
MFCC son características populares extraídas de señales de habla para su uso en tareas de reconocimiento. En el modelo de habla de origen de origen, se entiende que MFCC representa el filtro (tracto vocal). La respuesta de frecuencia del tracto vocal es relativamente suave, mientras que la fuente del habla expresa se puede modelar como un tren de impulso.
¿Por qué se usa MFCC para la extracción de funciones??
Se observa que extraer características de la señal de audio y usarla como entrada al modelo base producirá un rendimiento mucho mejor que considerar directamente la señal de audio en bruto como entrada. MFCC es la técnica ampliamente utilizada para extraer las características de la señal de audio.