Reconocimiento de voz de la red neuronal

¿Se pueden utilizar redes neuronales para el reconocimiento de voz??
¿Qué red neuronal es mejor para el reconocimiento de voz??
¿Por qué se usan redes neuronales para el reconocimiento de voz??
¿Qué algoritmo se usa para el reconocimiento de voz??

¿Se pueden utilizar redes neuronales para el reconocimiento de voz??

Las redes neuronales son muy poderosas para el reconocimiento del habla. Hay varias redes para este proceso. RNN, LSTM, red neuronal profunda y HMM-LSTM híbrido se utilizan para el reconocimiento de voz.

¿Qué red neuronal es mejor para el reconocimiento de voz??

La red neuronal convolucional (CNN) se aplica como redes neuronales profundas avanzadas para clasificar cada palabra desde nuestro conjunto de datos agrupados como una tarea de clasificación de múltiples clases. La red neuronal profunda propuesta devolvió 97.06% como precisión de clasificación de palabras con una muestra de discurso completamente desconocida.

¿Por qué se usan redes neuronales para el reconocimiento de voz??

Las redes neuronales funcionan muy bien en el aprendizaje de la probabilidad del fonema de la entrada de audio altamente paralela, mientras que los modelos Markov pueden usar las probabilidades de observación de fonemas que las redes neuronales proporcionan para producir la secuencia o palabra de fonema más probable.

¿Qué algoritmo se usa para el reconocimiento de voz??

En una de las obras [10], el método de preprocesamiento del habla se consideró utilizando el algoritmo VAD, que prueba que este algoritmo mejora el rendimiento del reconocimiento de voz.