- ¿Cuál es el propósito de la detección de la actividad de voz en los sistemas del habla??
- ¿Cómo funciona Webrtc Vad??
¿Cuál es el propósito de la detección de la actividad de voz en los sistemas del habla??
VAD, también conocido como detección del habla, tiene como objetivo detectar la presencia o ausencia de discurso y diferencia el habla de las secciones de no voz. Es importante en una variedad de aplicaciones basadas en el habla, especialmente en la codificación del habla y el reconocimiento del habla.
¿Cómo funciona Webrtc Vad??
WebRTC divide el audio en marcos, cada cuadro tiene un número correspondiente (0 o 1). Usamos marcos de 30 ms para WEBRTC, por lo que cada fragmento de 250 ms se divide en 8 cuadros, su valor medio se usa como un basurero para la parcela.