¿Qué es vad en el reconocimiento de voz??
6.1. Introducción. La detección de la actividad de voz (VAD) es una técnica en la que se detecta la presencia o ausencia del habla humana. La detección se puede utilizar para activar un proceso. VAD se ha aplicado en aplicaciones y dispositivos controlados por voz como teléfonos inteligentes, que se pueden operar utilizando comandos de voz.
¿Cómo funciona Webrtc Vad??
WebRTC divide el audio en marcos, cada cuadro tiene un número correspondiente (0 o 1). Usamos marcos de 30 ms para WEBRTC, por lo que cada fragmento de 250 ms se divide en 8 cuadros, su valor medio se usa como un basurero para la parcela.