¿Qué es un espectrograma log mel??
Un espectrograma MEL logarítmicamente hace frecuencias por encima de cierto umbral (la frecuencia de la esquina). Por ejemplo, en el espectrograma a escala lineal, el espacio vertical entre 1,000 y 2,000Hz es la mitad del espacio vertical entre 2,000Hz y 4,000Hz.
Es OpenAi Whisper gratis?
Operai ha lanzado recientemente un nuevo modelo de reconocimiento de voz llamado Whisper. A diferencia de Dalle-2 y GPT-3, Whisper es un modelo gratuito y de código abierto. Whisper es un modelo automático de reconocimiento de voz capacitado en 680,000 horas de datos multilingües recopilados de la web.
¿Qué es Whisper ai??
Whisper es un sistema de reconocimiento de voz automático (ASR) capacitado en 680,000 horas de datos supervisados multilingües y multitarea recopilados desde la web. Mostramos que el uso de un conjunto de datos tan grande y diverso conduce a una mejor robustez a los acentos, el ruido de fondo y al lenguaje técnico.