- ¿Qué es X vector en el reconocimiento de voz??
- ¿Qué es I-vector y D-vector??
- ¿Qué son los ivectores??
- ¿Qué es el modelo de fondo universal??
¿Qué es X vector en el reconocimiento de voz??
Los vectores X son los incrustaciones extraídos de la primera capa a nivel de segmento del DNN. Son una representación del segmento de audio y son una representación de un altavoz cuando se promedian sobre diferentes segmentos de audio del mismo altavoz.
¿Qué es I-vector y D-vector??
D-vector es la activación promedio de la última capa oculta de este DNN. Por lo tanto, a diferencia del marco I-Vector, esto no tiene suposiciones sobre la distribución de la función (el marco del vector i supone que el vector I o la variable latente tienen una distribución gaussiana).
¿Qué son los ivectores??
Su ivector [1], un vector de baja dimensión que indica la coordenada de esa expresión en un modelo acústico subespacial. Mostramos. que la distribución de ivectores puede caracterizar un conjunto de datos y. permite distinguir subconjuntos de enunciados de diferentes hacer-
¿Qué es el modelo de fondo universal??
Un modelo de fondo universal (UBM) es un modelo utilizado en un sistema de verificación biométrica para representar características de características generales e independientes de la persona que se compararán con un modelo de características de características específicas de la persona al tomar una decisión de aceptar o rechazar.