- Cómo se extraen las características de la bolsa visual de las palabras?
- ¿Cómo funcionan la bolsa de palabras visuales??
- ¿Qué fase en la bolsa del marco de las características genera palabras visuales??
- ¿Cómo usamos la agrupación para calcular una bolsa de representación de imagen de palabras??
Cómo se extraen las características de la bolsa visual de las palabras?
Su concepto está adaptado de la recuperación de información y la bolsa de palabras de la PNL (arco). En la bolsa de palabras (arco), contamos el número de cada palabra aparece en un documento, usamos la frecuencia de cada palabra para conocer las palabras clave del documento y hacemos un histograma de frecuencia de él. Tratamos un documento como una bolsa de palabras (arco).
¿Cómo funcionan la bolsa de palabras visuales??
El objeto BagOfeatures define las características, o palabras visuales, utilizando el algoritmo K-Means Clustering (estadística y la caja de herramientas de aprendizaje automático) en los descriptores de características extraídos de los conjuntos de entrenamientos . El algoritmo agrupa iterativamente los descriptores en k racimos mutuamente excluyentes.
¿Qué fase en la bolsa del marco de las características genera palabras visuales??
Después de encontrar los puntos clave óptimos del nuevo método GKS, se realiza la fase de construcción del libro de códigos de BOF (como se describe en la sección "Método de la bolsa de las funciones") que utiliza la agrupación de K-Means para generar varias palabras visuales.
¿Cómo usamos la agrupación para calcular una bolsa de representación de imagen de palabras??
El número de clústeres es el tamaño del libro de códigos (análogo al tamaño del diccionario de palabras). Por lo tanto, cada parche en una imagen se asigna a un determinado código de código a través del proceso de agrupación y la imagen puede representarse mediante el histograma de los codewords.