in

Bolsa de palabras visuales en pocas palabras

1yDysYXCrt6ONX6bAY8BIvw

Bolsa de palabras visuales en pocas palabras

El arte de elegir características importantes

Bethea Davida

3 de julio de 2018·3 min de lectura

1*yDysYXCrt6ONX6bAY8BIvw
Bolsa de palabras visuales (BOVW)

Palabras clave en documentos

¿Qué es la bolsa de palabras visuales (BOVW)?

La idea general de la bolsa de palabras visuales (BOVW) es representar una imagen como un conjunto de características. Las características constan de puntos clave y descriptores. Los puntos clave son los puntos «destacados» en una imagen, por lo que no importa que la imagen se gire, encoja o expanda, sus puntos clave siempre serán los mismos. Y el descriptor es la descripción del punto clave. Usamos los puntos clave y descriptores para construir vocabularios y representar cada imagen como un histograma de frecuencia de características que están en la imagen. A partir del histograma de frecuencias, posteriormente, podemos encontrar otras imágenes similares o predecir la categoría de la imagen.

1*QgI1t 7yJApi4vQigFgsLQ

Histograma de palabras visuales

¿Cómo construir una bolsa de palabras visuales (BOVW)?

Detectamos características, extraemos descriptores de cada imagen en el conjunto de datos y creamos un diccionario visual. La detección de características y la extracción de descriptores en una imagen se pueden realizar utilizando algoritmos de extracción de características (por ejemplo, SIFT, KAZE, etc.).

1*mjmOTgGeZ9vA7n3n3H Y0g

Detectando características y extrayendo descriptor

Agrupación de descriptores

Tengo una imagen y quiero encontrar otras 20 imágenes similares del conjunto de datos. ¿Cómo puedo hacer eso?

Dada otra imagen (ya sea del conjunto de datos o no), como antes, detectamos características en la imagen, extraemos descriptores de la imagen, agrupamos los descriptores y construimos un histograma con la misma longitud que el histograma anterior. Al usar una bolsa de representación visual de palabras de nuestro conjunto de datos, podemos calcular los vecinos más cercanos de esta imagen. Podemos hacerlo usando el algoritmo de vecinos más cercanos u otro algoritmo.

1*iZMo6VDq6pZPRBgq3M4MoA

Histograma de la imagen

Referencia:

Reconocimiento y aprendizaje de categorías de objetos

Galardonado con el Premio al Mejor Curso Corto en ICCV 2005 Reconocimiento y Categorías de Objetos de Aprendizaje Li Fei-Fei (Stanford), Rob…

people.csail.mit.edu

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

01eEh3It3sCc0TkdS6Ghvfg 1.1632766908.fit lim.size 1200x630

Con el éxito reportado del Galaxy Z Flip3, Samsung puede eliminar el Galaxy S21 FE

og vcs facebook

Mantener la seguridad de los empleados es lo primero