Redes Convolucionales Siamesas y Tripletas para la Recuperación de Imágenes Similares en Contenido

Resumen: El objetivo del trabajo presentado fue el desarrollo de un sistema de recuperación de imágenes con base en su contenido, utilizando redes convolucionales siamesas y tripletas. Se utilizaron estas arquitecturas múltiples para generar descriptores visuales, extrayendo información semántica de dos imágenes (siamesa) o tres imágenes (tripleta) a la vez. Posteriormente, se realizó un aprendizaje de similitud, codificando la distancia de estas siamesas o tripletas de descriptores visuales, cuyo almacenamiento no es necesario. Los resultados muestran que los esquemas con base en redes convolucionales extraen mayor cantidad de información semántica. Las arquitecturas múltiples, aparte de extraer información semántica, mejoran la tasa de recuperación de imágenes. Se concluye que las arquitecturas múltiples solucionan los tres retos más importantes de estos sistemas, como lo son la brecha semántica, el aprendizaje de similitud y el espacio de almacenamiento, los cuales no habían sido resueltos en trabajos anteriores.

Saved in:
Bibliographic Details
Main Authors: Fierro,Atoany N., Nakano,Mariko, Yanai,Keiji, Pérez,Héctor M.
Format: Digital revista
Language:Spanish / Castilian
Published: Centro de Información Tecnológica 2019
Online Access:http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-07642019000600243
Tags: Add Tag
No Tags, Be the first to tag this record!