En un trabajo realizado por varios miembros de la Universidad de Jaen se discute el uso de la ganacia de información para reducir y mejorar la información textual incluida en los sistemas de recuperación de información multimodal.
Con el paso del tiempo la cantidad de información disponible en formato electrónico aumenta y ésta tiende a ser cada vez más multimodal (texto, imágenes, sonidos, videos...). Con lo que surje la necesidad de sistemas de búsqueda eficientes para acceder a la información, ya que de nada sirve disponer de la información y no ser capaces de localizarla.
Un sistema CBIR (Content Based Information Retrieval) es una aplicación que busca dentro de una colección de imágenes aquellas que son semejantes o que tienen un contenido similar a una imagen dada como consulta. Estos sistemas realizan la búsqueda basándose en las características y el contenido de la imagen y no en otro tipo de información añadida manualmente, como por ejemplo el título o palabras clave.
Actualmente, están generando bastante interés sistemas en los que además de almacenar imágenes se incluye cierto texto asociado a dichas imágenes (meta-datos). Es el caso, por ejemplo, de los expedientes médicos en los que una radiografía puede tener asociada una información textual relativa al historial clínico del paciente, al comentario de un especialista sobre la radiografía, información sobre el tratamiento propuesto al paciente…Otro ejemplo sería una colección de fotografías con comentarios sobre las mismas. Las fotografías pueden ser cuadros de un museo, fotografías asociadas a noticias en un periódico o catálogos de productos de cualquier tipo. Una manera de recuperar información en este tipo de sistemas podría incluir la recuperación visual por una parte, la recuperación textual por otra, y finalmente, una mezcla de resultados parciales (visuales y textuales) que persigan la optimización de la respuesta dada.
Un ejemplo práctico de la utilización de un sistema mixto (CBIR+IR), lo tenemos en el trabajo diario de un médico. Éste posee casos clínicos de sus pacientes. Dichos casos están compuestos por textos descriptivos del caso e imágenes que ilustran la dolencia. Con un sistema CBIR, ayudado por un sistema IR, el médico podría utilizar una imagen de una dolencia (por ejemplo, una radiografía) y obtener información de casos similares a dicha dolencia. Por lo tanto, la recuperación sería tanto visual como textual, ya que los casos están compuestos tanto por información textual del caso como por imágenes.
Cabe pues plantearse que una recuperación eficiente del texto puede ayudar a mejorar la calidad de los sistemas multimodales en general. El texto puede beneficiarse de las imágenes y viceversa.
En una colección con gran cantidad de metadatos nos encontramos con la problemática de elegir aquellos metadatos que son de mayor utilidad y desechar aquellos que pueden añadir información no relevante (ruido) en nuestro sistema. La ganancia de información es una técnica a través de la cual podemos seleccionar aquellos metadatos que aportan mayor información al sistema ignorando aquellos que no sólo no aportan información alguna, sino que en ocasiones incluso introducen ruido y pueden distorsionar la respuesta del sistema.
En este trabajo se propone el uso de la ganancia de información como técnica para mejorar la calidad del corpus textual asociado a una colección de documentos que representan expedientes médicos. Una mejora del corpus textual implica una mayor eficacia en la recuperación de este tipo de información, lo que repercute directamente en la eficacia del sistema multimodal global.
No hay comentarios:
Publicar un comentario