martes, 18 de enero de 2011

Hola mundo!

Hola,

Este blog es un trabajo de investigación para la asignatura de Procesadores de Lenguaje que curso en la UEM.

Copio y pego la introducción del Grupo de Investigación en Procesamiento del Lenguaje Natural y Sistemas de Información de la Universidad de Alicante:

La gran variedad de formatos digitales existentes en la red y el boom de los contenidos multimedia, han hecho necesario desarrollar y/o adaptar herramientas de búsqueda de información a las características de estos nuevos formátos como son el video y la imagen entre otros.

Actualmente los buscadores comerciales de contenidos multimedia, como los bien conocidos Youtube o Flickr , basan las búsquedas sólo en el texto que acompaña a la imagen o al video. El desarrollo de este tipo de herramientas está dentro del área de investigación de la Recuperación de Información Visual (RIV).
La RIV se puede decir que es un área específica dentro de la Recuperación de Información (RI), en la cual de hecho inicialmente se han utilizado sistemas de RI tradicionales sin ninguna adaptación especifica a la RIV para llevar a cabo búsquedas utilizando las anotaciones que acompañan a las imágenes o vídeos. Así, las colecciones que utilizan los sistemas de RIV estan compuestas de colecciones de imágenes o videos y de las anotaciones que describen a las mismas.

Históricamente en el área de la RIV se han utilizado dos enfoques para llevar a cabo la RI de imágenes: En los inicios de la RIV a finales de los años 70, los sistemas de RIV se basan en las anotaciones que acompañan a las imágenes, se trata pues de sistemas de RIV Basados en Texto (RIBT). Más tarde a principios de los años 90, en un intento de superar la dependencia de los sistemas de RIBT de la existencia de anotaciones textuales de una imagen para su indexación, surgen los sistemas de RIV Basados en el Contenido de la Imagen (RIBC).

Finalmente en los últimos años a medida que las tecnologías utilizadas por los sistemas de RIBC han ido madurando, un tercer enfoque para afrontar el problema de la RIV ha surgido, se trata de los sistemas que combinan tecnologías basadas en texto y en imagen. En este contexto los esfuerzos se centran en encontrar metodos adecuados para la combinación multimodad de fuentes de información tan diferentes.