martes, 1 de febrero de 2011

CBIR - Sistemas de Recuperación de Imágenes por Contenido

Para poder realizar búsquedas de imágenes, tradicionalmente éstas se describían mediante un proceso de transcripción del lenguaje visual al verbal mediante palabras claves. Los indizadores suelen ser humanos, lo que hace que el proceso que sea complejo, caro e irregular. Una solución sobre la que se ha estado investigando son los sistemas automaticos. De momento están lejos de ser tan eficientes como el humano, pero hay varias experiencias interesantes al respecto y muchísima información en la red.

Estos sistemas evitan el cambio de lenguaje (o utilizan el lenguaje verbal como complemento) y hablan en los mismos términos que las propias imagenes, por ello se basan normalmente en caracteristicas como el Color, Textura, Formas genéricas, Segmentación e identificación de formas individuales y Disposición espacial relativa de objetos.

A estos sistemas genericamente se les suele denominar CBIR: content based image retrieval, es decir, Sistemas de Recuperación de Imágenes por Contenido.

En la web del profesor James Z. Wang, de la Universidad de Pennsylvania, podemos ver varios experimentos muy interesantes relacionados con imágenes de distintos ámbitos: generales (a-lip: Automatic Linguistic Indexing of Pictures), relacionadas con estudios militares o geograficos (Satellite Imagery), SIMPLIcity (Semantics-sensitive Integrated Matching for Picture Libraries), imágenes del mundo del arte, médicas...

Técnicas como feedback (retroalimentación por relevancia), clustering (análisis de conglomerados), fuzzy (lógica difusa), etc son muy utilizadas. Estos sistemas y sus aplicaciones son muy importantes principalmente cuando no es importante la descripción denotativa de la imagen (imaginemos una fotografia de guerra con un niño llorando, en la que la denotación sería fundamental), y por ello se ha primado el estudio de CBIR en campos como la medicina, el arte, el militar, la meteorología, etc. Pero en estos campos este concepto, por lo que he podido ver, se sustituye por el procesamiento digital de imágenes, disciplina que desarrolla las bases teóricas y algorítmicas mediante las cuales pueda extraerse información del mundo real, de manera automática a partir de una imagen observada, de un conjunto de imágenes o de una secuencia.

Otra aplicación de los sistemas CBIR es su utilización para incluir las palabras clave obtenidas como metadatos. Así lo he visto en la presentación de este producto ViA2 Platform, un gestor de activos media especializado en la indexación y anotación de contenidos, incorpora herramientas de análisis avanzado para facilitar la compilación de metadata y con ello el acceso a los vídeos, audios e imágenes almacenados. Otros ejemplos: SIMPLIcity: Semantics-sensitive Integrated Matching for Picture LIbraries, Unified Feature Matching Scheme, blobworld o el desarrollado por INRIA.

Por último, mencionar las técnicas de intentos de standarización del etiquetado de imágenes: MPEG-7 del que se puede leer una sencilla explicación: aquí, que pueden ser un importante componente.

No hay comentarios:

Publicar un comentario