Clasificar vídeos por la cara
22 febrero 2011

Clasificar vídeos por la cara

Share

Investigadores de la Universidad de Málaga persiguen desarrollar herramientas que permitan la manipulación de grandes archivos de vídeo, su visualización general y la búsqueda rápida basada en contenido para la localización de un segmento. Para ello, el sistema generará índices de vídeo, como ocurre con los archivos de texto.

Andalucía Investiga

El abaratamiento de costes de los dispositivos de almacenamiento masivo, la mejora en la técnicas de compresión de vídeo, la disponibilidad de mayores velocidades de transmisión en las líneas de comunicaciones y el incremento en la potencia de cálculo de los ordenadores han contribuido a una mayor accesibilidad de los archivos de vídeo digital a través de las redes de comunicaciones.

La obtención de una verdadera aplicación multimedia se basa en la disponibilidad de herramientas capaces de manipular información de vídeo, orientadas a la catalogación de vídeos en una base de datos accesible por contenido. Sin embargo, la gran mayoría de las aplicaciones de este tipo proporcionan tres funciones básicas: grabación, reproducción y avance/retroceso rápido. De esta forma, se invierte demasiado tiempo en la localización de un punto específico en el vídeo, ya que el material debe ser inspeccionado secuencialmente. Esto genera un gran número de accesos infructuosos.

Para solventar estas dificultades, investigadores de la Universidad de Málaga diseñarán herramientas que permitan la manipulación de grandes archivos de vídeo, haciendo posible una visualización general del mismo (video browsing) y la búsqueda rápida basada en contenido para la localización de un segmento. Para ello, pretenden diseñar un sistema que, automáticamente, genere índices de vídeo, de forma que posibiliten unas capacidades de tratamiento similares a aquellas que existen hoy en día para los datos representados de forma textual.

Clasificar vídeos por la cara
Grupo Procesamiento de Vídeo e Imágen de la UMA. / AI

La investigación explora dos líneas. Por un lado, los expertos desarrollarán técnicas para el análisis automático de contenidos en la señal de vídeo. Por otro lado, han estudiado arquitecturas avanzadas que permitan una ejecución eficiente de los nuevos algoritmos, sin necesidad de recursos computacionales de alto coste.”Por su excelente relación prestaciones/precio proponemos el uso de dos tipos de arquitectura de computador para la mejora de las aplicaciones de análisis de vídeo como las que actualmente tienen los ordenadores con varios procesadores o incluso las tarjetas gráficas de éstos”, explica el responsable del proyecto Nicolás Guil.

Hasta el momento, la catalogación automática de los archivos de vídeo se reduce al uso de una información muy simple y de carácter global, como el título del archivo y la fecha. Para una clasificación más sofisticada, un documentalista debe separar secuencia a secuencia el material audiovisual antes de clasificarlo. Para ayudar a estos profesionales, la herramienta que proponen los investigadores de la Universidad de Málaga detecta de forma automática cada secuencia y asigna un fotograma representativo de cada corte. Con este proceso, miles de fotogramas se resumen en sólo centenares y el documentalista accede a una galería digital que opera como un índice de contenidos. “Con los sistemas actuales se invierte demasiado tiempo en la localización de un punto específico en el vídeo, ya que el material debe ser inspeccionado secuencialmente. Esto genera, típicamente, un gran número de accesos infructuosos. Nuestra propuesta permite la manipulación de grandes archivos de vídeo, haciendo posible una visualización general”, explica el investigador.

Para desarrollar la aplicación, los investigadores primero cortan el vídeo plano a plano y resumen esa información en un solo fotograma, denominado signatura o firma digital. “Así el proceso se automatiza y se extraen la información semántica de las secuencias, para facilitar la labor del documentalista”, asevera Guil.

Las técnicas estudiadas conducirán a la implementación de cuatro aplicaciones muy útiles para la catalogación: comparación de secuencias de vídeo, detección e identificación de logotipos, detección y reconocimiento de caras e identificación de personajes en programas de noticias.

En el lado de la arquitectura de computadores, los expertos plantean el uso de nuevas arquitecturas de procesamiento basadas en procesadores multinúcleo (CMP) y multihilo (SMT) para incrementar el rendimiento de las aplicaciones. Las primeras consisten en ordenadores denominados multicore, es decir, con varios procesadores, que se unen con un canal de alta velocidad y comparten la carga de trabajo general entre ellos, cuando uno falla el otro se hace cargo. En concreto, los expertos trabajan con procesadores de ocho núcleos. “Además, estamos explorando las posibilidades de las tarjetas gráficas de los ordenadores. Ahora se utilizan para el diseño gráfico, por sus características para operar con elementos en tres dimensiones. Nosotros pensamos que pueden aplicarse al análisis de vídeo por la gran cantidad de operaciones que se requieren”, adelanta el experto y añade que utilizarán también procesadores multihilo, aquellos que son capaces de ejecutar varios programas a la vez.