Procesado facial en entornos realistas

Las tecnologías de biometría facial tienen utilidad directa en el ámbito de la seguridad: controles de acceso a recintos, sistemas de videovigilancia y contraseñas biométricas para ordenadores son algunos de los ejemplos más característicos, campos donde Gradiant desarrolla una intensa labor investigadora tanto a nivel teórico como de aplicación

Las tecnologías de biometría facial tienen utilidad directa en el ámbito de la seguridad: controles de acceso a recintos, sistemas de videovigilancia y contraseñas biométricas para ordenadores son algunos de los ejemplos más característicos, campos donde Gradiant desarrolla una intensa labor investigadora tanto a nivel teórico como de aplicación. El objetivo final es el de mejorar las prestaciones de los sistemas bajo condiciones adversas, permitiendo el despliegue de esta tecnología en escenarios complejos y realistas. Sin duda alguna, esta es la tendencia actual en reconocimiento de caras, donde los prototipos ampliamente probados en condiciones controladas o semi-controladas se enfrentan a imágenes del «mundo real». Los proyectos Labeled Faces in The Wild (http://vis-www.cs.umass.edu/lfw/) y Public Figures Face Database (http://www.cs.columbia.edu/CAVE/databases/pubfig/) constituyen dos buenos ejemplos, con miles de imágenes recogidas directamente de la web mediante herramientas semi-automáticas y protocolos que permiten la comparación de los diferentes algoritmos en estos escenarios de gran dificultad.

A nivel teórico, en Gradiant se han llevado a cabo investigaciones sobre el modelado estadístico de los coeficientes resultantes de un filtrado de Gabor multi-orientación y multi-escala, trabajos que han sido publicados en diversas conferencias de ámbito internacional, destacando los publicados en la IEEE International Conference on Image Processing (ICIP) de los años 2007 y 2009. Estas investigaciones han permitido una reducción drástica en el tamaño de los modelos (templates) biométricos, manteniendo las prestaciones del sistema original, lo cual posibilita la utilización de chips de baja capacidad de almacenamiento (p.ej. tags RFID) para albergar modelos biométricos. En esta misma línea, un trabajo realizado en colaboración con el Departamento de Teoría de la Señal de la Universidad de Vigo fue aceptado a finales del año pasado para su publicación en la próxima IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2010, que se celebrará en Dallas, Texas (EEUU).

La elección de modelos estadísticos apropiados ha permitido, además, que se den los primeros pasos de cara a la selección de distancias de comparación óptimas para sistemas biométricos basados en filtrado de Gabor, tema que en la comunidad científica internacional no ha sido tratado hasta el momento debido a la ausencia de bases teóricas y que, sin duda alguna, mejorará las prestaciones de dichos sistemas.

 

No todo iba a ser seguridad…

Además de aplicaciones de seguridad, los sistemas automáticos para detección y análisis de caras también han sido orientados hacia otros campos donde priman factores tales como accesibilidad, usabilidad y personalización. Así, los mundos de las interfaces hombre-máquina y los videojuegos se han visto recientemente revolucionados por estas y otras tecnologías. No hay nada más que echar un vistazo a los spots publicitarios de PlayStation (EyePet) y Xbox (Project Natal) para comprobar la importancia que tienen, para estos proyectos, los módulos automáticos de reconocimiento facial, gestual y emocional, la captación del movimiento corporal del usuario, el reconocimiento de voz y el uso de «realidad aumentada» (augmented reality, AR) para generación de mascotas virtuales en un entorno real.

En Gradiant existen líneas de investigación vinculadas a muchas de las tecnologías que acabamos de enumerar: los sistemas de análisis facial permiten detectar y reconocer automáticamente al usuario situado delante de la cámara, pudiendo proporcionar además información demográfica (sexo, rango de edad, raza) y emocional para un mayor grado de personalización e interacción con la máquina. Combinados con el empleo de modelos 3D (avatares), es posible transferir los gestos y expresiones al avatar para crear una representación virtual y dinámica del usuario dentro del videojuego. Asimismo, sistemas que emplean detección de caras y de rasgos faciales permiten controlar el cursor del PC con el único movimiento de la cabeza (o de los ojos) y «sumergirse» en escenas 3D generadas por ordenador, que podrían ser las de un juego de acción en primera persona.

Dentro de esta línea, Gradiant desarrolló el año pasado un proyecto para inmersión subjetiva en imágenes tridimensionales generadas por ordenador, trabajo que fue merecedor del tercer premio en el IX Concurso de Proxectos Tecnolóxicos de Expourense. Otro de los proyectos abiertos actualmente contempla la ocultación selectiva de caras (p.ej. niños) en secuencias de vídeo con el objeto de preservar la privacidad de los menores de edad.

Asimismo, Gradiant participa actualmente en un proyecto financiado dentro de la convocatoria 2009 del plan Avanza I+D y cuya finalidad es el desarrollo de una plataforma de publicidad interactiva y personalizada. Esta plataforma, susceptible de ser colocada en un centro comercial o en escaparates, es de gran interés para el comerciante puesto que permite obtener medidas objetivas del éxito de una determinada campaña de publicidad: número de personas que han mostrado interés, tiempos de atención, etc. Los sistemas de clasificación demográfica posibilitan un estudio aún más granular, dado que los datos anteriormente citados pueden desglosarse por sectores de población. Desde el punto de vista del posible cliente, la plataforma de publicidad ofrece productos «personalizados» gracias al conocimiento del sexo y rango de edad del sujeto situado enfrente de la pantalla.

Por su parte, la interactividad es otro de los puntos fuertes del proyecto, muy importante para captar la atención del potencial cliente. En este apartado, el procesado de caras tiene un papel fundamental permitiendo, entre otras opciones, la prueba virtual de gafas y la comunicación con avatares generados por ordenador.

Las principales líneas de actuación dentro de los proyectos mencionados pasan por un perfeccionamiento de los sistemas de procesado facial que permita su uso en escenarios de alta complejidad. Por otra parte, desde el Grupo Especializado de Información Multimodal de Gradiant, se siguen buscando novedosas aplicaciones donde el uso de esta tecnología repercuta positivamente en la sociedad o suponga una mejora respecto a las soluciones disponibles actualmente.