Una mejor percepción (artificial) del mundo

Enrique Argones, Gradiant | 1 de Agosto de 2014
 
 
La inteligencia artificial no es un tema nuevo. Sin embargo, hay algo fascinante en ella, algo de ciencia-ficción, algo que ha hecho volar la imaginación de los hombres desde hace décadas. Una máquina capaz de conjugar la inteligencia: captar, percibir, actuar y aprender. Cada conquista real hacia una inteligencia artificial pasa obligatoriamente por comprender los mecanismos para conquistar cada uno de esos verbos.
Hoy en día manejamos dispositivos que son capaces de captar el entorno de muchas formas, capturando imágenes, sonido, el movimiento, u otras complejas habilidades sensoriales superhumanas a las que estamos cada día más acostumbrados, como la posición en el planeta o la presencia de otros dispositivos en el entorno. Captan. Estos dispositivos pueden producir sonidos, vibrar, representar imágenes y vídeos, y comunicarse con otras máquinas. Actúan. Parece claro que lo complicado está en las otras dos palabras. Sin todas ellas, no hay juego.
 
 
Al margen de los avances en el cuarto verbo, en el aprendizaje artificial, gracias al uso de técnicas de procesado de lenguaje natural y minería de datos, la tecnología se enfrenta al reto de la percepción artificial (la conceptualización en clases abstractas de las señales captadas). Recientemente ha habido notables avances en un campo íntimamente relacionado con la percepción, el reconocimiento de patrones. Estos avances se han aplicado en disciplinas como el reconocimiento de objetos, la biometría de caras y el reconocimiento de voz, y han llevado a estas tecnologías a fronteras sorprendentes, a un nivel realmente útil, eficaz, lo que ha permitido su incorporación al ecosistema móvil. Es cada vez más habitual interactuar con aparatos que nos reconocen como sus dueños, hablarle a un manos libres en un coche, a una operadora automática o al móvil para no tener que teclear la búsqueda o el mensaje. ¿Se atrofiarán los pulgares antes de haber culminado su prometida evolución? ¿Estamos ante la auténtica revolución en la interacción entre hombre y máquina? No exageremos con las implicaciones, pero realmente consiguen transformar las señales captadas en conceptos abstractos. En la medida que realizan estas tareas de forma eficaz, perciben.
Detrás de estos avances están unas viejas conocidas de los especialistas en el campo, las redes neuronales artificiales, pero en una nueva forma, con un nuevo nombre, redes neuronales profundas, y que están dando mucho que hablar. La arquitectura ha cambiado, han crecido enormemente en complejidad, y lo más importante, han solucionado de forma satisfactoria las dificultades conceptuales que entraña el uso de una estructura tan compleja de forma eficaz en una red neuronal. Estas redes, dotadas de numerosísimas unidades interconectadas llamadas neuronas, necesitan enormes cantidades de datos (caras, voz, imágenes de objetos de tipos concretos, etc.) para conseguir alcanzar sus más altas cotas de prestaciones. Necesitan también potentes instalaciones para, a través de captar estos datos una y otra vez, configurarse de tal forma que acaban conteniendo una representación conceptual con una eficacia demostrada. Pero nada de esto ha supuesto un problema infranqueable para los jugadores más aventajados en su uso: Microsoft, Facebook y Google.
Estas tecnologías han conseguido acercarnos más a derribar la mayor barrera para una interacción más natural y cómoda con nuestra tecnología, a conseguir una percepción artificial eficaz. Y sin duda por ello darán aún mucho que hablar. "En Gradiant, como parte de nuestra filosofía de continua evolución tecnológica, no vamos a dejar pasar este tren, sobre todo teniendo en cuenta que las redes neuronales profundas pueden complementar y mejorar las tecnologías de reconocimiento biométrico y de reconocimiento de voz, de las cuales Gradiant dispone de potentes soluciones actualmente."