Inteligencia Artificial: verdades y mitos
Desde hace unos años, y gracias en parte a los grandes avances en las tecnologías de computación, hemos vivido el auge de un conjunto de métodos, algoritmos y aplicaciones bajo la etiqueta de Inteligencia Artificial. Sin embargo, este concepto no es en ningún modo nuevo, ya que su origen se remonta a mediados del siglo pasado según las referencias más extendidas (Mc Carthy, Minsky, Rochester, & Shannon, n.d.).
En los años 50 del siglo XX se consideraba que “todo aspecto del aprendizaje o cualquier otra característica de la inteligencia puede ser descrita con tal precisión que se puede crear una máquina que lo simule”. A partir de ahí, el concepto se ha llevado a la práctica de formas muy diferentes, dando lugar a una gran variedad de sistemas que, de una u otra forma, pueden considerarse Inteligencia Artificial. Es esta generalidad en la definición, junto con el hecho de que la tecnología se encuentra en un claro momento de hype, lo que principalmente contribuye a que ahora mismo casi cualquier sistema informático se promocione como “basado en IA” para aprovechar el tirón.
En este artículo intentaremos aclarar los conceptos y las bases de la Inteligencia Artificial, para que podáis formaros una opinión realista sobre la IA y que no nos dejemos llevar simplemente por las palabras de moda.
Primer paso: clasificación y definición
Lo primero es lo primero, por eso es importante realizar una clasificación de los sistemas de inteligencia artificial que nos permita diferenciarlos en función de su especificidad. A pesar de que existen multitud de clasificaciones en este sentido, en este punto nos centraremos en la que quizás sea la más general, que define las siguientes clases de sistemas ordenadas de menor a mayor nivel de complejidad:
- IA Débil / IA Estrecha: se trata de un sistema de Inteligencia Artificial centrado en una tarea concreta y específica, en la cual puede superar la capacidad del ser humano.
- IA General / IA Fuerte: estos sistemas de Inteligencia Artificial son capaces de demostrar un nivel equiparable al humano en el rango de tareas cognitivas que las personas llevan a cabo en la actividad diaria.
- Superinteligencia Artificial: Inteligencia Artificial General cuyo nivel puede sobrepasar a la capacidad humana en tareas cognitivas.
Dadas estas definiciones, queda patente que los sistemas actuales encajan bajo el epígrafe de IA Débil, y a la tecnología todavía le queda recorrido hasta poder llegar al siguiente nivel. De todas formas, y a pesar de su nombre, la IA Débil actual tiene la capacidad de resolver problemas complejos con una precisión y eficiencia superior a la de un ser humano, lo cual no deja de ser una gran ventaja en multitud de situaciones.
Entrando un poco más en detalle técnico, los sistemas de IA Débil se pueden subdividir a su vez en:
- IA Simbólica: puede ejecutar las instrucciones y sigue las reglas definidas por un experto humano. Dentro de esta categoría encajan los denominados sistemas expertos (Puppe, 1993) basados en ontologías, reglas o lógica formal.
- Aprendizaje Automático (Machine Learning): este tipo de sistema es capaz de adquirir la capacidad de ejecutar una tarea sin que se le haya indicado de forma explícita una secuencia de pasos concreta para ella. Dicho de una forma más coloquial, al sistema se le indica (de forma más o menos directa dependiendo de la familia de algoritmos de la que hablemos) lo que se espera de él, pero no de qué forma debe conseguirlo, al contrario del caso anterior. En esta categoría se engloban los sistemas basados en regresión, Deep Learning, clustering, etc.
Segundo paso: sistemas fiables y confiables
El mayor foco ahora mismo está puesto en los sistemas de aprendizaje automático, especialmente en aquellos basados en Deep Learning, por su mayor capacidad para representar problemas complejos, aunque también presentan limitaciones en lo que se refiere a la elevada cantidad de datos y recursos de computación que requieren para funcionar correctamente, así como al hecho de que los modelos resultantes no son fácilmente interpretables por un ser humano (Došilović, Brčić, & Hlupić, 2018). Este segundo punto, aunque a priori pudiera parecer secundario en lo que se refiere a la resolución de problemas, es de vital importancia para obtener sistemas que sean seguros y confiables, especialmente en entornos críticos en cuanto a la seguridad física -como en el caso de los vehículos autónomos o robótica industrial, por ejemplo-; y lógica (fintech, voto electrónico, etc.).
Tanto el aprendizaje automático como la IA simbólica son estrategias que pueden ofrecer muy buenos resultados. Con la tecnología disponible a día de hoy (recordemos, la que conocemos como IA Débil), es posible resolver problemas concretos con una elevada precisión si se cuenta con 3 factores principales:
- Los datos necesarios para configurar, entrenar y validar el sistema de IA.
- La especialización adecuada, es decir, un equipo de personas con capacidades que van desde el análisis de datos de corte más puramente matemático, hasta aspectos técnicos para el diseño y puesta en producción de sistemas informáticos complejos.
- Las herramientas correctas para poner en marcha estos sistemas.
Existe gran cantidad de opciones disponibles tanto en el estado del arte como en el mercado en lo que se refiere a las herramientas necesarias para poner en marcha los sistemas de Inteligencia Artificial. La principal dificultad se centra en saber escoger adecuadamente cuáles son las que mejor encajan con las necesidades y requisitos de cada problema, especialmente si el objetivo final es que la solución planteada pueda evolucionar y adaptarse a otros problemas y situaciones en el futuro.
La disponibilidad de datos adecuados es otro de los puntos críticos para la correcta puesta en marcha de este tipo de soluciones, especialmente en los casos en los que estamos hablando de Machine Learning y, sobre todo, con aproximaciones supervisadas. No solo es necesario un volumen elevado de datos con los que trabajar, sino que también hace falta que los datos estén balanceados (por ejemplo, en el caso de un sistema de clasificación, que todas las clases tengan un número más o menos equilibrado de miembros); que no incluyan mucho ruido (datos erróneos o mal etiquetados); y que sean suficientemente representativos de la variabilidad del problema que se quiere resolver.
Para grandes conjuntos de datos, la limpieza y adecuación antes de su aprovechamiento por algoritmos de inteligencia artificial es un problema en sí mismo cuya resolución no siempre es sencilla. Recientemente, para contrarrestar los problemas derivados de la disponibilidad de datos, se están empezando a considerar aproximaciones que permiten el uso de un menor número de muestras (few-shot learning), modelos que aprenden de sus propios datos sin etiquetar (self-supervised), o modelos que aprenden de forma progresiva obteniendo mejores resultados a medida que incluyen más información (continual learning). Sin embargo, algunas de estas estrategias se encuentran todavía en fases tempranas de investigación y se requiere un nivel de experiencia todavía mayor para poder aplicarlas.
La especialización del equipo humano encargado de crear las soluciones basadas en Inteligencia Artificial es la última de las claves a tener en cuenta para el éxito en esta tarea. A pesar de la elevada disponibilidad hoy en día tanto de herramientas como de información y elementos formativos para el despliegue de sistemas basados en IA, es necesario hacer una clara distinción entre la aplicación de algoritmos a modo de “caja negra” (accesible actualmente a cualquier persona con unos conocimientos básicos de informática gracias a la multitud de recursos en la web) y la comprensión, la adaptación y la especialización de dichos algoritmos para la resolución de problemas específicos con unos requisitos de eficiencia y eficacia elevados.
Tercer paso: estrategia de IA en la empresa
Las empresas pueden optar por diferentes caminos a la hora de aproximarse a la resolución de problemas en su negocio usando sistemas de Inteligencia Artificial. A continuación, os mostramos las distintas estrategias que las empresas pueden seguir, en función de su grado de novedad con respecto a lo disponible en el mercado:
Contribuciones disruptivas sobre el estado del arte
En esta posición se encuentran aquellos que realizan mejoras sobre la base fundamental de la IA (interpretabilidad, generalización, eficiencia en el uso de datos…). Se trata de un posicionamiento que garantiza una muy alta diferenciación con respecto a otros actores, pero a costa de una complejidad elevada que hace que las soluciones creadas se encuentren por lo general lejos de la aplicación en casos de uso prácticos.
Aquí se encuentran únicamente los centros de investigación y universidades más especializadas, así como los grandes contribuidores internacionales como Google, Facebook, Baidu, etc.
Contribuciones incrementales al estado del arte
En esta posición se incluyen aquellos que realizan modificaciones sobre esquemas conocidos para mejorar sus prestaciones o resolver problemas específicos del dominio no cubiertos previamente. A pesar de contar con un grado de contribución a la base fundamental de la IA menor que los anteriores, sus aportaciones les permiten diferenciarse y tener un gran valor en campos de aplicación concretos, a costa de requerir un tiempo de desarrollo mayor que otros actores más adelante en la cadena.
En este punto se encuentran típicamente la mayor parte de la comunidad académica actual y los centros tecnológicos punteros en la materia como DeepMind, OpenAI, el Alan Turing Institute for Data Science and AI, etc.
Implementación de resultados del estado del arte
Esta estrategia es la elegida por los que realizan principalmente análisis de resultados académicos y buscan su aplicación a problemas concretos de dominio. El valor aportado se aleja de la base fundamental de la IA y se centra en la resolución de problemas prácticos, con un tiempo de implantación menor que en casos anteriores. Sin embargo, sigue requiriendo un elevado nivel de conocimiento de los algoritmos y herramientas de IA para encontrar las soluciones óptimas en cada caso, así como dominio de las características propias del sector de aplicación.
Este es el posicionamiento típico de los centros de I+D aplicada.
Entrenamiento propio de frameworks y algoritmos open source
En este punto se encuentran aquellos que hacen un adecuado uso de resultados y herramientas ya existentes, realizando el entrenamiento o la configuración de los algoritmos de IA con conjuntos de datos específicos del dominio.
A pesar de contar con un grado de innovación menor que los casos anteriores y de depender de resultados externos para ofrecer soluciones, su valor se encuentra en la rapidez con la que son capaces de llevar los sistemas de IA a la realidad, pudiendo resultar muy relevantes en problemas bien conocidos. La gran mayoría de empresas integradoras de soluciones y consultoría tecnológica se encuentran en este punto.
Utilización de modelos entrenados por terceros
Finalmente, en los casos en los que es posible debido a la globalidad de los problemas encontrados o a la disponibilidad de datos de interés para los investigadores de fases previas en la cadena, se pueden encontrar ejemplos de aplicación directa de modelos pre-entrenados para casos de uso definidos.
Este es quizás el caso menos habitual, dado que se tienen que dar una serie de condiciones muy específicas para que pueda aplicarse, pero por contra tiene la enorme ventaja de ser la opción con menor riesgo técnico y menor tiempo de puesta en marcha.
Cuarto paso: #FutureBeginsToday
Si hay algo que no se puede discutir es que vivimos en una época de esplendor de las tecnologías de Inteligencia Artificial y que, de una forma u otra, van a suponer un cambio disruptivo en la forma en que muchos de los problemas actuales encuentran solución.
Desde el punto de vista de los ‘propietarios’ de dichos problemas (las empresas) -que no tienen por qué ser de ámbito tecnológico-, todo el auge de este tipo de tecnologías se convierte más en un obstáculo a la hora de encontrar compañeros con los que trabajar para darles respuesta que en una ventaja, ya que resulta terriblemente complicado diferenciar entre propuestas adecuadas y con valor y otras que, aunque probablemente bien intencionadas, carezcan de la solidez y de la especialización tecnológica requerida.
Es habitual que una empresa desee incorporar tecnologías Deep Learning para resolver un problema concreto, incurriendo en un coste muy elevado tanto de implantación como de computación, sin que sea realmente necesario. Lo principal es realizar un análisis exhaustivo previo, que nos permita determinar cuál es nuestro problema y la necesidad que tiene nuestra empresa. Hemos comprobado que, en algunas ocasiones, es posible implementar soluciones que aportan mejores resultados (y que son más económicas) empleando técnicas de Machine Learning tradicionales. Con esto no queremos decir que los algoritmos más avanzados no sean necesarios, sino que lo más importante es encontrar la herramienta óptima para resolver un problema concreto, y que se trata de una tarea que va mucho más allá de modas y requiere un conocimiento profundo de la tecnología.
Nuestra recomendación para incorporar tecnologías de IA en cualquiera de los procesos de un negocio es contar siempre con la ayuda de especialistas que puedan nos guiar tanto en la definición del problema como en el diseño y la aplicación de soluciones desde un punto de vista neutral, crítico e informado.
Referencias
Došilović, F. K., Brčić, M., & Hlupić, N. (2018). Explainable artificial intelligence: A survey. 2018 41st International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO), 0210–0215. https://doi.org/10.23919/MIPRO.2018.8400040
Mc Carthy, J., Minsky, M. L., Rochester, N., & Shannon, C. E. (n.d.). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. Retrieved from https://aaai.org/ojs/index.php/aimagazine/article/view/1904/1802
Puppe, F. (1993). Characterization and History of Expert Systems. In F. Puppe (Ed.), Systematic Introduction to Expert Systems: Knowledge Representations and Problem-Solving Methods (pp. 3–8). https://doi.org/10.1007/978-3-642-77971-8_1
Autores: David Chaves Diéguez, responsable de Tecnología; y David Jiménez Cabello, responsable técnico de Biometría en el área de Información Multimodal de Gradiant