Meta anunció la semana pasada el lanzamiento de una inteligencia artificial (IA) capaz de completar imágenes utilizando el “sentido común”. A diferencia de otras herramientas disponibles, el modelo de Meta no se limita a comparar píxeles, sino que puede comprender representaciones abstractas basadas en un “conocimiento previo sobre el mundo”.
IA con sentido común
Según la empresa, esta capacidad permite al modelo completar imágenes con una precisión superior a la de otras herramientas en el mercado.
El nombre dado a esta innovadora tecnología es Image Joint Embedding Predictive Architecture (Arquitectura predictiva de incrustación conjunta de imágenes, I-JEPA), y se basa en la visión del científico jefe de IA de Meta, Yann LeCun.
La idea fundamental detrás de esta iniciativa es “crear máquinas que puedan aprender modelos internos de cómo funciona el mundo”, según se publicó en el blog oficial de la empresa. Sistemas como ChatGPT se entrenan utilizando el método de aprendizaje “supervisado”, que implica utilizar un extenso conjunto de datos etiquetados.
Sin embargo, I-JEPA, desarrollado por Meta, la empresa matriz de Facebook, Instagram y WhatsApp, utiliza un enfoque diferente. En lugar de utilizar datos etiquetados, I-JEPA analiza directamente imágenes o sonidos, en lo que se conoce como aprendizaje auto supervisado.
Conocimiento previo para entrenamiento
Meta explicó que este método se basa en el principio de que, al mostrar dibujos de vacas a niños pequeños repetidamente, eventualmente aprenderán a reconocer cualquier vaca que vean. De manera similar, I-JEPA puede identificar representaciones a través de comparaciones y análisis, sin necesidad de datos etiquetados.
La compañía ha compartido un ejemplo en el que su IA pudo llenar los vacíos en imágenes de diferentes animales y paisajes. Utilizando el contexto y el reconocimiento semántico, el modelo pudo identificar qué partes faltaban, como la cabeza de un perro o la pata de un pájaro.
Yann LeCun, en una publicación de febrero de 2022, explicó que tanto los seres humanos como los animales son capaces de adquirir un vasto conocimiento previo sobre cómo funciona el mundo a través de la observación, con una cantidad relativamente pequeña de interacciones y sin supervisión.
Este conocimiento acumulado, planteaba LeCun, podría constituir la base de lo que comúnmente conocemos como “sentido común”. Es precisamente este “sentido común” el que guía a los modelos de IA para comprender lo que es probable, posible o imposible.
Mayor precisión que otras IA´s
Por esta razón, Meta afirma que su modelo I-JEPA evita errores comunes en imágenes generadas por otras IA, como manos con más de cinco dedos. Gracias a su capacidad de entender el contexto y utilizar el conocimiento previo, el modelo de Meta logra una mayor precisión en la generación de imágenes completas.
Los sistemas de inteligencia artificial (IA) basados en conjuntos de datos etiquetados, como ChatGPT, suelen ser altamente efectivos para tareas específicas en las que han sido entrenados. Sin embargo, Meta destacó en uno de sus informes de investigación de 2021 que “es imposible etiquetar todo en el mundo”.
Además, existen tareas para las que simplemente no hay suficientes datos etiquetados disponibles. Meta sostiene que, si los sistemas de IA pueden adquirir una comprensión más profunda de la realidad más allá de su entrenamiento, serán más útiles y, en última instancia, se acercarán más a la inteligencia humana.
En 2021, Meta comparó el logro del “sentido común” en la IA con descubrir la materia oscura. La empresa cree que este tipo de IA tendría la capacidad de aprender de manera más rápida, planificar cómo abordar tareas complejas y adaptarse fácilmente a situaciones desconocidas. Para Meta, alcanzar el “sentido común” representa un hito crucial que impulsaría el potencial de la IA a niveles más cercanos a la inteligencia humana.