OpenAI presenta o1, su modelo de IA más avanzado en razonamiento

OpenAI ha lanzado un nuevo modelo llamado o1, el primero de una serie planificada de modelos de “razonamiento” que están diseñados para responder preguntas complejas de manera más rápida que los humanos.

Junto a este modelo, también se ha presentado o1-mini, una versión más pequeña y económica. Y sí, para quienes siguen nuestras noticias relacionadas con OpenAI desde hace unas semanas: este es el esperado modelo “Strawberry”.

Una IA con características humanas

Para OpenAI, el modelo o1 representa un paso más hacia su objetivo de crear inteligencia artificial con características humanas.

En términos prácticos, o1 mejora la capacidad para escribir código y resolver problemas complejos en múltiples pasos, superando a modelos anteriores. Sin embargo, es más costoso y más lento de usar que GPT-4o.

Los usuarios de ChatGPT Plus y Team pueden acceder desde hoy tanto a o1-preview como a o1-mini, mientras que los usuarios Enterprise y Edu lo tendrán disponible la próxima semana. OpenAI planea ofrecer acceso a o1-mini para los usuarios gratuitos de ChatGPT, aunque aún no ha fijado una fecha de lanzamiento.

Modelos más costosos que GPT-4o

El acceso para desarrolladores es considerablemente costoso: en la API, o1-preview cuesta $15 por cada millón de tokens de entrada y $60 por cada millón de tokens de salida, en comparación con los $5 y $15 que cuesta GPT-4o por los mismos tokens.

Según Jerry Tworek, líder de investigación en OpenAI, el entrenamiento detrás de o1 es totalmente diferente al de sus predecesores, aunque los detalles específicos aún no se han revelado. Tworek menciona que o1 ha sido entrenado con un nuevo algoritmo de optimización y un conjunto de datos de entrenamiento específicamente diseñado para él.

Los modelos GPT anteriores fueron entrenados para imitar patrones de datos preexistentes. En cambio, o1 ha sido diseñado para resolver problemas de forma autónoma utilizando aprendizaje por refuerzo, una técnica que enseña al sistema a través de recompensas y castigos.

Además, utiliza una estrategia conocida como “cadena de pensamiento” para procesar consultas de manera similar a cómo los humanos resuelven problemas paso a paso.

Como resultado de esta nueva metodología de entrenamiento, OpenAI afirma que o1 es más preciso. “Hemos notado que este modelo tiene menos alucinaciones, afirma Tworek, aunque admite que el problema no ha sido completamente resuelto.

La principal diferencia entre o1 y GPT-4o es su capacidad para abordar problemas complejos, como la codificación y las matemáticas, de una manera mucho más eficiente, según OpenAI.

Capacidades equivalentes a un estudiante de doctorado

“Este modelo es definitivamente mejor resolviendo pruebas de matemáticas de nivel AP que yo, y eso que estudié matemáticas en la universidad”, comenta Bob McGrew, director de investigación de OpenAI.

McGrew también reveló que o1 fue probado en un examen de clasificación para la Olimpiada Internacional de Matemáticas, donde GPT-4o solo resolvió correctamente el 13% de los problemas, mientras que o1 alcanzó el 83%.

En competiciones de programación en línea, conocidas como Codeforces, o1 logró posicionarse en el percentil 89 de los participantes. OpenAI asegura que la próxima actualización de este modelo tendrá un rendimiento comparable al de estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología.

A pesar de sus avances, o1 no es tan competente como GPT-4o en varias áreas. No se desempeña tan bien en el conocimiento factual sobre el mundo y tampoco tiene la capacidad de navegar por la web o procesar archivos e imágenes.

¿En verdad es una IA capaz de razonar por sí sola?

Este modelo no piensa realmente, ni es humano. ¿Entonces, por qué diseñarlo para que parezca que lo es? Según Tworek, la intención no es equiparar el pensamiento de la IA con el humano, sino mostrar que o1 dedica más tiempo a procesar y profundizar en la resolución de problemas.

Aunque los modelos de lenguaje actuales no son verdaderamente inteligentes, OpenAI está apostando por llevar las capacidades de razonamiento a estos sistemas porque cree en un futuro con sistemas autónomos que puedan tomar decisiones y realizar acciones por sí mismos.

Para los investigadores de IA, dominar el razonamiento es un paso clave hacia la inteligencia de nivel humano, lo que podría abrir la puerta a avances en áreas como la medicina y la ingeniería.

Por ahora, las habilidades de razonamiento de o1 son relativamente lentas y costosas, pero para OpenAI, este es un avance crucial en el camino hacia una IA con capacidades más humanas.

Fuente: OpenAI

Salir de la versión móvil