Google ha presentado su primer modelo de inteligencia artificial centrado en el razonamiento, Gemini 2.0 Flash Thinking, lo que representa un avance significativo en las capacidades de la IA.
Este modelo experimental se posiciona como un competidor directo de la serie o1 de OpenAI y cuenta con una característica innovadora: el “Modo de Pensamiento“, que demuestra explícitamente el proceso de razonamiento mientras resuelve problemas complejos.
Uno de los cambios más importantes para Gemini
Según Google, esta función mejora las habilidades analíticas en comparación con el modelo base Gemini 2.0 Flash, estableciendo un nuevo estándar para un razonamiento de IA más transparente y efectivo.
El Modo de Pensamiento está disponible como una función experimental a través de Google AI Studio y Vertex AI, lo que permite a los desarrolladores acceder a él mediante la API de Gemini.
Jeff Dean, Científico Principal de Google DeepMind, compartió detalles sobre este revolucionario modelo a través de una publicación en X (anteriormente Twitter). Construido sobre la base del modelo Gemini 2.0 Flash, el Modo de Pensamiento está diseñado para mejorar el razonamiento al mostrar explícitamente cómo la IA llega a sus conclusiones.
Explicación paso a paso de las respuestas
Un video de demostración compartido por Dean ilustró la capacidad del modelo para resolver problemas complejos de física, desglosándolos en componentes más pequeños y manejables. Este razonamiento paso a paso proporciona a los usuarios una comprensión clara de cómo la IA llega a sus soluciones.
Por otro lado, Logan Kilpatrick, Líder de Producto de Google AI Studio, mostró otro video demostrativo en el que el modelo resuelve un problema matemático que involucra entradas tanto de texto como de imágenes.
A principios de este mes, Google lanzó la serie Gemini 2.0, que introdujo avanzadas capacidades multimodales, incluyendo salidas nativas de imagen y audio. La serie también presentó nuevas herramientas y prototipos diseñados para redefinir la funcionalidad de la IA.
Prototipos clave de Gemini 2.0
- Project Astra: Un asistente universal de IA presentado en Google I/O 2024, capaz de “recordar” entradas visuales y auditivas mediante la cámara y el micrófono de un teléfono inteligente.
- Project Mariner: Un prototipo que razona a partir de información del navegador, incluyendo texto, código e imágenes, utilizando una extensión experimental de Chrome para la finalización de tareas.
- Jules: Un agente de codificación especializado en enfrentar desafíos de programación, crear planes y ejecutarlos con la supervisión de desarrolladores.
- Gaming Agents: Agentes que ayudan a los jugadores a navegar por entornos virtuales razonando sobre el juego y ofreciendo sugerencias en tiempo real.
El modelo Gemini 2.0 Flash Thinking está preparado para transformar la interacción de la IA con los usuarios, ofreciendo no solo soluciones, sino también explicaciones detalladas sobre su proceso de resolución de problemas. Esta transparencia podría abrir el camino para una adopción más amplia en áreas como la educación, la ciencia y el desarrollo de software.
Con el impulso de Google hacia la innovación en el razonamiento multimodal y las experiencias ágiles, la serie Gemini 2.0 se erige como una muestra del compromiso de la compañía por mantenerse a la vanguardia en el acelerado panorama de la inteligencia artificial.
Fuente: Google