Grok-2 de xAI desafía a GPT-4 Turbo en el ranking LMSYS

PasionMovil

14 agosto, 2024

xAI, la empresa de inteligencia artificial propiedad de Elon Musk, ha lanzado en versión beta su nueva familia de modelos de IA, Grok-2.

Uso exclusivo para usuarios Premium de X

Estos nuevos modelos, Grok-2 y Grok-2 Mini, fueron presentados el martes con la promesa de capacidades mejoradas en comparación con sus predecesores. Ambos modelos están disponibles exclusivamente para suscriptores de X Premium y Premium+.

Una característica interesante de Grok-2 es su capacidad de generar imágenes, aunque esta función se basa en un modelo de IA externo. La compañía afirma que Grok-2 ha superado a GPT-4 Turbo en diversos benchmarks.

Grok-2: Un Avanzado Modelo de Lenguaje

En una publicación de blog, xAI anunció el lanzamiento de los nuevos modelos Grok y destacó que Grok-2 representa un significativo avance sobre su predecesor, Grok-1.5, con capacidades de vanguardia en chat, codificación y razonamiento.

Grok-2 es considerado un modelo de inteligencia artificial de última generación (SOTA, por sus siglas en inglés), mientras que Grok-2 Mini es una versión más pequeña, diseñada para ofrecer respuestas más rápidas y precisas.

Ambos modelos están integrados en el chatbot Grok y son accesibles para usuarios de X Premium y X Premium+, por lo que es necesario pagar para poder utilizarlos.

Woah, another exciting update from Chatbot Arena❤️‍🔥

The results for @xAI’s sus-column-r (Grok 2 early version) are now public**!

With over 12,000 community votes, sus-column-r has secured the #3 spot on the overall leaderboard, even matching GPT-4o! It excels in Coding (#2),… https://t.co/gqSWSwYN0z pic.twitter.com/j9UYDBYNt4

— lmsys.org (@lmsysorg) August 14, 2024

Desempeño sobresaliente y nueva interfaz

xAI reveló que una versión temprana de Grok, bajo el nombre “sus-column-r”, fue evaluada en el ranking LMSYS (Large Model Systems Organization) y logró superar tanto a Claude 2.5 Sonnet como a GPT-4 Turbo.

Esta información fue confirmada por la cuenta oficial de LMSYS en X, destacando el alto rendimiento de Grok-2 en codificación, matemáticas y tareas desafiantes.

Además del lanzamiento de los nuevos modelos, xAI ha renovado la interfaz de Grok e incorporado nuevas funciones.

Una de las más llamativas es la capacidad de generar imágenes, aunque esta característica se sustenta en el modelo Flux.1, desarrollado por Black Forest Labs. Según informes, este modelo de generación de imágenes carece de filtros de seguridad y puede producir imágenes de políticos.

Fuente: TechCrunch