Pocos días después del lanzamiento de Llama 3.1, el modelo más grande de Meta, fundada por Mark Zuckerberg, la compañía francesa de inteligencia artificial Mistral presentó su último modelo de IA, llamado Large 2.
Una versión más potente de Mistral
Mistral afirma que el nuevo modelo iguala o incluso supera el rendimiento de los modelos recientes de OpenAI y Meta, logrando esto con un número significativamente menor de parámetros.
La empresa afirmó que con Mistral Large 2 continúa superando los límites de la eficiencia de costos, velocidad y rendimiento. El nuevo modelo de IA está disponible en su plataforma que ofrece acceso a los grandes modelos de lenguaje (LLM) de la compañía.
Además, la empresa afirma que el nuevo modelo viene con nuevas características que permite a los desarrolladores crear aplicaciones de IA innovadoras.
¿Qué tan poderoso es Mistral Large 2?
Mistral Large 2 no solo sobresale en rendimiento sino también en eficiencia de costos. La compañía afirma haber alcanzado una precisión del 84.0% en MMLU, un nuevo estándar para modelos abiertos.
Se ha entrenado extensamente en código y supera significativamente a sus predecesores, incluso igualando a modelos de primer nivel como Anthropic’s Claude 3 Opus, GPT-4o y Llama 3.1 405B.
Mistral afirmó que con el nuevo modelo se ha enfocado en mejorar su razonamiento y reducir considerablemente las alucinaciones o información falsa que tanto suele abundar en las respuestas de estos modelos de lenguaje.
Large 2 incluso ha sido entrenado para admitir cuando no tiene la información correcta, lo que ha llevado a un mejor desempeño en benchmarks matemáticos y ha mejorado sus habilidades para resolver problemas.
Según la compañía, Large 2 es un modelo de alto rendimiento, especialmente en lo que respecta a la codificación. Alcanzó una precisión del 76.9% en promedio en varios lenguajes de programación.
Comparación con la versión anterior
En comparación con Large 1, que tiene una precisión promedio del 60.4%, Large 2 mostró una mejora significativa. Además, supera a modelos como Llama 3.1 405B y Llama 3.1 70B en varios idiomas y está a la par con GPT-4o en muchos benchmarks, según Mistral.
Basándose en los datos de la compañía, Large 2 es evidentemente fuerte en Python y TypeScript. Esto lo hace ideal para desarrolladores que trabajan con estos lenguajes.
También mostró un buen rendimiento en Java y PHP, y los avances demuestran que Large 2 es capaz de manejar tareas de programación complejas con mayor precisión.
Fuente: Mistral