Llama-3.1 Nemotron-70B de Nvidia supera a gigantes de IA como GPT-4o y Claude 3.5
La reconocida empresa de tecnología Nvidia ha lanzado en silencio su último modelo de lenguaje de código abierto, denominado Llama-3.1-Nemotron-70B-Instruct. Este nuevo modelo ha demostrado superar a competidores destacados en la industria, como GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic, en varias pruebas clave de rendimiento.
Diseñado específicamente por Nvidia, el Llama-3.1-Nemotron-70B-Instruct se presenta como una herramienta valiosa para generar respuestas tanto generales como para consultas relacionadas con programación.
Un modelo ligero que ofrece lo mismo que otros gigantes
Su avanzada arquitectura y metodologías de entrenamiento lo convierten en un modelo ligero, especialmente en comparación con versiones más pesadas como GPT-4o mini y los modelos Llama de Meta.
El modelo Llama 3.1 Nemotron-70B se basa en la arquitectura Llama 3.1, que utiliza tecnología de transformadores. Con sus 70 mil millones de parámetros, es capaz de procesar y generar respuestas similares a las humanas, caracterizadas por su coherencia y fluidez.
En términos de rendimiento, este modelo ha logrado puntuaciones destacadas en benchmarks de alineación, como Arena Hard (85.0), AlpacaEval 2 LC (57.6) y GPT-4-Turbo MT-Bench (8.98).
Modelo liberado para todos
Los resultados obtenidos muestran que el nuevo Llama-3.1-Nemotron-70B supera a GPT-4o y Claude 3.5 Sonnet en múltiples métricas. Cabe destacar que, a pesar de su menor tamaño, con solo 70B de parámetros, este modelo ha demostrado su eficacia.
Nvidia ha liberado para todos este modelo, así como su modelo de recompensa y conjunto de datos de entrenamiento, a través de Hugging Face, permitiendo que los usuarios lo prueben en una vista previa en el sitio oficial de la empresa.
Si bien Nvidia es conocida por sus logros en la fabricación de chips, su reciente enfoque en el desarrollo de modelos de inteligencia artificial de alto rendimiento es notable. El modelo Nemotron es un claro ejemplo de que modelos más pequeños y eficientes pueden competir e incluso superar a algunos de los líderes en la industria.
Fuente: Nvidia