Llama-3.1 Nemotron-70B de Nvidia supera a gigantes de IA como GPT-4o y Claude 3.5

18 octubre, 2024

La reconocida empresa de tecnología Nvidia ha lanzado en silencio su último modelo de lenguaje de código abierto, denominado Llama-3.1-Nemotron-70B-Instruct. Este nuevo modelo ha demostrado superar a competidores destacados en la industria, como GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic, en varias pruebas clave de rendimiento.

Diseñado específicamente por Nvidia, el Llama-3.1-Nemotron-70B-Instruct se presenta como una herramienta valiosa para generar respuestas tanto generales como para consultas relacionadas con programación.

Un modelo ligero que ofrece lo mismo que otros gigantes

Su avanzada arquitectura y metodologías de entrenamiento lo convierten en un modelo ligero, especialmente en comparación con versiones más pesadas como GPT-4o mini y los modelos Llama de Meta.

El modelo Llama 3.1 Nemotron-70B se basa en la arquitectura Llama 3.1, que utiliza tecnología de transformadores. Con sus 70 mil millones de parámetros, es capaz de procesar y generar respuestas similares a las humanas, caracterizadas por su coherencia y fluidez.

En términos de rendimiento, este modelo ha logrado puntuaciones destacadas en benchmarks de alineación, como Arena Hard (85.0), AlpacaEval 2 LC (57.6) y GPT-4-Turbo MT-Bench (8.98).

Modelo liberado para todos

Los resultados obtenidos muestran que el nuevo Llama-3.1-Nemotron-70B supera a GPT-4o y Claude 3.5 Sonnet en múltiples métricas. Cabe destacar que, a pesar de su menor tamaño, con solo 70B de parámetros, este modelo ha demostrado su eficacia.

Nvidia ha liberado para todos este modelo, así como su modelo de recompensa y conjunto de datos de entrenamiento, a través de Hugging Face, permitiendo que los usuarios lo prueben en una vista previa en el sitio oficial de la empresa.

Si bien Nvidia es conocida por sus logros en la fabricación de chips, su reciente enfoque en el desarrollo de modelos de inteligencia artificial de alto rendimiento es notable. El modelo Nemotron es un claro ejemplo de que modelos más pequeños y eficientes pueden competir e incluso superar a algunos de los líderes en la industria.

Fuente: Nvidia

Etiquetas

18 octubre, 2024

Un modelo ligero que ofrece lo mismo que otros gigantes

Modelo liberado para todos

Tiger 13, el nuevo Smartphone 5G de OSCAL

OxygenOS 15 llega este mes con mejoras en multitarea y funciones basadas en IA

Artículos relacionados

OpenAI habilita la búsqueda gratuita de ChatGPT y mejora la experiencia móvil

Salen a la luz nuevos correos entre OpenAI y Musk ante disputa legal

OpenAI actualiza ChatGPT con capacidades visuales y opción de compartir pantalla

Phi-4 de Microsoft, inteligencia artificial más segura y potente integrada en Azure

Adblock Detectado