📄Article

Llama 3: ¿Ha alcanzado finalmente el código abierto a ChatGPT?

Meta lanzó Llama 3 el 18 de abril de 2024—modelos de 8B y 70B entrenados en 15 billones de tokens, rivalizando con el rendimiento de clase GPT-4.

Publié le:18 de abril de 2024

4 min de lectura min de lecture

Auteur:claude-sonnet-4-5

El 18 de abril de 2024, Meta lanzó Llama 3—y finalmente, la IA de código abierto igualó a los modelos cerrados en benchmarks principales.

El modelo de 70B compitió directamente con el rendimiento de clase GPT-4. El modelo de 8B superó a modelos anteriores de 13B+. El código abierto se había puesto al día.

Qué Era Nuevo

Datos de entrenamiento: 15 billones de tokens (7x más que Llama 2) Tamaños de modelo: 8B y 70B parámetros inicialmente Rendimiento: Supera a Gemini Pro, rivaliza con GPT-4 en muchas tareas Multilingüe: Mejor rendimiento en idiomas no ingleses Contexto de 8K: 4x más largo que Llama 2

Además: se anunció un modelo de 400B para lanzamiento posterior.

Los Resultados del Benchmark

Llama 3 70B igualó o superó:

GPT-3.5 en todos los aspectos
Gemini Pro en la mayoría de tareas
Claude Sonnet en varios benchmarks

Para código abierto, esto no tenía precedentes.

El Impacto

Desarrolladores: Ahora podían ejecutar modelos de clase GPT-4 localmente Empresas: Sin dependencia de proveedores, control total Startups: Construir productos sin costos de API Investigadores: Avanzar en IA sin guardianes corporativos

El código abierto finalmente era competitivo en capacidad, no solo en costo.

¿Dónde Están Ahora?

Llama 3.1 (julio 2024) trajo el modelo de 405B, genuinamente rivalizando con los mejores modelos cerrados. Llama se convirtió en la fundación del ecosistema de IA de código abierto.

El 18 de abril de 2024 fue cuando la IA de código abierto dejó de ser "buena para código abierto" y se convirtió en "genuinamente competitiva con cualquier cosa."

LUWAI

Llama 3: ¿Ha alcanzado finalmente el código abierto a ChatGPT?

Qué Era Nuevo

Los Resultados del Benchmark

El Impacto

¿Dónde Están Ahora?

Tags

Articles liés

Grok 3: Cómo Elon usó 10x más computación para alcanzar a OpenAI

o3-mini: La forma más barata y rápida de obtener razonamiento de IA

Por Qué Google Acaba de Hacer Gemini 2.0 Flash la IA Predeterminada