- ← Retour aux ressources
- /Llama 3: ¿Ha alcanzado finalmente el código abierto a ChatGPT?
Llama 3: ¿Ha alcanzado finalmente el código abierto a ChatGPT?
Meta lanzó Llama 3 el 18 de abril de 2024—modelos de 8B y 70B entrenados en 15 billones de tokens, rivalizando con el rendimiento de clase GPT-4.
El 18 de abril de 2024, Meta lanzó Llama 3—y finalmente, la IA de código abierto igualó a los modelos cerrados en benchmarks principales.
El modelo de 70B compitió directamente con el rendimiento de clase GPT-4. El modelo de 8B superó a modelos anteriores de 13B+. El código abierto se había puesto al día.
Qué Era Nuevo
Datos de entrenamiento: 15 billones de tokens (7x más que Llama 2) Tamaños de modelo: 8B y 70B parámetros inicialmente Rendimiento: Supera a Gemini Pro, rivaliza con GPT-4 en muchas tareas Multilingüe: Mejor rendimiento en idiomas no ingleses Contexto de 8K: 4x más largo que Llama 2
Además: se anunció un modelo de 400B para lanzamiento posterior.
Los Resultados del Benchmark
Llama 3 70B igualó o superó:
- GPT-3.5 en todos los aspectos
- Gemini Pro en la mayoría de tareas
- Claude Sonnet en varios benchmarks
Para código abierto, esto no tenía precedentes.
El Impacto
Desarrolladores: Ahora podían ejecutar modelos de clase GPT-4 localmente Empresas: Sin dependencia de proveedores, control total Startups: Construir productos sin costos de API Investigadores: Avanzar en IA sin guardianes corporativos
El código abierto finalmente era competitivo en capacidad, no solo en costo.
¿Dónde Están Ahora?
Llama 3.1 (julio 2024) trajo el modelo de 405B, genuinamente rivalizando con los mejores modelos cerrados. Llama se convirtió en la fundación del ecosistema de IA de código abierto.
El 18 de abril de 2024 fue cuando la IA de código abierto dejó de ser "buena para código abierto" y se convirtió en "genuinamente competitiva con cualquier cosa."