- ← Retour aux ressources
- /La IA de $6 Millones Que Hizo Caer las Acciones de Nvidia
La IA de $6 Millones Que Hizo Caer las Acciones de Nvidia
Cómo una startup china entrenó una IA por $6 millones que rivaliza con modelos que costaron $100 millones, y envió ondas de choque a través de Silicon Valley.
¿Qué pasaría si pudieras entrenar un modelo de IA por $6 millones que rivalizara con uno que costó $100 millones? Imposible, ¿verdad? Eso es lo que todos pensaban, hasta que DeepSeek R1 se lanzó el 20 de enero de 2025.
Esta es la historia de la IA que envió ondas de choque a través de Silicon Valley.
Las Suposiciones Que Todos Hicieron
Antes de enero de 2025, la carrera de IA parecía sencilla: quien gastara más dinero ganaría.
OpenAI gastó aproximadamente $100 millones entrenando GPT-4. Google y Anthropic invirtieron cantidades similares en sus modelos. La suposición era simple: la IA de frontera requería recursos de frontera.
Escalar significaba comprar miles de los chips más caros (H100 de Nvidia a más de $30,000 cada uno), ejecutarlos durante meses y tener los mejores investigadores que el dinero pudiera comprar.
China parecía permanentemente atrás en esta carrera. Los controles de exportación de EE.UU. prohibían vender chips avanzados a empresas chinas. Sin hardware de vanguardia, ¿cómo podrían competir?
Esa suposición estaba a punto de romperse.
El Avance de DeepSeek
El 20 de enero de 2025, una startup china llamada DeepSeek lanzó R1, su último modelo de IA. El anuncio incluía un detalle que hizo que los ejecutivos tecnológicos de todo el mundo se detuvieran a leer de nuevo.
Costo de entrenamiento: $6 millones.
Eso no es un error tipográfico. Mientras que OpenAI gastó $100 millones en GPT-4, DeepSeek logró un rendimiento similar por 1/16 del costo.
Cómo Lo Hicieron
DeepSeek usó aprendizaje por refuerzo puro, dejando que la IA aprendiera a través de prueba y error en lugar de retroalimentación humana costosa. Optimizaron cada aspecto del entrenamiento para exprimir el máximo rendimiento del hardware menos costoso.
Entrenaron en chips que ni siquiera eran los modelos más recientes, trabajando alrededor de las restricciones de exportación de EE.UU. a través de ingeniería inteligente en lugar de gasto de fuerza bruta.
¿El resultado? Una IA que igualaba el modelo de razonamiento o1 de OpenAI en benchmarks clave, a una fracción del costo.
El Impacto Inmediato
La respuesta fue rápida y dramática.
La Toma de la App Store
En 48 horas, la aplicación de DeepSeek encabezó las listas de descargas en la App Store de EE.UU., superando a ChatGPT. Para el 27 de enero, era la aplicación gratuita más descargada globalmente.
Millones de personas la probaron, curiosos sobre el competidor chino de ChatGPT. Muchos quedaron impresionados. La calidad era real, no exageración.
El Pánico del Mercado de Valores
El 27 de enero de 2025, las acciones de Nvidia cayeron 18% en un solo día, eliminando casi $600 mil millones en valor de mercado.
La lógica fue brutal: Si las empresas de IA podían entrenar modelos de frontera por 1/16 del costo, necesitarían muchos menos chips costosos de Nvidia. Todo el auge de infraestructura de IA podría haber sido excesivo.
Otras acciones de hardware de IA también se desplomaron. El mercado estaba recalculando toda la cadena de suministro de IA.
La Llamada de Atención de Silicon Valley
Los ejecutivos tecnológicos e inversores tuvieron que confrontar una realidad incómoda: podrían haber estado gastando mucho más de lo necesario.
Si DeepSeek podía hacer esto con $6 millones y chips con restricciones de exportación, ¿qué habían estado haciendo mal todos los demás? ¿Estaban construyendo ineficientemente? ¿Pagando de más por hardware? ¿Perdiendo optimizaciones obvias?
Las suposiciones que sustentaban miles de millones en inversión de IA de repente parecían cuestionables.
Por Qué Esto Importa
DeepSeek R1 representó más que solo una forma más barata de entrenar IA. Desafió suposiciones fundamentales sobre el futuro.
1. La Guerra de Chips Se Complica
Los controles de exportación de EE.UU. se suponía que mantendrían a China atrás en el desarrollo de IA. DeepSeek probó que el ingenio podía vencer la ventaja de recursos.
No necesitas los mejores chips absolutos si eres inteligente sobre cómo los usas. Esto complica significativamente la estrategia de contención tecnológica de Estados Unidos.
2. La Carrera de IA No Se Trata Solo de Dinero
Durante años, la narrativa fue simple: quien gasta más gana. DeepSeek mostró que el ingenio de ingeniería importa más que el gasto bruto.
Esta es en realidad una buena noticia para jugadores más pequeños e investigadores. No necesitas el presupuesto de Google o Microsoft para contribuir a la IA de frontera.
3. Los Pesos Abiertos Lo Cambian Todo
DeepSeek lanzó los pesos del modelo R1 públicamente. Cualquiera podía descargarlos y estudiarlos. Esta transparencia aceleró la investigación globalmente y creó nuevas dinámicas competitivas.
Los modelos cerrados como GPT-4 y Claude ahora compiten contra alternativas abiertas capaces que no cuestan nada acceder.
El "Momento Sputnik de la IA"
Los observadores de la industria llamaron al lanzamiento de DeepSeek el "momento Sputnik de la IA", haciendo referencia a cuando el lanzamiento del satélite soviético en 1957 impactó a Estados Unidos y aceleró la carrera espacial.
La comparación encaja. Así como Sputnik desafió suposiciones sobre el liderazgo tecnológico, DeepSeek desafió suposiciones sobre el desarrollo de IA.
Silicon Valley pensó que estaban cómodamente adelante. De repente, se dieron cuenta de que la competencia estaba más cerca, y más inteligente, de lo esperado.
La Reacción y Las Preguntas
No todos aceptaron las afirmaciones de DeepSeek al pie de la letra.
Los escépticos cuestionaron si la cifra de $6 millones era precisa o exageración de marketing. ¿Incluía todos los costos? ¿Qué pasa con la infraestructura? ¿Los experimentos fallidos?
Otros notaron que DeepSeek construyó sobre años de investigación abierta, no comenzaron desde cero. Pararse sobre los hombros de gigantes es inteligente, pero afirmar que escalaste solo es engañoso.
Los investigadores de seguridad expresaron preocupaciones sobre los modelos de IA chinos accediendo a datos sensibles. ¿Podría DeepSeek usarse para vigilancia o recopilación de datos?
Estas preguntas permanecieron parcialmente sin respuesta, pero no disminuyeron el logro central: DeepSeek había probado que la IA de frontera podía construirse mucho más eficientemente de lo que se pensaba.
¿Dónde Están Ahora?
DeepSeek continúa operando y mejorando R1, con millones de usuarios activos globalmente. La empresa, respaldada por el fondo de cobertura chino High-Flyer, se ha convertido en un jugador importante en el espacio de IA prácticamente de la noche a la mañana.
Más importante, DeepSeek cambió la conversación. Las empresas de IA ahora están luchando por optimizar su eficiencia de entrenamiento. La estrategia de "gastar más dinero" de repente parece derrochadora.
Las acciones de Nvidia se han recuperado algo, pero el desplome de enero de 2025 sirvió como recordatorio: las suposiciones sobre las necesidades de infraestructura de IA podrían estar equivocadas. El mercado sigue siendo más volátil e incierto que antes de DeepSeek.
EE.UU. y China están reevaluando sus estrategias de IA. Los controles de exportación podrían no proporcionar la ventaja que Washington esperaba. Y las empresas chinas podrían ser más competitivas de lo que nadie esperaba.
DeepSeek R1 no solo desafió a OpenAI o Google. Desafió todo el marco para pensar sobre el desarrollo de IA. Al hacerlo, hizo que la carrera de IA fuera más abierta, más global y más impredecible que nunca.
El 20 de enero de 2025 fue el día en que Silicon Valley aprendió que la eficiencia vence al exceso, y que la carrera de IA estaba lejos de terminar.