La startup china de inteligencia artificial (IA), DeepSeek, está sacudiendo los cimientos de los mercados tecnológicos globales, poniendo en duda las valoraciones infladas de los gigantes tecnológicos estadounidenses.
El modelo R1 de la compañía, lanzado el 10 de enero, ha demostrado que se pueden desarrollar sistemas de IA competitivos con una fracción de los recursos que normalmente requieren los líderes de la industria.
Esto hizo que los los futuros del Nasdaq 100 cayeran más de un 5 % el lunes. Mientras los inversores se enfrentan a las implicaciones, algunos se hacen una pregunta apremiante: ¿DeepSeek acaba de estallar la burbuja del mercado de valores tecnológico de EE. UU.?
Nvidia, el modelo de la Auge de la IA, vio caer sus acciones más de 13% en operaciones previas a la comercialización.
En el centro de la agitación está la eficiencia revolucionaria de DeepSeek R1. A diferencia de los modelos desarrollados por OpenAI y Meta que dependen de hardware costoso y de alto rendimiento, R1 logró un rendimiento comparable utilizando las GPU H800 de Nvidia, chips de menor calidad restringidos por las sanciones de EE. UU.
Relacionado: Cómo DeepSeek R1 supera a ChatGPT o1 bajo sanciones, redefiniendo la eficiencia de la IA utilizando solo 2048 GPU
Este logro ha interrumpido una larga trayectoria suposiciones sobre la necesidad de un gasto masivo en infraestructura para el desarrollo de la IA y generó nuevas preocupaciones sobre la sostenibilidad del modelo de negocio de Silicon Valley.
DeepSeek R1: un rival rentable para Silicon Valley
El modelo R1 de DeepSeek es un hito en la innovación en IA, y rápidamente alcanzó el primer puesto en la App Store de Apple en EE. UU. apenas unos días después de su lanzamiento. Al ofrecer transparencia en sus procesos de razonamiento, la aplicación ha sido elogiada por su capacidad para resolver consultas complejas de manera eficiente. Las reseñas de los usuarios destacan su accesibilidad y confiabilidad, en contraste con los enfoques que consumen muchos recursos adoptados por sus contrapartes estadounidenses.
El modelo se entrenó utilizando 2048 GPU Nvidia H800 con un costo total de menos de $6 millones, según un informe de diciembre de 2024. artículo de investigación publicado por DeepSeek. Estas GPU, diseñadas intencionalmente con capacidades reducidas para cumplir con las restricciones de exportación de EE. UU., presentaron desafíos únicos.
Sin embargo, los ingenieros de DeepSeek desarrollaron técnicas de optimización novedosas para minimizar los requisitos computacionales y de memoria, logrando puntos de referencia de rendimiento del 97,3 % en MATH-500 y del 79,8 % en AIME 2024.
El fundador Liang Wenfeng, un ex administrador de fondos de cobertura, describió la estrategia de la compañía: “Estimamos que los mejores modelos nacionales y extranjeros pueden tener una brecha de un solo pliegue en la estructura del modelo y la dinámica de capacitación. Por esta razón, necesitamos consumir cuatro veces más potencia informática para lograr el mismo efecto. Lo que tenemos que hacer es reducir continuamente estas brechas”[36Kr].
Efectos dominó en los mercados globales
La liberación de R1 desencadenó una fuerte liquidación en Las acciones tecnológicas globales de Nvidia, cuyas GPU se consideran ampliamente esenciales para el desarrollo de la IA, vieron caer su valoración en miles de millones. href=”https://www.cnbc.com/quotes/ASML?qsearchterm=ASML%20Holding”>ASML Holding NV también sufrió una caída del 11%, mientras que los futuros del Nasdaq 100 registraron volúmenes de negociación cuatro veces superiores al promedio diario. A primera hora del lunes, los inversores están reevaluando los fundamentos financieros del sector de la IA, que ha impulsado un crecimiento significativo de las acciones tecnológicas durante el año pasado.
Las consecuencias se extienden más allá de EE. UU., y los chinos Acciones relacionadas con la IA como Merit Interactive Co. aumentó hasta un 20% en respuesta al éxito de DeepSeek. El índice tecnológico Hang Seng subió antes del Año Nuevo Lunar, lo que refleja optimismo sobre la creciente presencia de China en la innovación en IA.
La dimensión geopolítica: sanciones e innovación
El ascenso de DeepSeek es una respuesta directa a los controles de exportación de Estados Unidos diseñados para limitar el acceso de China a tecnologías avanzadas. Desde 2021, estas restricciones tienen como objetivo impedir el desarrollo de sistemas de IA competitivos en China restringiendo el acceso a hardware de última generación.
Sin embargo, el uso ingenioso de las GPU H800 por parte de DeepSeek ha demostrado que la innovación puede prosperar incluso en condiciones estrictas. limitaciones.
La estrategia de Liang de almacenar GPU restringidas antes de que las sanciones entraran en pleno efecto fue fundamental. Al centrarse en la eficiencia en lugar de en la potencia computacional bruta, los ingenieros de DeepSeek demostraron cómo las limitaciones pueden impulsar la resolución creativa de problemas.
Yann LeCun, científico jefe de IA de Meta, elogió el espíritu de código abierto detrás del desarrollo de R1 y afirmó: “DeepSeek se ha beneficiado de la investigación y el código abierto (por ejemplo, PyTorch y Llama de Meta). Se les ocurrieron nuevas ideas y las construyeron sobre el trabajo de otras personas”.
Implicaciones para los gigantes tecnológicos estadounidenses
El éxito del modelo R1 de DeepSeek plantea Preguntas incómodas para líderes tecnológicos estadounidenses como Meta y Microsoft, que han invertido miles de millones en infraestructura de inteligencia artificial, Mark Zuckerberg, director ejecutivo de Meta, describió recientemente los ambiciosos planes de la compañía para implementar más de 1,3 millones de GPU en Estados Unidos. 2025, afirmando:”Estamos planeando invertir entre 60.000 y 65.000 millones de dólares en gastos de capital este año y, al mismo tiempo, aumentar significativamente nuestros equipos de IA, y tenemos el capital para seguir invirtiendo en los próximos años”.
Una nueva era para la innovación en IA
El compromiso de DeepSeek con la colaboración de código abierto lo ha diferenciado de los gigantes de la industria. Al publicar la arquitectura y los métodos de capacitación de R1, la compañía ha permitido a los desarrolladores de todo el mundo replicar o mejorar su trabajo.
Esta transparencia contrasta con la naturaleza patentada de plataformas como ChatGPT de OpenAI, lo que destaca un cambio potencial hacia una innovación de IA más accesible.
Los logros de DeepSeek son un recordatorio de que el liderazgo tecnológico no se define únicamente por recursos financieros. Ya sea que esto marque el fin de la burbuja del mercado de valores tecnológico de EE. UU. o un nuevo capítulo en la competencia global de IA, una cosa está clara: las reglas del juego están cambiando.