DeepSeek: ¿es lo mismo pero más barato?

DeepSeek-R1: el modelo de razonamiento de inteligencia artificial que está revolucionando el sector por tener menores costos pero con excelente rendimiento

En noviembre de 2023, la empresa china de tecnología DeepSeek presentó al mundo su primer gran modelo de lenguaje, DeepSeek Coder. Sin embargo, no fue hasta enero de 2025 cuando esta compañía captó la atención de todo el público interesado en tecnología e inteligencia artificial. La razón de su fama: su modelo DeepSeek-R1, un modelo de razonamiento que, en poco tiempo, logró igualar en rendimiento a los modelos de lenguaje líderes del mercado. Las empresas que dominaban el panorama de la inteligencia artificial vieron surgir desde oriente un nuevo competidor que superaba con honores las pruebas relacionadas con matemáticas, programación, reconocimiento de patrones y razonamiento complejo.

No obstante, el desafío que plantea DeepSeek va más allá de la simple aparición de un nuevo competidor en el mercado de la inteligencia artificial. Por un lado, el modelo DeepSeek-R1 se entrenó utilizando aproximadamente 2,000 GPU Nvidia H800 durante 55 días, con un costo de alrededor de 5.58 millones de dólares, sustancialmente menor que los 100 millones de dólares estimados que OpenAI gastó en modelos similares. Por otro lado, el modelo y su código fuente se han publicado bajo la licencia MIT, una de las licencias de código abierto más permisivas, lo que permite a los desarrolladores utilizar, modificar y comercializar el modelo sin restricciones significativas.

Por ello, DeepSeek no es solo un nuevo competidor, sino más bien un cambio de paradigma en el desarrollo moderno de modelos de lenguaje e inteligencia artificial. Se trata de un modelo con las mismas capacidades que sus pares occidentales, pero con un costo de entrenamiento y uso significativamente menor. Estas reducciones en los requerimientos computacionales, tanto en la fase de entrenamiento como en la de inferencia, han traído consigo grandes consecuencias financieras a un tercero: la empresa líder en el diseño de unidades de procesamiento para computación de alto rendimiento, Nvidia.

Tras el lanzamiento del modelo DeepSeek-R1, las acciones de Nvidia experimentaron una caída significativa, alcanzando su punto más crítico el lunes 27 de enero, cuando descendieron aproximadamente un 17%, lo que resultó en una pérdida de cerca de 600 mil millones de dólares en valor de mercado. Esta fue la mayor pérdida en un solo día para cualquier empresa en la historia. La caída fue impulsada por las preocupaciones de los inversores de que los modelos de IA de DeepSeek podrían reducir la demanda de las GPU de gama alta de Nvidia, fundamentales para entrenar modelos de inteligencia artificial de gran escala.

En definitiva, DeepSeek no solo desafía el liderazgo occidental en inteligencia artificial, sino que también replantea las reglas del juego. Con estos la compañía china invita a repensar el futuro de la tecnología. Sin embargo, esta revolución viene acompañada de inquietudes sobre la seguridad y la integridad de los datos en un contexto de creciente rivalidad económica, científica y tecnológica. Así, el debate se amplía: ¿estaremos preparados para un futuro en el que la innovación y la protección de la información deban coexistir en equilibrio? Solo el tiempo y una regulación acertada podrán responder a esta pregunta, marcando el inicio de una nueva era en la inteligencia artificial.

Compartir en: