Desde la irrupción de ChatGPT a finales de 2022, la forma en que interactuamos con la tecnología a diario cambió para siempre gracias a los chatbots impulsados por IA, plataformas conectadas a la web para búsquedas avanzadas, respuestas lógicas en segundos, generación y edición de texto de manera conversacional, asistencia en tareas como programación por código, operaciones matemáticas y análisis de datos en tiempo real, todo un segmento de la industria tecnológica que hasta ahora habían acaparado empresas estadounidenses como OpenAI, Google (Gemini), Microsoft (Copilot), Anthropic (Claude) y Meta.
Pero el panorama cambió el pasado lunes con la irrupción de un nuevo jugador: la startup china DeepSeek, que desafía el dominio global de los modelos de inteligencia artificial gringos ofreciendo -como típico producto chino- prácticamente lo mismo, pero más barato.
De hecho, el 27 de enero ese asistente de IA superó a ChatGPT como la app gratuita mejor calificada en la App Store de EE.UU. y su debut sacudió las bolsas de tal forma que provocó un derrumbe de la cotización del fabricante de semiconductores estadounidense Nvidia en Wall Street, cuyas pérdidas rondaron los 600.000 millones de dólares de capitalización bursátil.
En concreto, se trata de un chatbot similar a ChatGPT cuya app es totalmente gratuita, impulsada por el modelo R1 de DeepSeek, “lo bastante potente como para compararlo con el modelo de razonamiento o1 de OpenAI”, como dice Reece Rogers, periodista de la revista estadounidense Wired.
Una diferencia sustancial con sus competidores es que toda la potencia del chatbot de DeepSeek está al alcance de cualquiera, y no tras un muro de pago de 20 dólares al mes, como pasa con ChatGPT. Además, los chinos entrenaron su modelo con chips de IA menos potentes, lo que lo convierte en una referencia de ingeniería innovadora.
“Esta plataforma se entrenó con aproximadamente un presupuesto de 6 millones de dólares versus los grandes del mercado, como por ejemplo el GPT-4 de OpenAI, que costó 100 millones de dólares. Esa diferencia es grandísima y, además, el entrenamiento lo hicieron en tan solo 55 días”, comenta Felipe Lizcano, CoFundador TECHcetera y Red Design Systems.
Y aunque parezca salida de la nada, Deepseek tiene su sede en Hangzhou, una metrópolis del este de China donde están radicados varios gigantes tecnológicos del gigante país asiático, lo que le ha valido el apodo de “Silicon Valley china”.
La verdad es que, aunque sea poco conocida en el extranjero, DeepSeek despertaba desde hacía tiempo un gran interés en China. Desde el año pasado, el bot conversacional R1 dejó anonadados a los expertos por sus resultados y rentabilidad.
Además, en China ensalzaron su supuesta capacidad para eludir las sanciones estadounidenses que buscan obstaculizar el acceso a los sofisticados chips que requiere la revolucionaria Inteligencia Artificial (IA).
Reece Rogers comentó que, tras unas horas utilizándola, sus impresiones iniciales son que “el modelo R1 de DeepSeek será un gran revulsivo para las empresas de IA con sede en EE.UU., pero aún adolece de los puntos débiles comunes a otras herramientas de IA generativa, como alucinaciones, moderación invasiva y material cuestionable”.
Respecto al diseño de la plataforma, Lizcano explica que R1 utiliza menos datos y hardware menos avanzado, gracias a técnicas como el aprendizaje por transferencia y semisupervisado, permitiendo que el modelo sea más eficiente.
“Su arquitectura modular activa solo las partes necesarias para cada tarea, lo que reduce significativamente el consumo de recursos computacionales”, lo que contrasta con modelos más tradicionales que requieren procesar grandes cantidades de datos.
DeepSeek también se apoya en datos sintéticos generados por otros modelos o simulaciones, lo que permite un entrenamiento más robusto sin necesidad de los enormes volúmenes de datos que suelen demandar otras plataformas. Esto no solo disminuye los costos y el tiempo de desarrollo, sino que también reduce la huella de carbono, posicionando a DeepSeek como una solución más sostenible en el panorama de la IA.
Lea también: No es ciencia ficción: La nueva IA de OpenAI “podrá hacer tareas humanas complejas”
Otro aspecto clave es su enfoque colaborativo y de código abierto, algo que, según Lizcano, fomenta la innovación colectiva. “Esto permite un intercambio constante de conocimientos y técnicas que ayudan a mantener el modelo optimizado y adaptable a las necesidades del mercado”, agrega.
Además, DeepSeek facilita la personalización mediante procesos más rápidos de ajuste fino (fine tuning), lo que podría atraer a desarrolladores y empresas interesadas en adaptar la tecnología a usos específicos.
Entre tanto, la plataforma china sigue sumando usuarios y ganando buena fama entre los millones de usuarios que han descargado la app gratuita en iPhone, mientras continúa el debate sobre su impacto en las empresas norteamericanas y su capacidad para competir en el mercado global.