La startup china DeepSeek despegó en la fama mundial, luego de representar una competencia dura en el mercado de Estados Unidos por el desarrollo de su "chatbot" con IA e impactar severamente a la empresa Nvidia tras hacerla perder más de 500 mil millones de dólares.
DeepSeek surge de una startup tecnológica, una empresa reciente, con sede en Hangzhou, China, fundada en julio de 2023, por Liang Wenfeng.
La compañía trabajo en el desarrollo de modelos de lenguaje de gran escala (LLM, por su sigla en inglés) y logró avances significativos en un corto periodo.
Con su DeepSeek-R1, destaca por sus capacidades de razonamiento y eficiencia en costos, lo que llamó la atención de miembros del sector, incluidos sus competidores.
Sobresale sobre otras herramientas de "inteligencia artificial" debido a que las mismas suelen tener inversiones multimillonarias en infraestructura, pero DeepSeek desarrolló su modelo con 5.6 millones de dólares, un costo menor por decenas de veces.
DeepSeek lanzó aplicaciones móviles para iOS y Android. La interfaz es intuitiva, similar a la de otros chatbots, facilitando la interacción mediante lenguaje natural. Además, su código es abierto, lo que permite que cualquier persona pueda verificar cómo funciona e incluso, modificar el código de DeepSeek para generar su propio modelo de lenguaje.
La aplicación es gratuita en su modalidad completa, una gran diferencia respecto a plataformas como OpenAI que la versión gratuita es limitada a comparación de la de pago. Pero actualmente todavía no está completa en cuanto al dominio de idiomas, pues no todas sus funciones avanzadas pueden responder en español, por ejemplo, 'deep thinking'.
Alexandr Wang, consejero delegado de ScaleAI, que proporciona datos de entrenamiento a los modelos de IA de grandes empresas como OpenAI y Google, describió el producto de DeepSeek como "un modelo revolucionario" en un discurso pronunciado el jueves en el Foro Económico Mundial (FEM) de Davos (Suiza).
¿Por qué desplomaron los mercados con DeepSeek?
El lunes, con la aparición de DeepSeek, los mercados europeos y de Estados Unidos sufrieron afectaciones, principalmente en los valores tecnológicos.
Esto ocurre ya que consideran el modelo de IA chino como más rentable financieramente que sus rivales estadounidenses e incluso es más eficiente en la resolución de problemas matemáticos y de codificación complejos mediante cambios en su programación.
De hecho, DeepSeek utilizó los chips de Nvidia, los H800 (hoy menos avanzados), para el entrenamiento de su LLM. La agencia Bloomberg informó que la propia Nvidia ha calificado a DeepSeek de "excelente avance en IA", y que además cumple las leyes estadounidenses sobre control de exportaciones.