DeepSeek vuelve a escena y actualiza el R1, su revolucionario modelo de IA

¿Nuevo golpe a OpenAI y ChatGPT? DeepSeek, la ‘startup’ china que dio un vuelco al mercado de la inteligencia artificial (IA) a comienzos de 2024, ha lanzado una nueva actualización de su modelo R1.

Según ha informado la compañía en WeChat, esta es una «pequeña actualización de prueba». Al igual que con el debut del R1 original, la versión mejorada también fue lanzada de forma discreta. Se trata de un modelo de razonamiento, lo que significa que la IA puede realizar tareas más complejas mediante un proceso lógico paso a paso. Distintos medios informan DeepSeek ya está permitiendo que los usuarios prueben esta actualización.

Según ‘CNBC’, el nuevo modelo R1 de DeepSeek se sitúa justo por detrás de los modelos de razonamiento o4-mini y o3 de OpenAI en LiveCodeBench, una web que evalúa modelos según diferentes métricas.

DeepSeek saltó a la fama a comienzos de este año después de lanzar por sorpresa una IA generativa (GenAI) que puso bajo cuestión a todos los gigantes del sector, como OpenAI o Meta. Y es que el modelo R1 de DeepSeek no solo disparó contra el modelo de negocio de estas corporaciones, al lanzarlo como código abierto, democratizando el acceso a esta tecnología, sino también demostró ser capaz de crear una GenAI tan potente como ChatGPT de forma mucho más barata y eficiente.

De acuerdo con distintas fuentes, R1 no solo se construyó en un período muy corto de tiempo (entrenar un modelo de lenguaje extenso, o LLM, suele ser un proceso muy largo), sino que supuso una inversión mucho menor a la de los gigantes tecnológicos. Y es que, según distintas estimaciones, la compañía invirtió «solo» unos pocos miles de millones de dólares en adquirir los chips necesarios para entrenar a su LLM debido a las restricciones a la exportación de chips a China.

En concreto, DeepSeek utiliza chips A800 y H800 de Nvidia, versiones limitadas de los A100 y H100 diseñadas específicamente para cumplir con las restricciones. Según los expertos, DeepSeek necesitó alrededor de 2.000 unidades de procesamiento gráfico (GPU) de Nvidia, mientras que los modelos occidentales requieren entre 5 y 10 veces chips más potentes y mucho más caros.

Esto fue interpretado como una prueba más de la resiliencia y el avance tecnológico de China, que demostró ser capaz de desarrollar tecnologías punteras incluso con las limitaciones de hardware existentes. Asimismo, empujó a empresas a apostar más por modelos de razonamiento, no solo generativos, y a los inversores a fijarse más en herramientas con aplicaciones concretas y no solo en nuevos modelos de IA. También a que grandes compañías, como Baidu o Tencent, hayan redoblado sus esfuerzos para hacer más eficientes sus modelos de IA.

Estas noticias llegan poco después de que Nvidia presentara los resultados de su primer trimestre fiscal, en donde batió las previsiones gracias a su negocio de centros de datos. Los expertos creen que la compañía sigue en buena posición para liderar la «revolución de la IA» y destacan que las menores previsiones proporcionan cierto margen para la compañía en caso de que el escenario macroeconómico siga complicándose.

En la presentación de resultados, Jensen Huang, CEO de Nvidia, criticó duramente las restricciones a la exportación de chips estadounidenses a China, un mercado que cifra en 50.000 millones de dólares y que se ha cerrado por culpa de las medidas estadounidenses. «Como resultado, estamos haciendo una amortización de inventario de varios miles de millones de dólares que no se puede vender ni reutilizar», ha señalado.

Según Huang, EEUU se equivoca al pensar que China «no puede fabricar chips de IA». «Esa suposición siempre fue cuestionable y ahora está claramente equivocada. La pregunta no es si China tendrá IA: ya la tiene«, ha afirmado el ejecutivo.

Por otro lado, Huang ha informado que las ventas del trimestre habrían sido 2.500 millones de dólares más altas si hubiera podido vender chips H20, otra versión recortada de su chip H100. El CEO de Nvidia también indicó que tenía 8.000 millones de dólares en pedidos planificados del H20 que ahora deben cancelarse. ‘Reuters’ ha informado que la compañía estaría diseñando una versión más barata de su chip Blackwell (B100), su chip más potente y el sucesor del H100, para exportarlo a China.

Aunque Huang se ha mostrado cada vez más público en sus desacuerdos con la política de control de exportaciones, es muy cuidadoso en no criticar al presidente Donald Trump. «El presidente tiene un plan, tiene una visión. Y yo confío en él», ha sentenciado Huang.

Fuente