La startup china Z.ai lanza un modelo de IA más barato que DeepSeek

La startup china Z.ai ha presentado este lunes su nuevo modelo de inteligencia artificial (IA), el GLM-4.5, que tiene un menor coste que el desarrollo lanzado por la también china DeepSeek, que sacudió los mercados a principios de año.

El CEO de Z.ai, Zhang Peng, ha explicado durante una entrevista con ‘CNBC’ que este modelo cuesta 11 centavos por millón de tokens de entrada y 28 centavos por millón de tokens de salida, por debajo de los 14 centavos y 2,19 dólares que presenta DeepSeek R1 para estas operaciones, respectivamente.

GLM-4.5 está construido con 355.000 millones de parámetros totales y 32.000 millones de parámetros activos, mientras que la versión GLM-4.5-Air incorpora 106.000 millones de parámetros totales y 12.000 millones de parámetros activos. Ambos están diseñados para «unificar las capacidades de razonamiento, codificación y agencia en un único modelo para satisfacer los requisitos cada vez más complejos de las aplicaciones agenciales en rápido crecimiento».

«Tanto GLM-4.5 como GLM-4.5-Air son modelos de razonamiento híbridos que ofrecen: modo de pensamiento para razonamiento complejo y uso de herramientas, y modo de no pensamiento para respuestas instantáneas. Están disponibles en Z.ai, la API de Z.ai, y las ponderaciones abiertas están disponibles en HuggingFace y ModelScope«, detalla la compañía.

Además, asegura que este modelo se nutre de los años de aprendizaje que acumulan los principales desarrollos de IA, por lo que busca superar los escollos que estos encontraron.

«En los últimos cinco años, el GPT-3 de OpenAI aprende conocimiento basado en el sentido común, y el o1 utiliza aprendizaje por refuerzo para pensar antes de responder, mejorando significativamente las habilidades de razonamiento en programación, análisis de datos y matemáticas complejas. Sin embargo, los modelos resultantes aún no son realmente generales: algunos son buenos en programación, otros en matemáticas y otros en razonamiento, pero ninguno logró el mejor rendimiento en todas las tareas. El GLM-4.5 se esfuerza por unificar todas las capacidades«, concluye.

Fuente