El primer día del Año Nuevo Lunar chino, la compañía afirma que su IA supera a la mayoría de los modelos de OpenAI, Meta y DeepSeek.
La empresa tecnológica china Alibaba lanzó el miércoles una nueva versión de su modelo de inteligencia artificial Qwen 2.5 que, según dice, supera al aclamado DeepSeek-V3 .
El momento inusual de la presentación del Qwen 2.5-Max —el primer día del Año Nuevo Lunar, cuando la mayoría de los chinos están libres y con sus familias— apunta a la presión que el meteórico ascenso de la compañía china de inteligencia artificial DeepSeek en las últimas tres semanas ha puesto no solo sobre sus rivales extranjeros sino también sobre su competencia nacional.
"Qwen 2.5-Max prácticamente supera a GPT-4o, DeepSeek-V3 y Llama-3.1-405B", dijo la unidad en la nube de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, refiriéndose a los modelos de IA de código abierto más avanzados de OpenAI y Meta.
El lanzamiento el 10 de enero del asistente de IA de DeepSeek, basado en el modelo DeepSeek-V3, así como el lanzamiento el 20 de enero de su modelo R1, han conmocionado a Silicon Valley y han desplomado las acciones tecnológicas. Los supuestos bajos costes de desarrollo e implementación de la startup china han llevado a los inversores a cuestionar los enormes planes de inversión de las principales empresas estadounidenses de IA.
Pero el éxito de DeepSeek también ha provocado una lucha entre sus competidores nacionales para mejorar sus propios modelos de IA.
Dos días después del lanzamiento de DeepSeek-R1, el propietario de TikTok, ByteDance, lanzó una actualización de su modelo de IA insignia, que afirmó que superó al o1 de OpenAI respaldado por Microsoft en AIME, un punto de referencia que mide la capacidad de los modelos de IA para comprender y responder a instrucciones complejas.
DeepSeek afirma que su modelo R1 rivaliza con el o1 de OpenAI en varias pruebas de rendimiento.
El predecesor del modelo V3 de DeepSeek, DeepSeek-V2, desató una guerra de precios para los modelos de IA en China después de su lanzamiento en mayo pasado.
El hecho de que DeepSeek-V2 fuera de código abierto y tuviera un precio sin precedentes de solo 1 yuan (0,14 dólares) por 1 millón de tokens (o unidades de datos procesadas por el modelo de IA) impulsó a la unidad en la nube de Alibaba a anunciar recortes de precios de hasta el 97% en una gama de modelos.
Otras empresas tecnológicas chinas siguieron su ejemplo, incluida Baidu 9888.HK, que lanzó el primer equivalente chino de ChatGPT en marzo de 2023, y la empresa de Internet más valiosa del país, Tencent 0700.HK.
Liang Wenfeng, el enigmático fundador de DeepSeek, dijo en una rara entrevista con el medio chino Waves en julio que a la startup "no le importa" la guerra de precios y que su objetivo principal es lograr AGI (inteligencia general artificial).
OpenAI define AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas de valor económico.
Mientras que las grandes empresas tecnológicas chinas como Alibaba tienen cientos de miles de empleados, DeepSeek opera como un laboratorio de investigación, integrado principalmente por jóvenes graduados y estudiantes de doctorado de las mejores universidades chinas.
Liang dijo en su entrevista de julio que creía que las compañías tecnológicas más grandes de China podrían no ser las más adecuadas para el futuro de la industria de la IA, contrastando sus altos costos y estructuras jerárquicas con la operación ágil y el estilo de gestión flexible de DeepSeek.
"Los grandes modelos fundacionales requieren innovación continua, y las capacidades de los gigantes tecnológicos tienen sus límites", afirmó.
info@tipzones.com
© Tipzones. Reservados todos los derechos. Design by Tipzones.com