Qwen 2.5 Max desafía el monopolio de EE. UU. en inteligencia artificial avanzada

Qwen 2.5 Max desafía el monopolio de EE. UU. en inteligencia artificial avanzada

Alibaba no se queda atrás frente a sus competidores y aliados.

image

La empresa china Alibaba ha presentado su nuevo modelo de lenguaje, Qwen 2.5 Max , que, según sus desarrolladores, supera a los principales sistemas de IA estadounidenses. Tras el reciente éxito de la startup china DeepSeek, este lanzamiento ha reavivado el debate sobre el liderazgo de EE. UU. en inteligencia artificial.

En pruebas realizadas con sistemas de evaluación reconocidos como Arena-Hard, MMLU-Pro, GPQA-Diamond, LiveCodeBench y LiveBench, Qwen 2.5 Max obtuvo mejores resultados que GPT-4o de OpenAI, Claude 3.5 Sonnet de Anthropic y Llama 3.1 405B de Meta. El modelo puede procesar texto, vídeo e imágenes, además de realizar búsquedas en internet.

Los desarrolladores de Alibaba subrayan que compararon su modelo con DeepSeek V3, y no con la mediática R1. Esto también explica por qué eligieron GPT-4o como referencia en lugar de los modelos insignia o1 de OpenAI. No obstante, los avances de las empresas chinas ponen en duda la efectividad de los intentos occidentales por frenar el desarrollo de la IA en China.

Las especificaciones técnicas de Qwen 2.5 Max aún no han sido reveladas. Se sabe que el modelo se basa en la arquitectura MoE (mixture of experts) y ha sido entrenado con un conjunto de datos de 20 billones de tokens. Tras su entrenamiento inicial, pasó por etapas de ajuste supervisado (supervised fine-tuning) y aprendizaje reforzado con retroalimentación humana (RLHF).

La arquitectura MoE, utilizada también por Mistral y DeepSeek, permite desarrollar módulos expertos especializados en tareas concretas, como programación o cálculos matemáticos. Su principal ventaja es que permite aumentar la cantidad total de parámetros sin sacrificar rendimiento, ya que solo se activan las partes de la red neuronal relevantes para cada solicitud.

El número exacto de parámetros de Qwen 2.5 Max sigue siendo un misterio, aunque se sabe que la versión anterior contenía aproximadamente 100.000 millones de parámetros. Curiosamente, incluso el chatbot del propio modelo no puede responder preguntas sobre sus especificaciones técnicas.

A diferencia de versiones anteriores de Qwen, el nuevo modelo no estará disponible de forma gratuita. En el sitio web de Alibaba Cloud aparece marcado como propietario, lo que explica la escasez de información técnica. Esta estrategia ya ha sido utilizada por la compañía con modelos como Qwen Turbo y Qwen Plus.

El acceso a Qwen 2.5 Max a través de API cuesta 10 dólares por cada millón de tokens de entrada y 30 dólares por millón de tokens generados. En comparación, OpenAI cobra 2,50 dólares por millón de tokens de entrada y 10 dólares por millón de salida en GPT-4o. Mientras tanto, el modelo insignia o1 de OpenAI es aún más costoso: 15 y 60 dólares, respectivamente.

Qwen 2.5 Max es la última incorporación a la familia de modelos de Alibaba, cuyo desarrollo comenzó en 2023. Desde septiembre, la compañía ha lanzado una serie de modelos Qwen 2.5 de código abierto con entre 0,5 y 72.000 millones de parámetros. Según sus creadores, los modelos más grandes son comparables a Llama 3.1 405B de Meta, que cuenta con 405.000 millones de parámetros.

Paralelamente, Alibaba está desarrollando modelos especializados en cálculos matemáticos y programación. En diciembre, presentó el modelo "pensante" QwQ, con una funcionalidad similar a la de o1. Esta semana, la compañía también lanzó tres modelos abiertos para la generación de imágenes (VLM), que, según sus desarrolladores, son equivalentes a Gemini 2 de Google, GPT-4o y Claude 3.5 Sonnet. Recientemente, también informamos sobre Qwen2.5-VL.

Además, Alibaba ha actualizado sus modelos Qwen 2.5 de 7 y 14.000 millones de parámetros, ampliando su ventana de contexto hasta un millón de tokens. Esta mejora es especialmente útil para sistemas de recuperación aumentada (RAG), ya que permite procesar grandes volúmenes de documentos sin perder coherencia.

Sin embargo, los avances de las empresas chinas han suscitado preocupaciones sobre la privacidad y la censura de datos. Al igual que DeepSeek, Qwen Chat almacena los datos de los usuarios en servidores ubicados en China o Singapur. Steve Heidel, desarrollador del API de OpenAI, ironizó en la red social X: "A los estadounidenses les encanta regalar sus datos al Partido Comunista Chino a cambio de servicios gratuitos".

Otra inquietud es la censura de temas sensibles que podrían afectar la imagen del gobierno de Pekín. Como ocurre con otros modelos chinos, DeepSeek y Alibaba evitan discutir asuntos como la masacre de Tiananmén o el estatus político de Taiwán, o simplemente interrumpen la generación de respuestas cuando se les pregunta sobre estos temas.

Las huellas digitales son tu debilidad, y los hackers lo saben

¡Suscríbete y descubre cómo borrarlas!