China presenta una IA avanzada que en pruebas superó incluso a GPT-5.2

China presenta una IA avanzada que en pruebas superó incluso a GPT-5.2

Parece que la era del monopolio estadounidense sobre la inteligencia artificial ha quedado definitivamente atrás.

image

La empresa china Alibaba Cloud presentó el nuevo modelo de lenguaje Qwen3-Max-Thinking, desarrollado por el equipo Qwen. Según los desarrolladores, el modelo muestra resultados destacados en el área del razonamiento automático y ya ha superado a sus homólogos occidentales, incluidos Gemini 3 Pro y GPT-5.2, en varios indicadores clave. El lanzamiento de Qwen3-Max-Thinking refuerza la posición de las tecnologías chinas en el mercado global de IA, donde anteriormente dominaban empresas de Estados Unidos.

El modelo fue probado en tareas complejas, incluido el examen HLE, que comprende 3000 preguntas de nivel de posgrado que no se pueden resolver con una búsqueda simple en internet. En esa prueba Qwen3-Max-Thinking, con herramientas integradas de búsqueda web, obtuvo 49,8 puntos —por encima de Gemini 3 Pro y GPT-5.2, que alcanzaron 45,8 y 45,5 puntos respectivamente. Los desarrolladores consideran que la arquitectura del modelo funciona especialmente bien en tareas de varios pasos que requieren recurrir a información externa.

Una de las principales diferencias técnicas del modelo fue el uso de la tecnología «escalado en tiempo de ejecución», que permite redistribuir los recursos computacionales durante la generación de la respuesta. En lugar de un enfoque lineal, Qwen3-Max-Thinking analiza los pasos intermedios, detecta direcciones de razonamiento ineficaces y reorienta los cálculos hacia las partes que requieren precisión. Este enfoque permite aumentar la exactitud sin un crecimiento brusco de los costes.

El modelo también cuenta con un sistema de selección adaptativa de herramientas que permite cambiar automáticamente entre modos, incluyendo búsqueda web, intérprete de código y un sistema de memoria. Esto hace posible trabajar con hechos en tiempo real, realizar cálculos y procesar análisis dentro de una sola solicitud. Según el equipo Qwen, esta modularidad reduce el nivel de «alucinaciones» y aumenta la fiabilidad de las respuestas, ya que el modelo puede apoyarse en datos actualizados y no solo en el entrenamiento.

En el ámbito de la programación, Qwen3-Max-Thinking también demostró un liderazgo sólido. En la prueba Arena-Hard v2 obtuvo 90,2 puntos, superando con claridad a los competidores más cercanos, incluido el modelo Claude-Opus-4.5, que logró 76,7 puntos.

Al mismo tiempo, el coste de uso del modelo sigue siendo relativamente asequible. Por 1 millón de tokens de entrada, los usuarios pagan $1.20; por la salida, $6.00. Para comparar, el mismo volumen de trabajo con GPT-5.2 cuesta $15.75. Qwen3-Max-Thinking ofrece también funciones instrumentales, como búsqueda web e intérprete de código, por un pago adicional: $10 por 1000 llamadas, aunque en el momento del lanzamiento varias opciones están disponibles de forma gratuita.

El modelo admite formatos de interacción compatibles con las API de OpenAI y Anthropic, lo que facilita la integración en infraestructuras existentes. Los desarrolladores señalan que cambiar de proveedor es posible mediante la simple sustitución de la dirección y el nombre del modelo en la configuración.

El lanzamiento de Qwen3-Max-Thinking eleva el listón para los competidores y apuesta no por otro «bot inteligente», sino por un agente intelectual completo, capaz de resolver tareas complejas recurriendo a recursos externos. Gracias a la combinación de una arquitectura cuidada, la interacción flexible con las herramientas y una estrategia de precios agresiva, el modelo puede interesar a empresas que buscan un equilibrio entre capacidades y costes.