¿Un modelo de IA chino ha superado al humano, pero teme a la política?
La empresa china DeepSeek ha lanzado un nuevo modelo de lenguaje de código abierto. Según las pruebas realizadas, no solo está a la par de las mejores soluciones de OpenAI, sino que también supera a los modelos existentes de Anthropic en cálculos matemáticos, programación y comprensión del lenguaje natural. Sin embargo, la novedad presenta una curiosa peculiaridad: esta inteligencia artificial se niega a discutir eventos como la Plaza de Tiananmén, la fotografía del «Hombre del Tanque», Winnie the Pooh, el estatus de Taiwán y los grupos de hackers chinos.
Las capacidades de DeepSeek-R1 ya son tema de conversación en redes sociales. Los desarrolladores comparan su creación con el modelo o1-1217 de OpenAI. El modelo chino ha demostrado un rendimiento excepcional en tareas que requieren razonamiento lógico.
En las pruebas AIME 2024, DeepSeek-R1 obtuvo un 79,8% Pass@1, superando ligeramente a su competidor de OpenAI. En el test MATH-500, alcanzó un resultado del 97,3%, igualando al o1-1217 y superando notablemente a otros modelos de lenguaje propietario.
El desarrollo chino también pasó con éxito las evaluaciones de conocimiento general en los tests MMLU, MMLU-Pro y GPQA Diamond. Aunque aquí quedó un poco por detrás del o1-1217, superó a otras soluciones propietarias, mostrando un nivel elevado en tareas educativas.
En programación, DeepSeek-R1 sorprendió a los expertos: en la plataforma Codeforces, donde los programadores compiten resolviendo problemas algorítmicos, alcanzó una puntuación de 2029 Elo (sistema de valoración usado en ajedrez y otras competiciones), superando al 96,3% de los participantes humanos.
La empresa también ha lanzado varias versiones más ligeras de código abierto. Según los desarrolladores, los modelos de 32 y 70 mil millones de parámetros no se quedan atrás del OpenAI-o1-mini.
DeepSeek ofrece precios extremadamente bajos por el uso de su API. Por un millón de tokens de entrada almacenados en caché, el costo es de $0,14; si no están en caché, $0,55; y por un millón de tokens de salida, $2,19. Esto es entre 13 y 107 veces más barato que el modelo o1 de OpenAI.
Otro punto a favor del desarrollo chino es su código abierto. Cualquier persona puede descargar y ejecutar los modelos en su propia computadora. Ya han sido integrados en el popular servicio gratuito Ollama, incluyendo la versión más potente de DeepSeek-R1 con 671 mil millones de parámetros.
Aunque la arquitectura del modelo contiene 671 mil millones de parámetros, durante su funcionamiento solo se utilizan 37 mil millones, lo que acelera significativamente los cálculos.
Con estas características, DeepSeek podría cambiar drásticamente la competencia en el mercado dominado actualmente por gigantes tecnológicos estadounidenses. Sin embargo, el programa presenta una desventaja importante: al igual que otras tecnologías producidas en China, está impregnado de propaganda y sujeto a una estricta censura.
Cuando los periodistas de Cybernews preguntaron al chatbot sobre las protestas en la Plaza de Tiananmén, este evitó responder: «Eso está fuera de mis capacidades. Hablemos de otra cosa». Respecto a la famosa fotografía del «Hombre del Tanque» de 1989, el modelo también se negó a comentar: «Lo siento, no puedo responder a esa pregunta. Soy un asistente de IA diseñado para proporcionar respuestas útiles y seguras».
En cambio, sobre los uigures, el modelo respondió con entusiasmo, aunque en línea con la propaganda oficial. Según afirma, el gobierno chino sigue una «filosofía de desarrollo centrada en las personas» y protege los derechos de todos los grupos étnicos. La IA sostiene que las autoridades de Xinjiang han desarrollado con éxito la economía, mantenido la estabilidad, fortalecido la unidad interétnica y combatido el terrorismo.
Al ser consultada sobre la independencia de Taiwán, la IA también evitó responder. Tampoco comentó las bromas sobre el parecido de Winnie the Pooh con algún líder mundial. Cuando los periodistas le pidieron información sobre grupos de hackers chinos y sus ataques a la infraestructura crítica de Estados Unidos, el bot comenzó a formular una respuesta, pero su filtro interno la eliminó de inmediato, reemplazándola con la frase estándar: «Lo siento, esto está fuera de mis capacidades».
El funcionamiento de DeepSeek está a cargo de dos empresas chinas: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. y Beijing DeepSeek Artificial Intelligence Co., Ltd. Según sus normas, todos los datos de los usuarios, desde las consultas introducidas hasta los perfiles y estadísticas de uso, se transmiten a socios publicitarios y empresas de análisis.