Los chinos están convencidos: la capacidad de dudar será una ventaja para la red neuronal.
El laboratorio científico DeepSeek de China presentó el modelo de inteligencia artificial DeepSeek-R1, diseñado para reflexionar detenidamente antes de tomar cualquier decisión. Detrás del desarrollo está la empresa de inversiones High-Flyer Capital Management, que busca competir con OpenAI en el mercado de sistemas de aprendizaje automático capaces de razonar como los humanos.
La principal característica de DeepSeek-R1 es su enfoque poco convencional en el procesamiento de consultas. En lugar de generar respuestas instantáneas, la IA verifica sus propias conclusiones, lo que le permite evitar errores comunes en otros algoritmos de inteligencia artificial. Al abordar una tarea, DeepSeek-R1 la descompone en etapas y avanza de manera metódica hacia la solución. En preguntas que requieren un análisis profundo, el algoritmo puede tardar hasta varios segundos en responder.
Según sus creadores, la versión de prueba DeepSeek-R1-Lite-Preview no tiene nada que envidiar al modelo o1 de OpenAI en dos métricas clave: AIME y MATH. La primera evalúa la calidad del trabajo mediante otras redes neuronales, mientras que la segunda consiste en un conjunto de problemas matemáticos descritos en texto.
Sin embargo, el modelo tiene sus puntos débiles. Algunos usuarios señalaron que, al igual que sus competidores, tiene dificultades para resolver juegos lógicos simples como el tres en raya. Además, surgió un problema más serio: la posibilidad de eludir los mecanismos de seguridad. Uno de los usuarios logró obtener instrucciones detalladas de la IA para fabricar metanfetaminas.
El funcionamiento de DeepSeek-R1 refleja una clara postura política. El sistema se niega a discutir sobre el líder chino Xi Jinping, los eventos en la Plaza de Tiananmén o las posibles consecuencias de un conflicto militar entre China y Taiwán. Esto se debe a las estrictas políticas del gobierno chino respecto a la inteligencia artificial. Cada modelo debe pasar por la aprobación de un regulador estatal, encargado de garantizar que las respuestas se alineen con los "valores fundamentales del socialismo". Según algunos informes, el gobierno incluso está preparando una lista oficial de fuentes prohibidas para el entrenamiento de redes neuronales.
El interés por los sistemas de “razonamiento automático” no es casual. La estrategia previa de desarrollo de inteligencia artificial, basada en aumentar la capacidad de cómputo y los volúmenes de datos, ha dejado de ofrecer resultados significativos. Observaciones recientes indican una notable desaceleración en el progreso de las principales compañías como OpenAI, Google y Anthropic.
Los desarrolladores planean hacer que el código de DeepSeek-R1 sea de acceso abierto y proporcionar una API para desarrolladores. El proyecto cuenta con el apoyo financiero del fondo de cobertura chino High-Flyer Capital Management, que emplea inteligencia artificial para analizar mercados.
El logro anterior de DeepSeek, el sistema universal DeepSeek-V2 para trabajar con texto e imágenes, tuvo un impacto significativo en el mercado. ByteDance, Baidu y Alibaba se vieron obligados a reducir el costo de sus servicios, y algunas plataformas incluso pasaron a ser gratuitas.
High-Flyer Capital Management cuenta con una impresionante infraestructura técnica. Su último clúster de servidores incluye 10,000 unidades de procesamiento gráfico Nvidia A100, cuya construcción costó alrededor de 138 millones de dólares. El fundador de la empresa, el experto en informática Liang Wenfeng, ve como objetivo final de DeepSeek la creación de una inteligencia artificial que supere al intelecto humano.