Nueve problemas y 56 años de espera: la IA de Google resuelve retos que desconcertaron a generaciones de matemáticos

Nueve problemas y 56 años de espera: la IA de Google resuelve retos que desconcertaron a generaciones de matemáticos

Google obliga a la IA a verificar las respuestas, no solo a generarlas.

image

La inteligencia artificial se adentra cada vez con más seguridad en un territorio que durante años fue dominio exclusivo de los matemáticos. El sistema Google DeepMind AlphaProof Nexus resolvió nueve problemas abiertos del matemático húngaro Pál Erdős, y dos de ellos habían quedado sin respuesta durante 56 años.

AlphaProof Nexus no solo propuso ideas atractivas, sino que preparó demostraciones que se pueden verificar por máquina. Para la verificación, el sistema usó Lean, un entorno especializado donde cada paso lógico debe pasar un control estricto. Si la demostración no supera la verificación, el sistema vuelve atrás y busca de nuevo.

Según los datos de Google DeepMind, AlphaProof Nexus trabajó con un conjunto de 353 problemas abiertos de Erdős y resolvió nueve de ellos. Los problemas pertenecen a la combinatoria y a la teoría de grafos. Además, el sistema demostró 44 conjeturas abiertas de la Enciclopedia en línea de secuencias enteras. El costo de resolver cada problema, según estiman los autores del trabajo, fue de varios cientos de dólares.

El sistema combina un gran modelo de lenguaje y una verificación rigurosa de demostraciones. El modelo propone un paso de la solución, y Lean comprueba si la deducción se sigue de los pasos previos. Este enfoque reduce el riesgo de que la inteligencia artificial produzca una respuesta verosímil pero incorrecta.

El resultado de Google DeepMind apareció poco después del anuncio de OpenAI sobre su propio avance en un problema de Erdős formulado en 1946. El modelo de OpenAI encontró un nuevo enfoque para el problema sobre puntos en el plano y las distancias entre ellos. Varios matemáticos ya han calificado el resultado como un logro serio, aunque el trabajo con tales demostraciones aún requiere verificación y debate en la comunidad profesional.

AlphaProof Nexus aún está lejos de ser un "matemático en la computadora" universal. La mayoría de los problemas del conjunto examinado permanecieron sin resolver, y donde se requerían construcciones matemáticas radicalmente nuevas, el sistema a menudo no lo lograba. Pero el mero hecho de que el programa pudo resolver problemas que durante décadas se resistieron a los humanos muestra lo rápido que está cambiando el papel de la inteligencia artificial en la ciencia.

Para la matemática este enfoque puede resultar especialmente importante. La inteligencia artificial es capaz de barajar ideas con rapidez, y la verificación formal descarta razonamientos erróneos. Juntos, ambos mecanismos convierten al sistema no solo en un ayudante para los cálculos, sino en una herramienta para la búsqueda de nuevas demostraciones.