Una estudiante de doctorado revolucionó el mundo de la tecnología solo por analizar imágenes en internet.
Especialistas del Instituto Tecnológico de Massachusetts han creado una especie de tabla periódica para los algoritmos de aprendizaje automático: agrupa más de 20 métodos clásicos de entrenamiento de IA y muestra las conexiones entre ellos. Y no se trata solo de demostrar las relaciones entre tecnologías existentes, sino también de señalar la posibilidad de crear múltiples soluciones radicalmente nuevas.
La estudiante de doctorado del MIT, Shaden Alshammari, estaba estudiando dos procesos de agrupación automática de imágenes. El primero, la clusterización, permite al ordenador encontrar elementos similares y agruparlos, por ejemplo, clasificando automáticamente fotos según su contenido. El segundo, el aprendizaje contrastivo, enseña al sistema a distinguir objetos comparándolos por pares. Al comparar los principios matemáticos de estos métodos, Alshammari descubrió una sorprendente similitud: ambos se basan en el mismo principio matemático —el intento del sistema de minimizar la diferencia entre las relaciones reales en los datos y su representación interna.
“El descubrimiento fue casi accidental”, cuenta Mark Hamilton, coautor del estudio, también estudiante de doctorado del MIT y gerente senior de ingeniería en Microsoft. “Tras encontrar la conexión entre esas dos tecnologías, comenzamos a revisar otros métodos. Prácticamente todos encajaban en el patrón descubierto”.
El enfoque desarrollado por el equipo del MIT fue llamado “aprendizaje contrastivo de información” (Information-Contrastive Learning o I-Con). Su singularidad radica en la capacidad de la máquina para describir con una fórmula única una gran variedad de métodos de procesamiento de contenido: desde simples filtros de correo que eliminan spam hasta complejas redes neuronales capaces de dialogar con humanos. Todo algoritmo de aprendizaje automático primero analiza los datos entrantes para identificar patrones, y luego construye un modelo interno de esas regularidades —una especie de mapa digital de relaciones entre los elementos de información.
En el proyecto también participaron John Hershey, de Google AI Perception; Axel Feldman, estudiante de doctorado del MIT; y William Freeman, profesor de ingeniería eléctrica e informática, miembro del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL). Los resultados se presentaron en forma de tabla, donde cada celda refleja un tipo particular de algoritmo. En las filas horizontales se representan los distintos esquemas con los que el ordenador puede encontrar relaciones en la información —por ejemplo, agrupar elementos similares o identificar opuestos—, y en las verticales, los métodos que permiten memorizar y reproducir los patrones detectados.
“La comparación con la tabla de Mendeléyev no es solo una metáfora bonita”, explica Alshammari. “De verdad descubrimos un sistema donde antes solo se veía un conjunto de técnicas desconectadas. Al igual que la famosa tabla química, esta nueva clasificación también contiene celdas vacías —lugares para algoritmos que son teóricamente posibles, pero que aún no existen”.
Lo alentador es que las conclusiones teóricas encontraron aplicación práctica de inmediato. Al combinar elementos del aprendizaje contrastivo y la clusterización, los especialistas crearon una nueva forma de clasificación de imágenes que superó en precisión a las soluciones existentes en un 8 %. Además, lograron transferir con éxito métodos de reducción de sesgos de un área a otra.
Una vez más, la estructura de la tabla permite realizar ajustes: añadir filas y columnas para nuevos tipos de relaciones entre elementos.
“Una fórmula elegante, basada en la teoría de la información, ha unido los resultados de cien años de trabajo en el campo del aprendizaje automático. Esto sienta las bases para innumerables descubrimientos futuros”, señala Hamilton.
El proyecto recibió apoyo financiero del Acelerador de Inteligencia Artificial de la Fuerza Aérea de EE.UU., la Fundación Nacional de Ciencia y la empresa Quanta Computer. Los resultados se presentarán oficialmente a la comunidad científica próximamente.