La IA ha aprendido a "escuchar" la arquitectura de las ciudades.
Científicos de la Universidad de Texas han desarrollado un modelo de IA capaz de transformar sonidos en imágenes visuales de calles. Según un estudio, las máquinas pueden reproducir una relación entre la percepción auditiva y visual del entorno similar a la humana.
El modelo fue entrenado con datos que incluían materiales de audio y visuales de diversos paisajes urbanos y rurales. Tras el entrenamiento, la IA generó imágenes basadas en grabaciones de audio. Los autores del trabajo señalan que las características acústicas de un lugar contienen suficientes pistas visuales para crear imágenes reconocibles que reflejan las particularidades de distintos lugares.
(Universidad de Texas en Austin)
Para el entrenamiento se utilizaron clips de audio de 10 segundos y sus imágenes correspondientes extraídas de videos de YouTube grabados en ciudades de América del Norte, Asia y Europa. Tras el entrenamiento, los investigadores probaron el modelo comparando las imágenes generadas con fotografías reales. La evaluación incluyó análisis de proporciones de vegetación, edificios y cielo, así como pruebas con participantes humanos que debían elegir la imagen correcta correspondiente a una muestra de audio. La precisión alcanzó un 80%.
La IA mostró una alta correlación entre las proporciones de cielo y vegetación en las imágenes generadas y las reales, además de captar estilos arquitectónicos y distancias entre objetos. El modelo tuvo en cuenta la iluminación, permitiendo distinguir entre grabaciones diurnas y nocturnas, relacionadas con sonidos característicos como el ruido del tráfico o los sonidos nocturnos de la naturaleza.
(Universidad de Texas en Austin)
Los científicos destacan que, tradicionalmente, la capacidad de imaginar una escena a partir de sonidos era una habilidad exclusiva del ser humano. Sin embargo, las tecnologías modernas permiten que la IA se acerque a esta capacidad. Estos desarrollos pueden fomentar una comprensión más profunda de la interacción humana con el entorno.
Además de trabajar con sonidos, los investigadores consideran el potencial de la IA para estudiar las características únicas de las ciudades. Estos estudios subrayan la importancia de los factores multisensoriales en la percepción del espacio y abren nuevas posibilidades para el uso de la IA geoespacial en urbanismo y sociología.