¿Quién habría pensado que cazar Pokémon impulsaría la navegación del futuro?
La empresa Niantic, creadora de los juegos AR Pokémon Go e Ingress, anunció el desarrollo de un nuevo modelo de IA para la navegación en el mundo físico. La tecnología se basa en los datos recopilados por millones de jugadores. En el blog de la empresa se describe el concepto de un Gran Modelo Geoespacial (Large Geospatial Model, LGM), inspirado en el enfoque de los Grandes Modelos de Lenguaje (Large Language Model, LLM).
Los modelos de lenguaje modernos han aprendido a analizar y generar texto, mientras que los visuales comprenden y crean imágenes bidimensionales. LGM va más allá: permite modelar objetos tridimensionales vinculados a ubicaciones geográficas específicas, preservando sus características a escala. A diferencia de los modelos 3D comunes, que crean objetos abstractos, el modelo geoespacial forma mapas de nueva generación, conectando escenas y objetos a nivel global. Por ejemplo, puede "adivinar" cómo se ve la parte trasera de un edificio basándose en miles de imágenes de estructuras similares en todo el mundo.
Video de demostración ( Niantic Spatial Platform )
La tecnología se basa en el sistema Lightship Visual Positioning System (VPS), que asegura la colocación precisa de objetos virtuales en el mundo real. Uno de los experimentos recientes de Niantic es la función Pokémon Playgrounds en Pokémon Go, donde los usuarios pueden colocar pokémones en ubicaciones específicas para interactuar con otros jugadores. Esta función utiliza datos recopilados desde la perspectiva de los peatones.
Hasta el momento, Niantic ha recopilado 10 millones de ubicaciones escaneadas en todo el mundo, de las cuales más de un millón están disponibles a través del servicio VPS. Cada semana, la empresa recibe aproximadamente un millón de nuevos escaneos, cada uno de los cuales contiene cientos de imágenes. Los datos provienen de los juegos y de la aplicación Scaniverse para escaneo 3D.
Ubicaciones escaneadas en el mapa ( Niantic )
El sistema ha sido entrenado con más de 50 millones de redes neuronales que contienen en total más de 150 billones de parámetros. Cada modelo local se crea para un área específica; sin embargo, la integración de todos los datos locales permite generar modelos globales que comprenden no solo lugares concretos, sino también las relaciones entre ellos.
En el futuro, LGM podría usarse en diversas áreas: desde mejorar la navegación y crear contenido hasta optimizar la logística y la colaboración remota. La combinación de estos modelos con sistemas lingüísticos y multimodales permitirá desarrollar sistemas inteligentes capaces de percibir, analizar e interactuar con el mundo físico. Este modelo podría aplicarse en realidad aumentada, robótica, creación de contenido, sistemas autónomos y otros campos. Con el crecimiento de dispositivos portátiles como gafas AR, la inteligencia espacial podría convertirse en la base de nuevas tecnologías digitales.
El uso de los datos de los jugadores para entrenar la inteligencia artificial ha generado preguntas sobre la transparencia de estas prácticas. Los usuarios de Pokémon Go, que comenzaron a jugar en 2016, no podían prever que sus acciones servirían como base para el desarrollo de estos productos. Sin embargo, la empresa destaca que la base de datos única obtenida de las rutas peatonales tiene un gran valor para diversas áreas, incluidos los sistemas autónomos.
Niantic aún no ha especificado qué restricciones se aplicarán al uso de los datos de la empresa por parte de terceros, lo que deja abierta la cuestión sobre la ética y el control del acceso a los recursos.