La caché de Bing conserva datos eliminados de miles de empresas.
Los datos que una vez han llegado a Internet pueden seguir siendo accesibles en los chatbots de IA, incluso si se ocultan rápidamente. Esta conclusión fue alcanzada por especialistas de la empresa israelí Lasso, dedicada a la ciberseguridad y a las amenazas de la IA generativa.
Los investigadores descubrieron que la información de repositorios cerrados en GitHub continúa siendo indexada y utilizada por Microsoft Copilot. Entre las empresas afectadas se encuentran Microsoft, Google, IBM, PayPal, Tencent y otras. El problema está relacionado con la caché del motor de búsqueda Bing, que indexa repositorios públicos incluso si estuvieron accesibles solo por un corto período.
La situación salió a la luz cuando Lasso hizo accidentalmente público uno de sus repositorios y luego restringió el acceso. Sin embargo, al solicitar datos a través de Copilot, los investigadores descubrieron que la información eliminada seguía disponible. Analizaron miles de repositorios y determinaron que más de 20 000 repositorios eliminados o ocultos permanecen en la caché de Bing y son accesibles a través de Copilot. En total, más de 16 000 organizaciones se han visto afectadas.
El riesgo radica en que Copilot puede revelar información confidencial, incluyendo propiedad intelectual, datos corporativos, claves de acceso y tokens. Lasso también encontró en la caché una herramienta de Microsoft que permite generar imágenes "maliciosas y ofensivas" mediante IA en la nube.
La empresa notificó a las organizaciones afectadas y recomendó cambiar las claves comprometidas. Sin embargo, ninguna de las empresas involucradas, incluida Microsoft, ha comentado sobre la situación. En noviembre de 2024, Lasso informó del problema a Microsoft, pero esta lo clasificó como una "amenaza baja" y consideró que el comportamiento de la caché era aceptable.
Microsoft eliminó los enlaces a la caché de Bing de los resultados de búsqueda en diciembre de 2024, pero Lasso afirma que el problema no se ha resuelto por completo: los datos siguen estando disponibles en Copilot. Esto sugiere una solución temporal en lugar de una corrección definitiva.