VibeScamming: El phishing está al alcance de todos: la IA simplifica el fraude

08:30 / 10.04.2025

Los investigadores han descubierto un nuevo método de ataque que convierte incluso a los niños en potenciales ciberdelincuentes.

La plataforma Lovable, diseñada para generar aplicaciones web mediante indicaciones de texto, se ha convertido en un regalo inesperado para los ciberdelincuentes novatos. Según Guardio Labs, ha sido identificada como la más vulnerable a los llamados ataques de jailbreak, que permiten eludir las restricciones integradas y crear páginas de phishing casi indistinguibles de las reales.

Los expertos denominaron esta nueva técnica «VibeScamming», una referencia al término «vibe coding», en el que la lógica del software es generada por completo por la IA a partir de una descripción textual de la tarea. En el caso de Lovable, el resultado fue sorprendentemente útil para los atacantes: la plataforma no solo genera páginas que imitan, por ejemplo, el inicio de sesión de Microsoft, sino que también las publica automáticamente en Internet en su propio subdominio. Tras introducir su usuario y contraseña, la víctima es redirigida al sitio «office[.]com», y todos los datos se almacenan cuidadosamente y están disponibles a través de un panel de administración generado.

Además del parecido visual, los desarrolladores de Guardio señalan que, desde el punto de vista de la experiencia del usuario, la página falsa de Lovable incluso supera en ocasiones al original. Más aún, durante las pruebas, la plataforma ayudó sin problemas a ocultar la actividad de phishing ante las herramientas de seguridad, implementando métodos de evasión, ofuscación de contenido e integración con Telegram, Firebase y otros servicios para el robo y transmisión de datos.

La investigación mostró que Lovable se involucra fácilmente en escenarios de ataque por etapas. Basta con comenzar solicitando la automatización del phishing, y luego, a través de una serie de indicaciones aclaratorias, guiar a la IA hacia la creación de una campaña fraudulenta completa. Este proceso fue denominado internamente por el laboratorio de Guardio como «level up»: en cada paso, el atacante obtiene una herramienta cada vez más avanzada y peligrosa.

Estos ataques han sido posibles debido a la insuficiente rigidez de las restricciones integradas. Mientras que ChatGPT, según los investigadores, aún mantiene un umbral alto de resistencia ante solicitudes maliciosas, Claude de Anthropic resulta mucho más vulnerable, especialmente si se utilizan formulaciones que aparentan tener fines éticos o de investigación.

Lovable obtuvo el peor resultado entre las plataformas evaluadas: apenas 1.8 puntos sobre 10 en el nuevo benchmark de Guardio, diseñado específicamente para evaluar la resistencia de las IA ante abusos en escenarios de phishing. Claude obtuvo 4.3 puntos y ChatGPT, 8. Así, Lovable fue reconocida como el sistema más fácil de explotar entre los probados.

Una amenaza adicional proviene de un nuevo método de ataque denominado Immersive World. Este se basa en la creación de un universo ficticio con roles y reglas, lo que permite eludir los filtros de los LLM y solicitar la generación de software malicioso, desde keyloggers hasta scripts maliciosos para Chrome que recopilan contraseñas y otros datos.

El rápido desarrollo de la IA generativa abre a los atacantes posibilidades nunca antes vistas: crear software malicioso completo y sitios de phishing sin ningún conocimiento técnico. Como señalan en Guardio, en ausencia de restricciones estrictas, estas plataformas se transforman de herramientas de productividad en armas para los ciberdelincuentes.

VibeScamming: El phishing está al alcance de todos: la IA simplifica el fraude

Noticias sobre el tema

Administradores, revisen los registros: msbuild.exe e InstallUtil podrían no estar de su lado

Revisa los chats de tu hijo. Ahora el peligro no son las personas, sino la inteligencia artificial

De JavaScript a esteganografía en un solo ataque. Los ciberdelincuentes crearon un sistema "invisible" para distribuir malware

1 millón de tokens: Claude Sonnet 4 obtiene “memoria” suficiente para un repositorio de código completo

"El año del enemigo ingenioso": los hackers baten un nuevo récord de velocidad y sofisticación en sus ataques durante 2024

ん – El símbolo que reescribió las reglas de la ciberseguridad

Tu navegador te vendió a los publicistas — los asistentes con IA filtran todo, incluso en modo incógnito

Microsoft llama a todos: Bloqueen PowerShell y la ejecución de scripts

15 países: un único estándar. Google introduce licencias para aplicaciones de criptomonedas