Meta y 82 terabytes de pecado: ¿robo por el bien de la IA o una excusa lamentable?

Meta y 82 terabytes de pecado: ¿robo por el bien de la IA o una excusa lamentable?

La empresa descargó en secreto toda una biblioteca… y cree que está bien.

image

La polémica sobre los derechos de autor, que ya lleva casi dos años, sigue sin resolverse: Meta* no muestra arrepentimiento y continúa defendiendo en los tribunales que puede entrenar sus redes neuronales con materiales protegidos por derechos de autor, considerando esto una práctica absolutamente legítima. Esta postura cuenta con el respaldo de un grupo de profesores de derecho de universidades estadounidenses de renombre.

El conflicto estalló en julio de 2023, cuando los escritores Richard Kadrey, Sarah Silverman y Christopher Golden acusaron a Meta de utilizar ilegalmente sus textos para entrenar el modelo lingüístico LLaMA. En febrero de 2024, presentaron pruebas impactantes: la compañía habría descargado más de 81,7 terabytes de datos de “bibliotecas en la sombra” a través del sitio Anna’s Archive, usando el servicio BitTorrent.

Sin embargo, expertos en propiedad intelectual de Harvard, Emory, la Universidad de Boston y la Universidad de Santa Clara salieron en defensa del gigante tecnológico. En su declaración pericial (amicus brief), afirmaron que la fuente de los datos no es determinante si el material permite crear un producto completamente nuevo.

En algunos países, esta cuestión ya está regulada por ley. Por ejemplo, Japón y Singapur permiten a las empresas tecnológicas entrenar redes neuronales con materiales protegidos sin necesidad de obtener permiso de los titulares de los derechos. En enero, Keiko Nagaoka, ministra japonesa de Educación, Cultura, Deportes, Ciencia y Tecnología, declaró que las compañías pueden utilizar cualquier contenido —sin importar su origen ni los fines comerciales del entrenamiento de la IA.

No obstante, los opositores de Meta señalan serias fallas en sus argumentos. Pascal Hetzscholdt, director de protección de contenidos de la editorial Wiley, recuerda una reciente decisión del Tribunal Supremo de EE. UU.: las empresas solo pueden usar materiales ajenos libremente si crean con ellos algo sustancialmente nuevo y con un propósito distinto.

Los modelos de IA de Meta son productos comerciales que utilizan obras protegidas para generar contenido que, a menudo, cumple la misma función que los originales, explica el experto.

Además, señala que la declaración de los expertos no menciona que los modelos de Meta no son proyectos académicos ni investigaciones al servicio del bien común. Por el contrario, están diseñados para generar miles de millones de dólares en ganancias para sus creadores.

Y aún hay más: correos internos filtrados de 2025 revelaron numerosos detalles comprometidos sobre las prácticas internas de la empresa. El departamento legal discutía abiertamente cómo evitar la compra legal de derechos sobre libros en favor de fuentes piratas. Los empleados hablaban sin tapujos de los riesgos de ser descubiertos y se aconsejaban mutuamente usar VPN para ocultar los rastros de las descargas ilegales. Esto constituye una prueba directa de que el gigante tecnológico actuó deliberadamente en contra de la ley.

El estudio Cloze Encounters incluso confirmó la motivación comercial de esta estrategia: las redes neuronales entrenadas con libros protegidos por derechos de autor muestran un rendimiento un 23 % superior. Los textos pirateados ayudan a los algoritmos a elegir palabras con mayor precisión, construir frases más coherentes y simular con más eficacia el estilo de escritura humano. La empresa violó la ley a sabiendas para obtener esta ventaja… y lucrarse con ella.

Ahora, el destino de este caso sin precedentes —capaz de redefinir el futuro de la relación entre tecnológicas y titulares de derechos— está en manos de los tribunales. Pero Hetzscholdt y sus colegas subrayan: los tribunales estadounidenses jamás considerarán legítimo el uso de propiedad ajena si se demuestra que una empresa ha evadido deliberadamente la protección legal y ocultado sus acciones.

¿Estás cansado de que Internet sepa todo sobre ti?

¡Únete a nosotros y hazte invisible!