Un nuevo giro en el caso de los datos protegidos.
Mark Zuckerberg mencionó la experiencia de YouTube en la lucha contra el contenido pirateado para justificar el uso por parte de Meta de un conjunto de datos que incluye libros electrónicos protegidos por derechos de autor. Esto se reveló en fragmentos del testimonio de Zuckerberg en el caso Kadrey v. Meta sobre infracción de derechos de autor en el ámbito de la IA.
Este caso forma parte de una serie de demandas en las que los titulares de derechos impugnan el uso de sus materiales para entrenar IA. Meta, al igual que otras compañías, afirma que su actuación está amparada por el "uso legítimo", aunque muchos autores no están de acuerdo.
Según las declaraciones de Zuckerberg, la base de datos LibGen, utilizada para entrenar los modelos Llama, fue objeto de discusión dentro de la compañía. Anteriormente, los empleados de Meta la calificaron como una "base de datos pirateada" y advirtieron sobre posibles problemas con los reguladores. Sin embargo, del testimonio de Zuckerberg se desprende que él "no estaba familiarizado" con LibGen y no participó en la decisión de utilizar esta base.
Durante las audiencias, Zuckerberg destacó que una política de prohibición total del uso de datos pirateados no siempre es razonable, comparando la situación con YouTube, donde el contenido se verifica en cuanto a derechos de autor solo después de su publicación. Zuckerberg puso como ejemplo a YouTube, que puede alojar temporalmente contenido pirateado pero trabaja activamente para eliminarlo. Según él, la mayor parte del contenido en la plataforma cumple con los requisitos de licencia.
Zuckerberg subrayó que YouTube logra un equilibrio entre la accesibilidad de la plataforma y el cumplimiento de los derechos de autor, lo que puede considerarse un enfoque razonable. También indicó que una prohibición total del uso de plataformas o datos que contengan materiales protegidos podría ser irracional si estos recursos toman medidas para abordar las infracciones. Este enfoque se utilizó para defender las acciones de Meta en el contexto del uso de datos de LibGen.
La comparación con YouTube, según los fragmentos publicados, sirvió para ilustrar cómo las empresas pueden manejar contenido con derechos de autor minimizando los riesgos. Sin embargo, los demandantes argumentan que Meta no solo utilizó datos pirateados, sino que lo hizo de manera consciente y sistemática, lo que la diferencia de YouTube. En particular, los abogados afirman que los empleados de Meta eran conscientes del origen ilegal de los materiales de LibGen, pero continuaron utilizándolos para entrenar modelos de inteligencia artificial.
En la nueva versión de la demanda se indica que la empresa utilizó LibGen para entrenar los modelos Llama 3 y, posiblemente, Llama 4. Además, se afirma que los investigadores de Meta supuestamente emplearon datos adicionales para ocultar el uso de materiales protegidos. También se alega que Meta descargó materiales de otra biblioteca pirateada, Z-Library, en abril de 2024.
Z-Library, al igual que LibGen, ha sido objeto de numerosas demandas judiciales, y sus creadores están acusados de lavado de dinero e infracción de derechos de autor. Actualmente, LibGen enfrenta la amenaza de cierre debido a una demanda por infracción de derechos de autor presentada por grandes editoriales, que exigen una indemnización de 30 millones de dólares.
Los abogados de Meta aún no han comentado las nuevas acusaciones.