Meta se enfrenta a una demanda colectiva presentada por cinco importantes editoriales de libros y un autor por afirmaciones de que la empresa “incurrió en una de las violaciones de material protegido por derechos de autor más extensas de la historia” al entrenar su modelo Llama AI, como previamente reportado por New York Times. En el su trajeMacmillan, McGraw Hill, Elsevier, Hachette, Cengage y el autor Scott Turow alegan que Meta “copió repetidamente” sus libros y artículos de revistas sin permiso.
La demanda acusa a Meta de copiar intencionalmente trabajos protegidos por derechos de autor de “sitios piratas conocidos”, como LibGen, Anna’s Archive, Sci-Hub, Sci-Mag y otros, y luego incorporar ese material en sus modelos de IA. También afirma que Meta entrenó a Llama con información del conjunto de datos Common Crawl, que supuestamente está “lleno de copias no autorizadas de obras protegidas por derechos de autor”. Como resultado, Llama “genera reemplazos palabra por palabra y casi palabra por palabra” del material protegido por derechos de autor:
Por ejemplo, cuando se le solicitaron dos frases cortas del libro de texto más vendido de Cengage, Calculus: Early Transcendentals, novena edición, de James Stewart, Llama comenzó a reproducir la continuación del pasaje palabra por palabra.
Un grupo de autores también demandó a Anthropic por infracción de derechos de autor. Aunque un juez federal dictaminó que entrenar un modelo de IA en libros comprados legalmente sin permiso se considera uso legítimo, permitió al autor presentar una demanda colectiva sobre “millones” de obras antrópicas supuestamente pirateadas. Anthropic acordó pagar al autor 1.500 millones de dólares el año pasado para resolver una demanda colectiva.
Turow y un grupo de editores demandaron a Meta por daños y perjuicios y pidieron al tribunal que ordenara a la empresa bloquear la actividad supuestamente ilegal. También pidieron al tribunal que exija a la empresa que proporcione una lista de libros, artículos de revistas y otros trabajos protegidos por derechos de autor utilizados para entrenar su modelo Llama AI.
“La IA impulsa la innovación, la productividad y la creatividad transformadoras para individuos y empresas, y los tribunales han determinado que la capacitación en IA sobre material protegido por derechos de autor puede considerarse uso legítimo”, dijo el portavoz de Meta, Dave Arnold, en un comunicado enviado por correo electrónico a Borde. “Lucharemos agresivamente contra esta demanda”.



