Acusan a OpenAI de borrar datos clave en caso de derechos de autor

Ingenieros de OpenAI borraron accidentalmente posibles evidencias en una demanda por infracción de derechos de autor presentada por The New York Times y Daily News.

Como parte del proceso legal, OpenAI accedió a permitir que los abogados de los editores revisaran los conjuntos de datos de entrenamiento de su inteligencia artificial para buscar contenido protegido por derechos de autor.

Eliminación de datos de manera accidental

Desde el 1 de noviembre, un equipo de abogados y expertos comenzó a analizar los datos de entrenamiento de OpenAI en máquinas virtuales configuradas por la compañía. Sin embargo, el 14 de noviembre, los abogados de los demandantes informaron que, tras 150 horas de trabajo, parte de los datos almacenados en una de las máquinas virtuales habían desaparecido.

Aunque OpenAI logró recuperar la mayoría de los datos eliminados, los abogados señalaron que los datos recuperados no incluían los nombres de archivos ni la estructura de carpetas, lo que los hace inutilizables para identificar si los artículos protegidos por derechos de autor se utilizaron en el entrenamiento de los modelos de la empresa.

En una carta presentada el 20 de noviembre ante un tribunal de distrito de Estados Unidos, los abogados afirmaron que los demandantes se vieron obligados a recrear desde cero su trabajo, lo que implicó un gran esfuerzo en horas laborales y recursos informáticos.

Según la carta, los demandantes descubrieron el día anterior que los datos recuperados eran inservibles, lo que obligó a repetir una semana completa de análisis por parte de sus expertos y abogados.

Aunque los abogados reconocieron que la eliminación de datos no fue intencional, subrayaron que OpenAI estaba en la mejor posición para realizar la búsqueda de datos dentro de sus propios conjuntos.

OpenAI defiende su uso de datos y negocia acuerdos con editores

OpenAI enfrenta múltiples demandas de editores que alegan infracción de derechos de autor. La compañía argumenta que entrenar sus modelos de inteligencia artificial con datos públicamente accesibles, como artículos de noticias publicados por The New York Times, constituye un uso legítimo de dicho contenido.

A pesar de las disputas legales, OpenAI ha establecido acuerdos de licencia de contenido con importantes editores, entre ellos Reuters, Associated Press, Financial Times y Axel Springer, la empresa matriz de Business Insider y Politico.

Fuente: WIRED

Salir de la versión móvil