Protegiendo a los creadores frente a la IA

La tensión entre creación y entrenamiento de IA

La llegada de los modelos generativos —aquellos que pueden escribir textos, componer imágenes o imitar voces— ha puesto sobre la mesa una pregunta central: ¿quién debe controlar y cobrar por los contenidos utilizados para entrenar esas máquinas? Para funcionar, esos sistemas ingieren enormes volúmenes de textos, imágenes, audios y otros archivos. Durante la fase de entrenamiento se reproducen y analizan esos materiales para que los algoritmos identifiquen patrones.

Esa dinámica resulta inquietante para muchos creadores: editores, traductores, ilustradores, actores de doblaje y músicos ven cómo plataformas y empresas tecnológicas, como OpenAI, Anthropic o Microsoft, obtienen productos comerciales que en parte se apoyan en obras ajenas. Algunos artistas ya están buscando maneras de protegerse —incluso con medidas como el registro de voces— para controlar el uso de su trabajo.

Derechos de autor: una protección preventiva

Según Eleonora Rosati, catedrática de Derecho de la Propiedad Intelectual en la Universidad de Estocolmo y colaboradora del despacho Bird & Bird, la clave es recordar que los derechos de propiedad intelectual tienen una naturaleza preventiva. Eso implica dos vías claras: o se cuenta con el permiso del titular de los derechos para usar su obra en el entrenamiento, o se invoca una excepción legal que autorice ese uso sin permiso.

Además de ese principio, Rosati subraya otro elemento decisivo: la transparencia. Saber qué datos se han empleado para entrenar un modelo es esencial para evaluar posibles vulneraciones y para que los titulares de derechos puedan reclamar cuando proceda.

Panorama legal internacional: obligaciones y propuestas

El marco normativo no es homogéneo. En la Unión Europea existen obligaciones de transparencia recogidas en el Reglamento de IA, que imponen ciertos requisitos a las desarrolladoras. Por contraste, jurisdicciones como Reino Unido aún no cuentan con reglas comparables y están evaluando si deben implantar obligaciones similares.

En Francia se discute un cambio notable: un proyecto de ley que introduciría una presunción de uso, es decir, se daría por hecho que cierto contenido fue utilizado para entrenamiento y correspondería al desarrollador demostrar lo contrario. Ese giro alteraría la dinámica probatoria tradicional en casos de derechos de autor.

Mientras tanto, Estados Unidos afronta numerosas demandas colectivas presentadas por creadores que alegan que sus obras se usaron sin permiso. Algunas de esas disputas ya han terminado en acuerdos relevantes: Anthropic alcanzó un arreglo extrajudicial por 1.500 millones de dólares con un grupo de autores. Hay decenas de casos pendientes que podrían marcar precedentes y desembocar en reparaciones multimillonarias si los demandantes prosperan.

Excepciones y la doctrina del “fair use”

En la UE existen excepciones para la minería de textos y datos (TDM), pero no son amplias ni automáticas. Estas excepciones aplican principalmente a actividades de investigación y en contextos sin ánimo de lucro, y exigen que el acceso al material haya sido legítimo —es decir, sin piratería. Esa misma idea ha encontrado eco en Estados Unidos bajo la doctrina del fair use: si la fuente del material es ilícita, el argumento de uso legítimo pierde fuerza.

Rosati apunta además que la analogía entre una persona que lee y aprende y una máquina que procesa textos no es perfecta. Una persona que consulta obras y luego crea algo nuevo realiza un proceso distinto al de un modelo que reproduce matemáticamente fragmentos de los contenidos: técnicamente, la IA realiza actos de reproducción que, según la ley, podrían estar reservados a los titulares de derechos.

La discusión sobre la “memorización” de los modelos también es crítica. Estudios recientes muestran que los modelos pueden reproducir pasajes textuales con mayor frecuencia de lo que se admitía, pero desde el punto de vista legal, incluso copias efímeras durante el procesamiento pueden constituir una reproducción protegida.

Fallos y documentos oficiales: la relevancia del origen del material

Un punto repetido en fallos y en informes oficiales es que el origen del material cuenta. En uno de los pleitos que presionaron a Anthropic hacia el acuerdo, la juez no negaba el acceso legítimo a contenidos en general, sino que detectó que parte de los documentos procedían de sitios de piratería. En Estados Unidos, tanto decisiones judiciales como un informe de la Oficina de Derechos de Autor señalan que la doctrina del fair use no cubre material obtenido de forma ilícita.

Esa conclusión no es menor: si grandes lotes de datos usados para entrenar modelos proceden de fuentes no autorizadas, las desarrolladoras no solo enfrentan reclamaciones económicas, sino también un riesgo regulatorio y reputacional significativo.

¿Qué pueden hacer los creadores y las empresas?

Para los creadores hay varias vías prácticas, aunque ninguna es sencilla ni uniforme:

Registrar y documentar sus obras y sus derechos (incluida la voz, en el caso de intérpretes) para facilitar reclamaciones posteriores.
Exigir transparencia a las plataformas: solicitar información sobre qué datos se emplearon y en qué condiciones.
Negociar acuerdos de licencia que permitan usos concretos para entrenamiento, estableciendo compensaciones y límites.

Las empresas desarrolladoras, por su parte, pueden mitigar riesgos si:

Aseguran el acceso legal al material usado en entrenamiento y registran las fuentes.
Implementan sistemas de trazabilidad y transparencia que permitan auditar datasets.
Evalúan acuerdos con colectivos de creadores para evitar litigios costosos y fomentar modelos sostenibles de remuneración.

Implicaciones para América Latina

Aunque gran parte de las disputas se concentra en Estados Unidos y Europa, las decisiones que tomen esas jurisdicciones tendrán impacto global. Para países latinoamericanos es relevante observar tres cosas:

Las normas y precedentes internacionales influirán en cómo las plataformas operan en la región.
Los creadores locales deben estar atentos a sus mecanismos de registro y a las posibilidades de licenciamiento colectivo.
Las autoridades pueden adelantarse con marcos que garanticen transparencia y protejan a los titulares de derechos, evitando que terceros aprovechen lagunas legales.

En mercados con industrias culturales en crecimiento, es clave impulsar políticas públicas y capacidades técnicas que permitan a creadores negociar en pie de igualdad con plataformas tecnológicas.

Conclusión

La discusión sobre la IA generativa y los derechos de autor está lejos de resolverse. La mezcla de tecnología, prácticas de recolección de datos y marcos legales distintos genera incertidumbre. Como recuerda Eleonora Rosati, los derechos de propiedad intelectual son preventivos: si se va a usar contenido para entrenar, o hay permiso, o hay una excepción legal bien aplicada. La transparencia y la procedencia legal de los datos aparecen como factores decisivos para evitar litigios y para construir modelos de IA que respeten la creación humana.

Mientras las cortes y los legisladores dirimen estas cuestiones, tanto creadores como empresas tendrán que adoptar medidas prácticas: documentar obras, exigir trazabilidad de datos y explorar acuerdos de licencia que permitan un equilibrio entre innovación tecnológica y remuneración justa para quienes producen el contenido que alimenta a la inteligencia artificial.