Este informe analiza cómo funcionan los modelos de inteligencia artificial generativa y los retos que plantean para la protección de los derechos de autor.
A diferencia de los sistemas predictivos tradicionales, estos modelos generan nuevos contenidos a partir de distribuciones estadísticas en espacios de alta dimensionalidad, lo que hace que cada salida esté inevitablemente influida por los datos de entrenamiento. Esta dependencia genera dos problemas clave: la dificultad de atribuir la influencia de obras concretas y la incertidumbre sobre si los resultados son realmente novedosos o simples reproducciones estadísticas de patrones ya existentes.
Se subraya que la falta de mecanismos de trazabilidad constituye una “brecha estructural” que impide conectar outputs con las obras que los alimentaron, debilitando la capacidad de los titulares para reclamar derechos o compensaciones justas. Frente a este escenario, el estudio recomienda invertir en infraestructuras técnicas que permitan auditar modelos, documentar la procedencia de los datos, crear métricas de influencia estadística y establecer estándares de atribución y gobernanza. También propone evolucionar los modelos de remuneración desde el enfoque basado en copias literales hacia sistemas que reconozcan el uso estadístico y acumulativo de obras protegidas.