Twee artikels die verschillende aspecten belichten van het probleem met auteursrechten - het feit dat large language modellen gebaseerd zijn op enorme hoeveelheden teksten. Zonder dat aan de auteurs gevraagd werd of zij daarmee toegestemd hebben. En vooral: zonder dat de auteurs daarvan vergoed worden, wanneer die LLM's als basis dienen voor AI tools waarvoor geld gevraagd wordt.
Het eerste artikel dat hierover gaat, vonden wij bij IEEE Spectrum - een gastartikel, dus niet van IEE zelf. Dat gaat in op het feit dat LLM's in staat zijn om in hun antwoorden, exacte citaten te vertonen van een van de teksten van de LLM waarop zij getraind waren. Dat gaat, volgens het artikel, zelfs heel ver. Zo zouden LLM's gemanipuleerd kunnen worden om privégegevens zoals e-mailadressen en telefoonnummers te geven, in antwoord op een vraag. Sommige chatbots zouden ook langere teksten letterlijk weergeven.
Iets wat de auteur van het artikel "plagiaat outputs noemt", omdat, wanneer een mens een dergelijke tekst zou neerschrijven, die wel degelijk van plagiaat beschuldig zou worden. (1)
Een tweede artikel gaat dan weer over het feit wie verantwoordelijk gesteld moet worden wanneer er een inbreuk gemaakt wordt op een auteursrecht, via een LLM. En dat artikel stelt gewoon dat het de schrijver van de prompt is, die dan verantwoordelijk is. OP voorwaarde dat de LLM engine (1) met goede bedoelingen gebruik maakt van werken waarop auteursrechten berusten (en er dus geen replica gemaakt wordt van het originele werk, enkel maar gebruikt wordt om het werk te begrijpen en de LLM te ontwikkelen en (2) de outputs volledig gebaseerd zijn op de prompt van de gebruiker.
Een interessant idee. Meer bij Techdirt, waar je ook veel reacties op dit idee vindt/
https://spectrum.ieee.org/midjourney-copyright
https://www.techdirt.com/2024/01/05/copyright-liability-on-l ...
|