Je hebt kunnen lezen dat de New York Times een officiële klacht ingediend had tegen OpenAI, omdat die laatste zijn taalmodellen getraind zou hebben met behulp van materiaal waarop auteursrechten berusten. Het argument dat NYT daarbij aanhaalt, is het feit dat teksten, die letterlijk weergevonden werden in antwoorden van AI's zoals ChatGPT, niet tot het open internet behoorden, maar achter de betaalmuur stonden.
Dat is dus in tegenstrijd met de bewering van OpenAI dat het zich voor zijn LLM's enkel gebaseerd heeft op publiek beschikbare teksten. Maar ondertussen heeft OpenAI wel toegegeven dat het onmogelijk zou zijn om zijn LLM's te maken, zonder daarbij gebruik te maken van auteursrechtelijk beschermde werken. Want, en daar heeft het wel een beetje gelijk "auteursrechten beschermen zowat elke soort menselijke werken, waaronder blog postings, foto's, forum postings, fragmenten van software code, en zelfs documenten van de overheid. "
Het alternatief? LLM's modellen maken op basis van content die al decennia geleden gemaakt werd, en die dus ondertussen tot het publieke domein behoort, zou een interessant experiment zijn. Maar het zou echt niet beantwoorden aan wat de mens van vandaag op het gebied van AI verwacht...
https://www.engadget.com/openai-admits-its-impossible-to-tra ...
https://techcrunch.com/2024/01/08/openai-claims-ny-times-cop ...
|