Aan de hele AI-evolutie voor journalistiek en content zijn er toch twee facetten die niet lekker zitten. Enerzijds heb je dus Google, dat uitgevers wil betalen om artikels te laten schrijven door AI. En anderzijds heb je websites, die bestaan dankzij de content die gebruikers op hun hosting zetten, en nu die content gaan verkopen aan AI-bedrijfen om zo hun taalmodellen te trainen.
Concreet gaat het om Automattic, het moederbedrijf boven Tumblr en WordPress.com - en voor alle duidelijkheid: dit betreft niet mensen die een blog hebben op een zelf gehoste WordPress-website, want die blijven buiten schot.
Welnu, Automattic zou op het punt staan om een darl af te sluiten om de postings op WordPress.com en Tumblr ter beschikking te stellen van OpenAI en Midjourney, zodat die hun taalmodellen daarop kunnen trainen. En dat stuit op verzet.
Niet alleen omdat Automattic zo geld verdient op de rug van bloggers en hun content, die niets van dat geld in hun richting zien komen. Maar ook omdat het gevaar bestaat dat ook privépostings in die data zullen zitten. Het is namelij zo dat Automattic, toen het Tumblr overnam, de content van de jaren 2014 tot 2013 schraapte voor een data dump. Maar per ongeluk ook privépostings in die dump stak.
Automattic biedt wel een opt-out tool aan de bloggers aan, maar het is niet duidelijk of dat data die al gedeeld waren, ook retroactief verwijderd zullen worden.
Het is nu eenmaal zo dat door al die bloggers en websites aangemaakte "menselijke" content het nieuwe goud is voor het trainen van AI-modellen. Voor de bloggers zelf wordt het steeds duidelijker dat hun gegevens, hun data, dat goud zijn. En zij staan machteloos - hun postings worden gebruikt zonder hun toestemming, zonder respect voor hun privacy, en zonder financiële vergoeding. De ontevredenheid over deze gang van zaken neemt dus toe.
https://www.404media.co/tumblr-and-wordpress-to-sell-users-d ...
|