Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Eigenaardig incident bij Grok duidt op zwakke punten in de beveiliging
Gepubliceerd op: 2025-05-19
Op 14 mei begon Grok, de AI chatbot van sociale netwerk X, plots herhaaldelijk berichten te plaatsen over witte genocide in Zuid-Afrika, een controversieel politiek onderwerp. Het begon ook ongevraagde reacties over dit onderwerp te genereren in verschillende contexten, wat op zijn beurt tot weer heel wat reacties van gebruikers leidde.
Onderzoek bracht aan het licht dat een medewerker een ongeautoriseerde wijziging aangebracht had in de systee-prompt van Grok. Het incident schond de beleidsregels van xAI, want standaard moeten prompt-updates eerst beoordeeld worden. Wie die ongeautoriseerde medewerker dan wel zou kunnen zijn, daarover werd druk gespeculeerd. Want het zou wel eens een hooggeplaatste persoon kunnen zijn, met banden met Zuid-Afrika en een leidende rol bij X. En wij laten het aan jouw fantasie over om te bedenken wie dat wel geweest zou kunnen zijn! De controverse trok de aandacht van industriefiguren zoals Sam Altman, die sarcastisch op X reageerde dat hij transparantie van xAI verwachtte.
Dit incident met Grok laat zien dat het relatief eenvoudig kan zijn om een AI te saboteren, vooral als er zwakke punten in de beveiliging en interne processen zitten. En dat moet beter. Denk aan bijvoorbeeld strenge voorwaarden voor toegang tot systeem-prompts, betere controles om ongeautoriseerde wijzigingen te voorkomen of te ontdekken vooraleer ze live gaan.
Een bijkomend probleem is dat de wijziging al op 14 mei aangebracht werd, en pas op 16 mei ontdekt werd doordat xAI publiekelijk reageerde. 2 dagen dus, wat betekent dat een AI aanzienlijke schade kan aanrichten voordat het probleem opgemerkt wordt.
Sentinel onderstreepte al in 2024 dat AI systemen vatbaar zijn voor verschillende bedreigingen, zoals prompt-injecties en ongeoorloofde toegang. xAI heeft nu zijn lesje geleerd en verschillende maatregelen aangekondigd. Zo publiceert het nu de systeem-prompts van Grok op GitHub, zodat het publiek wijzigingen kan controleren en feedback kan geven. Het zal strengere controles uitvoeren zodat prompt-wijzigingen altijd beoordeeld worden vooraleer ze live gaan. En er komt een speciaal team dat de antwoorden van Grok 24/7 zal monitoren om afwijkingen snel op te sporen.
(1)
https://techcrunch.com/2025/05/14/grok-is-unpromptedly-telling-x-...
(2)
https://www.teslarati.com/xai-update-grok-responses-white-genocid...
(3)
https://github.com/xai-org/grok-prompts...
(4)
https://edition.cnn.com/2025/05/16/business/a-rogue-employee-was-...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Zijn community notes even goed als échte factchecking?
Microsofts wil met NLWeb elke website een chatbot geven. Maar werkt het echt?
Hoe AI indirect ook een rol kan spelen bij medische doorbraken
Eigenaardig incident bij Grok duidt op zwakke punten in de beveiliging
Moet OpenAI zijn 'open' binnenkort laten vallen?
Software-ingenieurs: de eerste slachtoffers van AI bij Microsoft?
TikTok AI Alive: wordt het internet binnenkort overspoeld door een kattenchaos
Binnenkort gedaan met I'm Feeling Lucky?
Uber gaat nu in sommige Amerikaanse steden voor busje spelen
ChatGPT's Deep Research: slimme bestandsanalyse of overhypte beta?
Naar het Nieuws-archief...
Hardware
Zonnepanelen met een kill-switch: een gevaar voor het hele grid?
Wearable Whoop meet ook je bloeddruk op je pols en kan zelfs een ECG maken
Philips Fixables: print zelf reserveonderdelen van je toestellen
DNS-blokkades: piraterijjacht zet internetvrijheid op spel
Matter 1.4.1: sneller koppelen, maar nog steeds een slome slimme start
Microsoft: nieuw startmenu en nieuwe Surfaces
Studenten KU Leuven stellen nieuwe zonneauto voor
Nieuwe woordjes leren: Model Context Protocol
Vormen de afgedankte satellieten een groot gevaar voor de klimaatverandering?
Nieuw onderzoeksprogrammma van IMEC wil nog kleinere, minder energie verbruikende chips ontwikkelen
Naar het Hardware-archief...
Oor
Soundcloud komt tot inkeer na protest artiesten
Podcast De zaak ontleed en de levenslang-discussie
Podcast: Onder Ons Crimi over de zaak Horion
Spotify brengt een snooze knop uit
Spotify toont nu ook Plays
AI Playlist van Spotify voortaan ook in Europa
Podcast Napleiten: Verkeersongeval met twee jonge dodelijke slachtoffers
Cold Cases: Tegen het licht
All-In podcast: Amerikaanse politiek
Podcast: Het fortuin Carlier
Naar het Oor-archief...
Site
Tabs Magic: doe meer met je tabs
BnB Icons: icoontjes maken met AI
EarlyFinder: wees er als de eerste bij
Magic UI: voor design ingenieurs
Mailmodo: laat je contact een afspraak maken vanuit je mailing
PhraseClip: Chrome extensie om je woordenschat uit te breiden
NotionApps 2.0: apps maken zonder programmeren
Webifier: maak je eigen website
Syft AI: nieuws op jouw maat
Mobygratis: muziek die je mag gebruiken
Naar het Site-archief...
Tip
Slim: sneltoetsen voor je Chromebook
Raspberry Pi tip: enkele leuke projecten om te proberen
Zo kan je Edits van Instagram gebruiken
Grok gebruiken in X
Zo stel je niet storen in op je Android toestel
Toegankelijkheidstools in Firefox
Wat kan je eigenlijk doen met Windows Task Scheduler?
Zo kan je iemand toevoegen aan een groepsgesprek in Signal
Tip: laat Grok eens een document analyseren
Wat moet je doen vooraleer je telefoon te recycleren of door te verkopen?
Naar het Tip-archief...
Software
Aparte NotebookLM app voor Android
Pandoc: documenten omzetten
DockDoor: preview van je geopende vensters net als bij Windows
Unitor: prijsvergelijking vereenvoudigd
WinSCP: Bestanden beheren via het web
Granola: AI notities van je vergaderingen [iOS]
Cherryplayer: muziek streamen
Microsoft Clipchamp: video's maken
Winhance4: je systeem optimaliseren
Photo Demon: afbeeldingen bewerken
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL