Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Anthropic is de eerste om zijn system prompts te publiceren
Gepubliceerd op: 2024-08-28
Generatieve modellen zijn gewoon systemen die met statistieken werken, en voorspellen wat het woord is dat het meeste kans heeft om op het vorige te volgen. Echte kennis heeft het dus niet. Maar de AI volgt wel instructies, zoals de system prompts. Die voorzien de modellen van hun basiskwaliteiten en vertellen hen ook wat zij mogen doen en wat niet.
Elke AI verkoper, van OpenAI tot Anthropic, gebruikt dergelijke system prompts om (proberen) te voorkomen dat de modellen ongewenst gedrag zouden vertonen. En ook om de toon en het gevoel in de antwoorden van het model bij te sturen. Zo kan een system prompt een model bevelen om beleefd te zijn, maar nooit verontschuldigend. Of, zoals bij Grok, om grappig te zijn.
Nu is het wel zo dat de verkopers van die AI modellen niet veel lossen over hun system prompts, wellicht om niet te veel te verklappen aan de concurrentie. Maar anderzijds is het ook zo dat als mensen weten wat die system prompts zijn, het ook gemakkelijker zou worden om die te omzeilen. OPenAI bijvoorbeeld, zo vertelt TechCrunch, houdt de system prompts van GPT-4o geheim, en de enige manier waarop je die te weten kan komen, is door een prompt injection aanval. En zelfs dan nog kan de output niet volledig vertrouwd worden.
Anthropic doorbreekt nu die regel. In zijn strategie om zichzelf voor te stellen als de meer ethische, transparantere AI verkoper, heeft het nu de system prompts voor zijn nieuwste modellen bekendgemaakt, namelijk voor Claude 3 Opus, Claud 3.5 Sonnet en Claude 3.5 Haiku, die je in de Clause apps voor iOS en Android aantreft, en op het web.
Meer nog: Anthropic heeft aangekondigd dat het van plan is om deze updates en de verdere verfijning van zijn system prompts in de toekomst zal blijven openbaar maken. Zo kan je een beetje volgen wat de nieuwe mogelijkheden zijn.
(1)
https://techcrunch.com/2024/08/26/anthropic-publishes-the-system-...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Kan een AI echt wraakzuchtig zijn?
OpenAI heeft twee nieuwe beveiligingsdingen toegevoegd aan ChatGPT
Telegram heeft een flinke update gekregen
Threads krijgt een handige nieuwe functie dankzij gebruikersklachten
TikTok US krijgt een 'Local Feed' voor dingen bij jou in de buurt
Google lanceert Waxal: AI beter maken voor Afrikaanse talen
Een groot illegaal streaming-rijk stort in
OpenAI test advertenties in ChatGPT
Discord gaat strenger controleren op leeftijd: het begin van het segmenteren van het internet?
Europa investeert fors in toekomstige chips
Naar het Nieuws-archief...
Hardware
Microsoft bouwt Sysmon standaard in Windows 11 in
AI-gesprekken niet beschermd door advocaat-cliënt privilege: een aardverschuiving in de advocat
Ferrari's eerste elektrische auto: de Luce
Elon Musk verandert van plan: SpaceX kiest eerst voor een maanstad, Mars komt later
Withings BeamO: meer dan een thermometer.
Russische satellieten bespioneren Europese satellieten
Google Home krijgt eindelijk knoppen
Xteink X4: De kleinste e-reader die in je zak past
China combineert AI met traditionele Chinese geneeskunde
Blinden kunnen eindelijk zien hoe zij eruit zien
Naar het Hardware-archief...
Oor
YouTube lanceert een handige AI-playlistmaker – maar alleen voor betalende gebruikers.
AI-datacenters in de ruimte: totale science-fiction of slim businessplan?
Spotify maakt songteksten nóg handiger
Deezer slaat alarm over AI-muziek en verkoopt nu zijn detectietool aan anderen
All-In podcast: over censuur
ElevenLabs lanceert The Eleven Album – een album gemaakt met AI en echte artiesten
Spotify test 'Page Match': sync je audiobook met je papieren boek
Bandcamp verbiedt AI-muziek: puur menselijk werk eerst
Universal Music Group en Nvidia werken samen aan AI voor muziek
Spotify brengt 'Listening Activity' naar je telefoon
Naar het Oor-archief...
Site
Lunar AI: verklarende video
Aeris: vluchten volgen in 3D
Internet Intro: ontdek nieuwe leuke websites
Timeline of Rome: tijdlijn
Indo-European Explorer: taal afstamming
The Office Lines: dialogen
MDash: Markdown editor
Split The Distance: halfweg
Hero Wars: online game
FLLAUNT: je cv uitbouwen
Naar het Site-archief...
Tip
Google Photos: herinneringen van bepaalde periodes uitsluiten
Google Photos: Automatische herinneringen
Activeer meldingen voor te hoge bloeddruk op je Apple Watch
Google Photos: verberg afbeeldingen van andere apps
Slimmer werken met Google Photos: sneller delen
Zo schrijf je een langer artikel op X
Microsoft Word maakt hyperlinks makkelijker en sneller
Tip: Gebruik de verborgen Reading Mode in Google Chrome voor rustiger lezen
Tips & Tricks: De supersnelle Excel-sneltoets Ctrl+1
Tips & Tricks: Controleer of je thuisnetwerk gehackt is
Naar het Tip-archief...
Software
UltraStar Deluxe (USDX)
Iriun Webcam: je smartphone als webcam
Tails: Linux op een stick
R'n'D Jue II: puzzelen
LDraw: virtuele Lego-modellen
TeamViewer: computer vanop afstand besturen
DinoTracker: geef een melding door van een spoor
InnoExtractor: bestanden extraheren
Task Coach: taken beheren
Yomio: slimmer geld besteden
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL