| Home | Archief nieuwsbrief | Abonnement | Wie zijn wij ? | Contact | Adverteren |
Nieuwsberichten van 20/02/2024
[Nieuws]Zoeken wordt nooit meer zoals vroeger: heeft...
[Nieuws]Ook Amazon doet mee aan de AI-race
[Nieuws]EU: mogelijk 500 miljoen euro boete voor Appl...
[Oor]YouTube laat je muziek remixen in Shorts
[Site]Follow Up Then: herinnering
[Site]I Have No Tv: documentaires
[Software]Metro Commander: bestanden
De meeste populaire reacties
[14]Vragen van de lezers ...
[9]Vragen van de Netties-lezers ...
[8]Vrijdag alternatieve OS: Ubuntu 9.1 ...
[7]Netties vraagt hulp lezers bij oplo ...
[7]Linux - Deel 1 - Een korte inleidin ...
De meeste recente reacties
Tip: hoe kan je een foute Facebook posting me ...
Snapmail: zelf-vernietigende mails ...
De ene site om YouTube filmpjes naar MP3 om t ...
GDPR: Europa tracht de burger te beschermen ...
Robocops patrouilleren al in de straten ...
Zoeken met Google 


Reclame 

Volledig artikel

Zoeken wordt nooit meer zoals vroeger: heeft robots.txt nog zin?
Dat wij dingen aan Google kunnen vragen, is omdat zijn "spiders" dag na dag het web afspeuren en alle mogelijke teksten en websites indexeren. Die spiders worden daarbij geholpen door de robots.txt, die webmasters op hun website zetten. Dat is een simpel tekstbestand waarin de webmaster zet welke pagina's van zijn website wel en niet geïndexeerd mogen worden. Pagina's die regelmatig ververst worden bijvoorbeeld wel, pagina's die bijna nooit veranderen niet bijvoorbeeld. Dat bespaart de server waarop de website staat computerkracht, en maakt het anderzijds voor de zoekmachines eenvoudiger om het web sneller en efficiënter te indexeren.

Uiteraard kan een zoekmachine die instructies negeren, maar robots.txt is uitgegroeid tot een soort van onofficiële overeenkomst tussen websites en zoekmachines: jij mag mijn content crawlen, en in ruil zend jij mij verkeer.

Maar met de opkomst van de Large Language Modellen, de basis voor de huidige AI-tools, werkt die overeenkomst niet meer. De meeste AI-bedrijven negeren gewoonweg die robots.txt. Het is immers geen wettelijk document. En wat meer is: waar de zoekmachines nog verkeer zenden naar de websites, doen de LLM's dat zelden of nooit.

Met andere woorden: moet er niets in de plaats komen van de robots.txt, dat uitgevers meer controle kan geven over wat geïndexeerd mag worden, en waarvoor het gebruikt mag worden?
The Verge heeft hier een heel interessant artikel over;

https://www.theverge.com/24067997/robots-txt-ai-text-file-we ...
geef uw reactie hier

  
Archief per categorie

Nieuws
Even zonder netties... 30/04
Apple lanceert openELM... 26/04
Meta: Threads doet het goed, maar invest... 26/04
Google Meet laat je gesprekken tussen to... 26/04
EU: problemen met TikTok Lite en strenge... 25/04
Windows 11: voortaan met advertenties... 25/04
Microsoft: lichtgewicht AI , Phi-3 Mini,... 24/04
Nieuwe versie van Adobe Firefly maakt he... 24/04
Meta opent het Quest OS ook voor andere ... 23/04
Dating: Tinder lanceert Share My Date en... 23/04
Meer artikels ....
Hardware
Update voor slimme bril Ray-Ban Meta ... 25/04
Open Home Foundation moet open standaard... 23/04
Menteebot: een robot zo groot als een me... 22/04
Meta wil de Quest in het klaslokaal... 18/04
Nieuwe interfaces bedenken: AI pin bewij... 17/04
Nieuwe ereaders van Rakuten Kobo... 12/04
Google Next: nieuwe Axion chips voor de ... 11/04
Nieuwe woordjes leren: JGEGLI... 10/04
Google: nieuw Find My Device netwerk... 08/04
Oura Ring Labs: experimentele functies... 04/04
Meer artikels ....
Oor
Apple verwerpt update van Spotify... 26/04
Amazon Maestro: AI speellijst... 17/04
Podcast: Napleiten... 15/04
RIP Google Podcast... 03/04
Oproep: doneer je muziek streaming data... 02/04
Spotify: voortaan ook cursussen... 26/03
Neil Young keert terug naar Spotify... 15/03
Spotify lanceert muziekvideo... 14/03
Podcast: Something was wrong... 11/03
De stemmen van Assisen: de moord op Ingr... 06/03
Meer artikels ....
Site
Meldpunt Drugsplantage Ontdekt... 26/04
Two Seven: samen kijken... 26/04
Be Smart: hoe ons brein ons laat geloven... 25/04
Well Tempered Traveler: temperatuur... 25/04
Portwatch... 24/04
FARO: Vlaams steunpunt voor cultureel er... 24/04
Mental Floss: spionnen... 23/04
Off The Grid... 23/04
Click That Hood... 22/04
Open Infrastructuur Map... 22/04
Meer artikels ....
Tip
Apple watch Faces: wat is het en hoe ins... 19/04
Google Photos update: leuke AI nieuwighe... 02/04
Netflix: ontdek meer titels... 20/03
Firefox: binnenkort tab previews... 18/03
Bekijk op je iPhone waar jij je foto s n... 13/03
Zo zet je Gemini als je standaard assist... 04/03
Zo maak je een avatar die je document vo... 28/02
Leren dankzij AI met gebruik van YouTube... 26/02
Wat moet je doen als je iPhone per ongel... 22/02
Fotografie: bewegingseffect... 09/02
Meer artikels ....
Software
Boom App... 26/04
Audacity 3.5: nieuwigheden... 25/04
Erfgoed App... 24/04
WinToys: sleutelen... 23/04
Edison Mail: mailclient... 22/04
LocalSend: bestanden verzenden... 19/04
AirChat: Twitter maar dan met spraak... 18/04
DxO PhotoLab: beeldbewerker... 17/04
Forest: tab manager... 16/04
Lawnchair: nu ook voor andere toestellen... 15/04
Meer artikels ....
(c) www.netties.be 1.0 -- hosting & programmatie www.webdynamics.be (c)