Even dit: de Alexa in dit artikel is niet de voice assistent van Amazon, maar Alexa Internet, een dienst die het internet afliep op zoek naar metadata en andere informatie, die dan via de browser gebracht werd, zodat je een idee kreeg van de content op een website. Deze Alexa werd later opgekocht door Amazon, voor 250 miljoen dollar, en omgevormd tot een SEO-dienst.
Alexa was opgericht door Brewster Kahle in 1996, zo lees je in een interessant artikel bij Techradar. De man had, naast het idee voor Alexa, een tweede project: een non-profit die hij Internet Archive noemde. Dat wou hij uitbouwen tot een moderne versie van de bibliotheek van Alexandrië, waar alle kennis van het internet verzameld zou worden.
25 jaar later is bestaat die bibliotheek nog altijd. Via de interface van de Wayback Machine kan je die informatie vrij raadplegen, alsook miljoenen gedigitaliseerde boeken.
Het Archief vierde dit jaar wel zijn 25e verjaardag. Het bezit een indrukwekkende 70 petabyte (of 70.000 terabyte) aan content, bestaande uit 635 miljard webpagina's, en 34 miljoen boeken, 14 miljoen audio-opnames en meer. Dit alles wordt opgeslagen op harde schijven in de hoofdkwartieren van het Internet Archive, maar er is ook een back-up in Nederland en, als een symbolisch gebaar, in het Egyptische Alexandrië.
Maar het project worstelt met uitdagingen. Er wordt steeds meer content gefabriceerd, en dan rijst de vraag: moet àlles bewaard blijven, of enkel wat belangrijk is - en hoe bepaal je wat belangrijk is?
Een heel mooi artikel over het Internet Archive bij Techradar.
https://www.techradar.com/news/the-story-of-the-fight-to-arc ...
|