Google maakt geen back-ups meer van internet: gecachte websites zijn dood

In het midden van de bladeren is een groot Google-logo weergegeven.

Google maakt niet langer een back-up van het hele internet. ‘Gecachte’ links in Google-zoekopdrachten zijn lange tijd een alternatieve manier geweest om een ​​webpagina te laden die verdwenen of gewijzigd is, maar nu maakt het bedrijf ze kapot. Google “Search Liaison” Danny Sullivan bevestigde de verwijdering van de functie in de X-berichtzeggend dat de functie “ontworpen was om mensen toegang te geven tot pagina’s terwijl je in het verleden vaak niet kon vertrouwen op het laden van pagina’s. De zaken zijn tegenwoordig veel verbeterd. Daarom is besloten om deze functie stop te zetten.”

De functie is voor sommige mensen al sinds december aan en uit en we zien momenteel geen links in het cachegeheugen van Google Zoeken. Voorlopig kunt u nog steeds uw eigen cachelinks maken, zelfs zonder de knop, door gewoon naar ‘https://webcache.googleusercontent.com/search?q=cache:’ te gaan plus de website-URL of ‘cache:’ te typen plus de URL in Google Zoeken. Voorlopig lijkt de cacheversie van Ars Technica nog steeds te werken. Alle Google-ondersteuningspagina’s over in het cachegeheugen opgeslagen pagina’s zijn verwijderd.

In het cachegeheugen opgeslagen links stonden vroeger onder het vervolgkeuzemenu naast elk zoekresultaat op de site van Google. Terwijl de Google-webbrowser het internet afspeurde naar nieuwe en bijgewerkte webpagina’s, sloeg hij ook een kopie op van alles wat hij zag. Dit leidde er al snel toe dat Google een back-up maakte van vrijwel het hele internet, waarbij waarschijnlijk talloze petabytes aan gegevens werden gebruikt. Google bevindt zich nu in een tijdperk van besparingen, dus ervan uitgaande dat Google gewoon kan beginnen met het opruimen van cachegegevens, kan dit waarschijnlijk veel bronnen vrijmaken.

Gecachte links waren geweldig als een website offline was of snel werd gewijzigd, maar ze gaven door de jaren heen ook enig inzicht in hoe de webcrawler ‘Google Bot’ het internet bekijkt. Pagina’s worden niet noodzakelijkerwijs weergegeven zoals u zou verwachten. In het verleden bestonden pagina’s alleen uit tekst, maar de Google-bot leerde langzaamaan over media en andere rijke gegevens zoals JavaScript (nu zijn er een heleboel gespecialiseerde Google-bots). Veel details over de Google Bot zijn in geheimzinnigheid gehuld om ze voor SEO-spammers te verbergen, maar je kunt veel leren door te onderzoeken hoe in de cache opgeslagen pagina’s eruitzien. In 2020 is Google standaard overgestapt op mobiel, dus als u bijvoorbeeld die in de cache opgeslagen Ars-link van eerder bezoekt, krijgt u de mobiele pagina. Als u een site beheert en meer wilt weten over hoe de site er in Google Bot uitziet, kunt u dat nog steeds doen, maar alleen voor uw site, vanuit Search Console.

Het verdwijnen van gecachte sites zal betekenen dat het internetarchief een grotere last krijgt bij het archiveren en volgen van wijzigingen aan de webpagina’s van de wereld.