Vad är en cachelagrad sida?
En cachelagrad sida är en kopia av en webbsida som lagras i tillfällig informationslagring kallad ”cache”.
Syftet med cache (att lagra och hämta data från en cache) är att lagra filer för att förbättra prestandan vid dataåtervinning. Kort sagt ser cachelagring till att framtida förfrågningar efter samma data serveras snabbare.
Det är värt att notera att det finns mer än en typ av cache – de två huvudtyperna är server- och webbläsarcache.
På användarens sida kommer webbläsaren att cachelagra en sida för att säkerställa att den kan visa en webbsida snabbare utan att behöva ladda om innehållet från en server varje gång användaren återbesöker den specifika webbsidan eller resursen.
Sedan finns något som kallas servercachelagring. Innehållsleveransnätverk (Content Delivery Networks – CDN) kommer att cachelagra webbinnehåll (bilder, videor och webbsidor) på så kallade ”proxy-servrar” som är placerade närmare slutanvändaren än webbplatsservrarna.
Det sagt så kan sökmotorer som Google också cachelagra sidor:
Googles bottar genomsöker regelbundet webben och indexerar nya webbplatser. Under processen med att genomföra detta skapar sökmotorn också säkerhetskopior av webbsidor så att den fortfarande kan visa dem för användaren vid begäran, även om den aktuella sidan för närvarande inte är tillgänglig.
Varför är cachelagrade sidor viktiga?
I webbläsare
När en användare laddar en viss webbsida måste deras webbläsare ladda ner ganska mycket data för att kunna visa sidan korrekt. Med cachelagring aktiverat kommer servern emellertid att lagra HTML-filer, JavaScript och bilder – i huvudsak en kopia av den webbsidans innehåll – på användarens hårddisk.
På så sätt, när användaren laddar samma sida, finns det ingen anledning för servern att på nytt ladda ner webbdokumentationen; HTML-filen är redan förberedd och redo att skickas till webbläsaren. Det kan i sin tur förkorta laddningstiden och minska bandbreddsanvändningen och serverbelastningen.
Med andra ord möjliggör cachelagring för webbläsaren att visa sidor snabbare.
I CDN:er
Ett Content Delivery Network (CDN) – som CloudFlare, till exempel – kommer att lagra kopior av webbsidor på flera olika servrar (även kallade ”proxy-servrar”) som är placerade över hela världen. På det sättet kan CDN:en leverera det begärda innehållet till användaren från den närmaste proxy-servern, vilket snabbar upp processen betydligt.
Här är ett exempel:
Anta att du befinner dig i Frankrike och besöker en webbplats vars server är placerad i Australien. Att ladda en sida från en server i Frankrike skulle vara snabbare än att skicka förfrågan till en server i Australien – vilket är där cachelagring kommer in.
Om CDN:en har en kopia (eller cachelagrad sida) av den begärda sidan på en proxy-server i Frankrike, är det den som används för att behandla användarens begäran och ladda sidan.
I sökmotorer
När Google bearbetar den webbsida den nyligen har kryssat, tar den en slags ”skärmdump” för att fungera som en säkerhetskopia av den specifika sidan. På så sätt kan användaren fortfarande komma åt den cachelagrade sidan om den live-sida de försöker komma åt är tillfälligt otillgänglig eller långsam.
Dessa sidor är en del av Googles cache, vilket innebär att du kan visa den cachelagrade versionen av en sida direkt från sökresultaten.
Om du inte vill att Google ska visa cachelagrade versioner av dina webbsidor i sökresultaten kan du använda robotmetataggar – och mer specifikt Noarchive-taggen – för att förhindra att sökmotorn cachelagrar ditt innehåll.
Du kan generellt använda följande kodsnutt för att lägga till en Noarchive-tagg på din webbsida:
<Meta name=“Robots” Content= “Noarchive”>
Om du däremot riktar in dig på Googles webbspindlar specifikt, använd den här metoden:
<Meta Name= “GoogleBot” Content= “Noarchive”>