Webwinkelpagina’s die niet gecrawld moeten worden

Beoordeel

Het doel van zoekmachine-optimalisatie is om de pagina’s van je webwinkel weer te geven op een zoekmachine resultatenpagina als antwoord op een vraag. Het doel is voor Google en elke andere zoekmachine om alle productdetailpagina’s, blogberichten en artikelen en al het andere dat resulteert in conversies te crawlen en te indexeren.

Maar er zijn pagina’s die niet in de zoekresultaten moeten worden opgenomen. Als je ze verwijdert uit de index van Google, kan het verkeer in zoekmachines zelfs toenemen naar belangrijkere, beter converterende pagina’s.

Indexeer deze pagina’s niet

Maar maakt het echt niet uit of je privacybeleid, GDPR-gegevens of vergelijkbare pagina’s worden weergegeven op Google? Pagina’s die je waarschijnlijk niet door Google wilt laten indexeren, zijn onder meer:

  • Bedankt pagina’s (weergegeven na een enquête of vergelijkbaar)
  • Advertentie-bestemmingspagina’s (bedoeld voor ppc campagnes)
  • Beleidspagina’s
  • Interne zoekresultaten

Pagina’s verwijderen

Als je dit soort pagina’s uit de index van Google haalt, kun je ook de autoriteit van je webwinkel verbeteren. Dit kan op zijn beurt weer de manier verbeteren waarop de verschillende pagina’s in Google gerangschikt worden ​​voor relevante zoekopdrachten.

Sommige SEO-ers beweren dat Google bedreven is in het identificeren van de kwaliteit van de inhoud en daarom op hun hoede zijn voor redundante, dubbele of relatief lage kwaliteit pagina’s.

Sterker nog, sommige SEO-professionals hebben gesuggereerd dat Google de relatieve waarde van alle pagina’s op je webwinkel gemiddeld maakt om een ​​verzamelautoriteit of waardescore te maken. Dit kan domeinautoriteit, domeinrang of een vergelijkbare statistiek zijn.

Als je webwinkel de index van Google heeft gevuld met pagina’s met een relatief lage waarde Zoals bijvoorbeeld het privacybeleid dat je gekopieerd en geplakt hebt van een ander e-commerce bedrijf, kan dit van invloed zijn op de autoriteit van je webwinkel en hoe Google denkt dat deze als een geheel is.

Zo heeft bijvoorbeeld Moz in 2017 75 procent van de pagina’s op zijn website verwijderd uit de Google-index. De pagina’s waren voornamelijk laagwaardige ledenprofielen van de Moz-community. Deze pagina’s hadden niet veel unieke inhoud en het verwijderen van deze pagina’s uit de index van Google resulteerde in een toename van 13,7 procent in jaar-op-jaar organisch zoekverkeer.

Hoe pagina’s verwijderen uit Google

Wellicht de beste tool om een afzonderlijke pagina uit de index van Google te verwijderen, is de robots noindex-metatag.

<meta name="robots" content="noindex" />

Deze code voeg je toe in de <head> van de HTML-opmaak van een pagina. Als je dit eenmaal gedaan hebt vraagt deze eenvoudige tag alle zoekmachines om de bijbehorende pagina niet te indexeren. De primaire webcrawler van Google, Googlebot, volgt deze richtlijn en laat elke pagina die is gemarkeerd met noindex vallen wanneer deze de volgende keer wordt gecrawld.

Met behulp van het CMS systeem van je webwinkel moet het relatief gemakkelijk zijn om deze tag toe te voegen aan je beleidspagina’s, interne zoekresultaten en andere pagina’s die niet hoeven te worden opgenomen in de index van Google of worden weergegeven als op een Google-zoekopdracht.

HTTP Response Header

De noindex-richtlijn voor robots kan ook worden doorgegeven in een HTTP-response header. Zie de HTTP-response header als een sms-bericht dat je server verzendt naar een webbrowser of webcrawler (zoals Googlebot) wanneer deze een pagina opvraagt.

In deze header kan je webwinkel Google vertellen de pagina niet te indexeren. Hier is een voorbeeld.

HTTP/1.1 200 OK
X-Robots-Tag: noindex

Zowel deze HTTP-tag als de metatag hebben hetzelfde effect. Welke van deze methoden uw bedrijf gebruikt, is een kwestie van voorkeur.

Voorkom indexering?

Robots.txt voorkomt indexering niet. Een robots.txt-bestand bevindt zich in de hoofdmap (root) van een webwinkel. Dit eenvoudige tekstbestand vertelt een webcrawler van een zoekmachine welke pagina’s op de site waartoe het toegang heeft.

Vaak denken webwinkel-eigenaren en beheerders ten onrechte dat het niet toestaan ​​van een pagina in een robots.txt-bestand voorkomt dat die pagina wordt weergegeven in de index van Google. Maar dat is niet altijd het geval.

Als een andere site bijvoorbeeld naar een pagina binnen je webwinkel linkt, kan Googlebot die koppeling volgen en de pagina indexeren, ook als die pagina niet is toegestaan ​​in een robots.txt-bestand.

Als je pagina’s uit de index van Google wilt verwijderen, is het robots.txt-bestand waarschijnlijk niet de beste keuze.

Het is belangrijk om te vermelden dat je een pagina in een robots.txt-geen disallow mag geven en tegelijkertijd een noindex-tag gebruikt op dezelfde pagina. Als je dit doet, kan Googlebot de noindex-richtlijn missen.

De beste manier om die pagina’s te verwijderen is met een noindex-tag voor robots.

Welke webwinkelpagina’s kunnen we nog meer uitsluiten van indexering? Laat het hieronder weten in de comments en we voegen deze toe!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd.