Wat is een canonical URL?

Wat is een canonical URL?

Een canonical URL is een HTML element in de head van je pagina. Wanneer het niet mogelijk is om vergelijkbare content te voorkomen, gebruik je een canonical URL. Dit HTML element, ook wel de rel=canonical genoemd, laat aan zoekmachines weten welke pagina de originele pagina is. De canonical URL is dus in feite een bronvermelding voor je pagina.

Hierdoor komt slecht één van de pagina’s in de zoekresultaten en kenmerkt de zoekmachine vergelijkbare pagina’s niet als gedupliceerde content.

Waarom moet je een canonical URL gebruiken?

Je zet een canonical URL in  om gedupliceerde content te voorkomen. Zoekmachines hechten veel waarde aan de canonical URL. Hoewel zij kunnen kiezen de canonical URL te negeren, is de kans zeer klein dat zij dit doen. Door de canonical URL weten de zoekmachines welke pagina zij moeten indexeren en welke pagina de bron is van de content.

Het geeft jou de kans zoekmachines richtlijnen te geven en daarmee krijg je dus enige controle over die URL’s in de zoekresultaten komen. Bovendien voorkom je dat je wordt gestraft voor duplicate content.

De canonical URL is zowel voor interne als externe gedupliceerde content nuttig. Interne gedupliceerde content is content op jouw website die vergelijkbaar of identiek is. Externe content is content die op jouw website vergelijkbaar of identiek is aan content op andere websites. Waarschijnlijk probeer je dit voorkomen, maar soms is het onoverkomelijk, zoals bij landingspagina’s voor advertentiecampagnes.

Aan welke pagina geef je de voorkeur?

Stel dat je twee pagina’s hebt die identiek zijn. Bijvoorbeeld: https://www.softdigital.nl/webapplicaties/ en https://www.softdigital.nl/diensen/webapplicaties/.

Welke pagina zal dan de bron URL worden voor je canonical tag? Je weet dat je moet kiezen, want duplicate content wordt afgestraft. Mocht er enig verschil zijn, dan geef je uiteraard de voorkeur aan de belangrijkste en beste pagina. Zijn ze identiek? Dan maakt het in principe niet uit.

Je kunt kiezen voor de URL die de meeste bezoekers ontvangt of de pagina met de netste URL. Maar in de meeste gevallen maakt het bij identieke pagina’s niet uit welke URL je kiest.

Hoe ziet een rel=canonical tag er uit?

De canonical URL is een HTML element en deze plaats je in de broncode van een pagina of in de HTTP header. Je geeft de canonical URL aan met de tag rel=canonical.

Bezoekers van jouw website zien deze code niet en kunnen dus alle pagina’s met een canonical URL bezoeken, terwijl zoekmachines weten dat er vergelijkbare versies van de pagina zijn, waardoor er slechts één pagina geïndexeerd wordt.

Hoe gebruik je de canonical URL in de broncode en in de HTTP header?

De notatie van de canonical URL in de broncode van je pagina is verschillend van de notatie in de HTTP header van de pagina. In de meeste gevallen wordt er gekozen voor een canonical URL in de broncode van de pagina, omdat dit makkelijker te implementeren is.

In de broncode
In het voorgaande voorbeeld zijn er twee vergelijkbare pagina’s en we hebben gekozen voor de pagina https://www.softdigital.nl/webapplicaties/. De canonical URL plaats je dan als volgt voor beide pagina’s in de broncode. Dit doe je in de <head> sectie. Dit ziet er als volgt uit:

<link rel="canonical" href="https://www.softdigital.nl/webapplicaties"/>

In de HTTP header
Een canonical URL instellen in de HTTP header wordt vrijwel alleen geplaatst, wanneer er sprake is van gedupliceerde content in de vorm van bestanden zoals een Pdf-bestand. Het komt soms voor dat een PDF bestand vergelijkbare of identieke content bevat.

Houd er wel rekening mee dat Google de enige zoekmachine is die deze manier van canonical URL’s ondersteund. De HTTP header notatie ziet er als volgt uit:

HTTP/1.1 200 OK
Server: nginx
Date: Wed, 27 Feb 2018 09:12:17 GMT
Content-Type: application/pdf
Content-Length: 1657
Last-Modified: Thu, 29 feb 2018 14:15:50 GMT
Link: <https://www.softdigital.nl/downloads/gratis-brainstormsessie.pdf>;
rel="canonical"

Verschillende typen canonical URL’s

Er zijn twee typen canonical URL’s. Dit zijn de zelfverwijzende canonical URL en een canonical URL die verwijst naar een andere pagina.

De zelfverwijzende canonical URL
Ons advies is om op elke pagina een zelfverwijzende canonical URL te plaatsen. Dit lijkt onnodig, maar hiermee geef je aan dat dit de enige versie van de pagina is en dat deze versie moet worden geïndexeerd.

Wanneer je query parameters gebruikt in de URL voorkom je met een zelfverwijzende canonical URL dat Google deze verschillende URL’s gaat zien als duplicate content. Dit is het geval bij onder andere marketingcampagnes, waarbij er UTM tags worden gebruikt, of parameters bij pagina’s in webshops.

Canonical URL die verwijst naar een andere pagina
Als je meerdere versies hebt van één pagina zet je een rel=canonical tag in die verwijst naar de juiste versie. Het komt bijvoorbeeld voor dat er gedupliceerde content ontstaat bij een A/B test. Ook is het mogelijk dat je meerdere pagina’s gebruikt voor advertentiecampagnes of dat je een artikel kopieert en deze op je eigen website wilt plaatsen.

Heb je een desktop en mobiele versie van je website?

Een veel voorkomend probleem is duplicate content door een mobiele en desktop versie van de website. De meeste websites zijn tegenwoordig responsive, maar dit is niet altijd het geval. Sommige websites hebben daarom een speciale mobiele versie. Bezoekers zien dezelfde content, maar deze content wordt geladen op verschillende pagina’s.

In dit geval dien je gebruik te maken van een canonical URL, met hierbij ook een alternate URL voor de desktopversie van je website. Hiermee communiceer je de relatie tussen de verschillende versies van je website. Daarnaast toont de zoekmachine ook de juiste versie aan de bezoeker. Zoekt de bezoeker via een desktop? Dan ziet hij ook de desktop versie in de zoekresultaten. Houd er wel rekening mee dat alleen Google deze implementatie ondersteund en andere zoekmachines zoals Bing niet.

Voor de desktopversie
Op de desktopversie van je website moet je naast een canonical URL een rel="alternate" tag opnemen in de head van de pagina, met een link naar de mobiele versie van je website. Dit ziet er als volgt uit:
<head>
<link rel="caonical" href="https://geenresponsivewebsite.nl/" /> <link rel="alternate" href="https://m.geenresponsivewebsite.nl" />
<head>

Voor de mobiele versie
Voor de mobiele versie neem je de canonical URL alleen op en dat ziet er als volgt uit:
<head>
<link rel="canonical" href="https://geenresponsivewebsite.nl/" />
</head>

Dezelfde content op verschillende websites

In sommige gevallen wordt content geplaatst op verschillende websites. Dit is het geval bij onder meer uitgeverijen. Ook hiervoor dien je een canonical URL in zetten. Wanneer jouw content wordt gepubliceerd op verschillende pagina’s en dus ook op verschillende domeinen, zet je de cross-domein canonical tag in. Zo weten de zoekmachines wat de bron van de content is en welke pagina er geïndexeerd moet worden.

Waar moet je aan denken met het implementeren van een canonical URL?
De canonical URL is belangrijk en het is dus cruciaal dat je deze correct instelt. Er zijn een aantal zaken waar je rekening mee kunt houden, voor een juiste implementatie van de canonical URL.

Gebruik absolute URL’s

Gebruik altijd de absolute URL van de pagina voor de canonical URL. Dit is de volledig uitgeschreven URL, inclusief https, een eventueel subdomein en de correcte WWW-notatie.

In ons geval gebruiken wij voor onze blogpagina dus https://www.softdigital.nl/academy/ en niet /academy/. Zo zorg je ervoor dat de zoekmachines zeker weten om welke URL het gaat.

Wanneer je URL bijvoorbeeld vanaf de WWW en non-WWW variant benaderbaar is, krijg je anders alsnog duplicate content, omdat de zoekmachines de canonical URL’s interpreteren als https://www.softdigital.nl/academy/ én https://www.softdigital.nl/academy/.

Vul één canonical URL in per pagina

Gebruik altijd maar één canonical URL per pagina. Er mogen niet meerdere canonical URL’s worden geïmplementeerd in de broncode of HTTP Header. Wanneer er meerdere zijn raken zoekmachines in de war. Google negeert de canonical URL, zelfs wanneer er meerdere aanwezig zijn.

Plaats de canonical URL in de <head> van je HTML

De canonical URL mag alleen in de <head> sectie van de pagina staan. Als deze hier niet staat vinden zoekmachines de canonical URL niet.

Verwijs alleen naar indexeerbare URL’s

De pagina waar je naar verwijst moet wel indexeerbaar zijn. Zoekmachines raken anders in de war als de canonical URL verwijst naar een pagina die een 301 redirect heeft, een pagina met een noindex tag bevat of op een andere manier niet indexeerbaar is.

Neem de voorkeursversie op in je XML sitemap

Je kunt de zoekmachine extra helpen de juiste versie van de URL in de sitemap op te nemen. De URL in je sitemap moet dus hetzelfde zijn als de canonical URL van je pagina. De pagina’s in de XML-sitemap moeten bovendien indexeerbaar zijn.

Heeft een canonical tag nadelen?

Aan de canonical tag zitten een aantal nadelen. Zo is er geen bewijs dat een canonical tag ook linkwaarde doorgeeft. Een link bevat een bepaalde autoriteit, wat een onderdeel is van je posities in de zoekresultaten.

Zoekmachines zijn erg onduidelijk of deze autoriteit wel of niet wordt doorgegeven bij een canonical tag. In principe is de canonical tag gemaakt om aan te geven welke pagina’s de zoekmachines moeten indexeren.

De meeste SEO specialisten zijn er daarom van overtuigd dat de canonical tag maar deels de autoriteit doorstuurt. Let hier dus goed op wanneer je actief met je backlink profiel bezig bent en linkbuilding uitvoert.

Daarnaast voorkomen canonical tags geen crawl problemen. De canonical tag communiceert welke pagina de bron van de content is en niet welke pagina’s er gecrawld mogen worden. Crawl problemen ontstaan bijvoorbeeld door redirect loops of de indexeerbaarheid van nutteloze pagina’s. Hiermee slok je het crawlbudget op. Crawl problemen voorkom je met het juiste gebruik van het robots.txt bestand.

Maak geen onnodige duplicate pagina’s aan

Uiteindelijk is het niet altijd nodig om meerdere varianten van pagina’s te hebben. Soms is een 301 redirect slimmer en beter, dan een canonical URL. Zet een 301 redirect in voor pagina’s die bereikbaar zijn via zowel HTTP en HTTPS of bereikbaar zijn via verschillende domein of subdomeinen. Mocht je ondanks de 301 redirect toch nog tegen gedupliceerde content aanlopen, stel dan alsnog een canonical URL in.

Geeft een canonical URL link autoriteit door?

Hier is niet met zekerheid op te antwoorden. Het vermoeden bestaat dat slechts een deel van de autoriteit wordt doorgegeven bij een pagina met canonical URL. Het is wel zeker dat een canonical URL niet bedoelt, is om link autoriteit door te geven, hiervoor zijn 301 redirects bedoeld.

Is een canonical URL doorslaggevend?

Een canonical URL geldt als een richtlijn die je opstelt. Een zoekmachine kan er dus voor kiezen om deze te negeren. In 99% van de gevallen zullen zoekmachines de richtlijn netjes hanteren.

Is een canonical URL hetzelfde als een 301 redirect?

Nee, een canonical URL wordt gebruikt om een voorkeursversie van een pagina aan te geven. Hierbij zijn meerdere versies van de pagina toegankelijk voor de bezoeker, maar slechts één versie mag worden geïndexeerd door zoekmachines.

Een 301 redirect stuurt zowel de bezoeker als de zoekmachine door van de ene URL door naar de andere URL. Deze zet je in bij pagina’s die je bijvoorbeeld verwijderd.

Kan een canonical tag schadelijk zijn?

Wanneer je de canonical tags niet op de juiste manier implementeert, worden er problemen met de indexatie van je website veroorzaakt. Alhoewel je voorzichtig moet zijn met canonical tags, adviseren wij de canonical tag altijd te gebruiken om bij zoekmachines aan te geven welke pagina’s de originele content bevatten.

Wordt de canonical tag ondersteund door alle zoekmachines?

De belangrijkste zoekmachines, Google, Bing en Yahoo, ondersteunen de canonical tag.

Wat er gebeurt er als je meerdere canonical tags hebt op één pagina?

Van Google weten we dat zij dan alle canonical tags zullen negeren. We weten niet hoe andere zoekmachines hier mee om gaan. Daarom adviseren we ook gewoon één canonical tag per pagina.

Voorkomt een canonical tag dat een pagina wordt gecrawld?

Nee, crawlers zullen alle pagina’s alsnog crawlen. Een canonical tag geeft signaal welke pagina moet worden getoond in de zoekresultaten. Je voorkomt dat pagina’s gecrawld worden door de pagina’s uit te sluiten via je robots.txt bestand.

Gebruik je ook een canonical tag voor gepagineerde resultaten?

Bij gepagineerde pagina’s op je website of webshop is het verstandig om een zelfverwijzende canonical tag naar de gepagineerde URL in te stellen. Voor de pagina https://www.softdigital.nl/academy/?page=11 stel je dus een canonical tag in naar https://www.softdigital.nl/academy/?page=11.