Comme l’indique Matt Cutts sur son blog, la balise canonical est un élément HTML, à placer dans la section supérieure du code source d’une page, entre les balises <head> et </head>,

qui vise à nettoyer l’index de Google des urls en doublons dont le contenu est similaire d’une page à l’autre. Le chef de la cellule Anti-spam du moteur de recherche, qui a officié à ce poste jusqu’en 2014, ajoute également que la balise canonical, lancée officiellement en 2009, a permis aux moteurs de recherche de régler en profondeur les problèmes d’indexation liés en partie à la présence de contenus dupliqués, la difficulté pour eux étant de distinguer la source originale de la copie.

Définition de la balise canonical

La balise canonical désigne un élément HTML, présent au sein du code source des pages web, qui permet aux gestionnaires de sites Internet de répondre efficacement et simplement aux problématiques SEO liées à la duplication de contenus, en indiquant à Google l’url canonique, autrement dit la page favorite, à prendre en considération et à indexer en cas de contenus identiques. La balise canonical permet ainsi de déterminer à quelle URL, à quelle page attribuer la paternité d’un contenu.

A quoi ressemble la balise canonical?

D’un point de vue du code HTML, la balise canonical ressemble à ceci, la partie en rouge ci-dessous étant bien évidemment à modifier par rapport à votre site:

<link rel=”canonical” href=”http://example.com/“>

Quel est l’impact de la balise canonical sur le SEO ?

Au-delà du fait qu’elle permet aux moteurs de recherche de séparer le bon grain de l’ivraie en matière de contenus dupliqués, l’url canonique permet aussi et surtout de rationaliser et de réguler le passage des bots et à leur faire gagner du temps de crawl en les amenant directement sur les pages importantes à prendre en considération. Et comme souvent en SEO avec Google, plus on lui fait gagner du temps, plus Google récompense nos actions d’optimisation par un meilleur positionnement de notre site dans son moteur. En effet, si vous laissez Google choisir entre deux de vos pages internes 100% dupliquées, il y a fort à parier que cela enverra un signal négatif à l’algorithme qui n’hésitera pas à déclasser votre page. La balise canonical permet ainsi de faciliter le travail d’indexation des URLs par Google. Et avec Google, le temps, c’est de l’argent ! Donc autant lui en faire gagner pour vous assurer de briguer les meilleures positions dans les SERPs.

A l’inverse, une mauvaise utilisation de la balise canonical peut avoir des effets dévastateurs en termes de référencement naturel.

La balise canonical est-elle indispensable ?

Par défaut, un site qui n’affiche pas la balise rel canonical dans son code source ne sera pas pénalisé ni même impacté négativement en termes de positionnement. En effet, en principe cette balise est à réserver uniquement aux URLs censées générer de la duplication de contenus. Or, dans quels cas un site peut-il être confronté à de la duplication de contenus ?

  • Un même contenu est accessible via deux URLs distinctes, l’une n’ayant aucun paramètre dans l’URL et l’autre présentant une variable dynamique dans l’URL. Par exemple, le contenu propre à l’url https://www.example.com/article-1.html est identique à celui présent à cette adresse : https://www.example.com/article-1.html?gclid=123, auquel cas l’usage de la canonical s’avérera extrêmement précieux.
  • Votre CMS génère à votre insu des URLs multiples. C’est le cas du CMS Drupal qui, s’il est mal configuré peut voir s’indexer des pages aux contenus similaires via des URLs réécrites versus des URLs disponibles en backend comme les urls en /node/ notamment.
  • Vos URLs sont accessibles à différents niveaux, avec ou sans WWW dans l’URL, ou via deux protocoles différents (HTTP et HTTPS), auquel cas, la meilleure solution pour y remédier demeure la redirection 301. Par exemple, http://www.example.com/ et https://www.example.com/ seront considérés comme deux URLs différentes présentant exactement le même contenu.

Bien que la balise rel=canonical soit réellement essentielle dans le cadre de la gestion des différentes problématiques abordées précédemment, YATEO vous recommande également de l’utiliser sur l’ensemble des pages de votre site à titre préventif, en vue d’empêcher les sites externes qui, volontairement, plagient intégralement vos contenus pour tenter de mieux se positionner que votre site dans les SERPs. Malheureusement, dans les faits, il se peut que le site incriminé se positionne mieux dans les moteurs de recherche que votre site.