Ressources gratuites pour aider les débutants à créer, gérer et développer leur site Joomla

Corriger les problèmes d'indexation de votre site joomla

Vous avez des problèmes d'indexation sur Google ? Votre site web ne s'indexe pas comme vous le souhaitez ?  Des problèmes d'indexation entraînent sans aucun doute une baisse du trafic.

Avez vous vérifié si vos pages étaient indexées ? Car si elles ne le sont pas, il faut régler le problème rapidement. C'est d'ailleurs l'objectif de ce guide, de vous accompagner, étape par étape, dans la résolution de vos problèmes d'indexation. Vous aurez besoin pour cela de travailler avec Search console de Google.

Résoudre les problèmes d'indexation de votre site web

Consulter le rapport de couverture dans la Search Console de Google :

Index > Couverture

Le rapport de couverture donne un aperçu de l'état d'indexation de vos pages. Il liste les pages qui ont été explorées et indexées par Google et celles qui ont été exclues et pourquoi elles le sont. Vous pouvez utiliser l'outil de Google pour améliorer l'indexation de vos pages.

 

Les différents statuts de la page

Le rapport de couverture se présente sous la forme d'un tableau a 4 colonnes, avec les pages :

Erreur : Ces pages présentent des erreurs. Elles ne peuvent pas être indexées. Elles n'apparaissent pas dans les résultats de recherche.

Valides avec des avertissements : Ces pages peuvent apparaître ou pas dans les résultats de recherche Google.

Validées : Ces pages ont été indexées par Google. Elles apparaissent dans les résultats de recherche. Vous ne demandent aucune modification.

Exclues : Ces pages ne sont pas indexées par Google. Elle n'apparaissent pas dans les résultats de recherche. 

Les pages en Erreur

Les pages contenant des erreurs ne sont pas indexées.

Consultez à présent les problèmes de toutes les pages en erreur. Et corrigez-les à partir des indications de Google. Pour chaque liste, les erreurs sont classées selon leur gravité. Traitez les problèmes dans l'ordre en commençant par le haut de la liste.

Voyons chacune des erreurs et les solutions pour les corriger. 

Une erreur est causée par le serveur (5xx)

Des URL renvoyant un code de statut 5xx à Google.

Comment les corriger?

  • Tout d'abord identifiez qu'il type de code est renvoyé : 500 – Internal Server Error, 501 – Not Implemented, 502 – Bad Gateway, 503 – Service Unavailable, 504 – Gateway timeout, 505 – HTTP Version Not Supported..Toutes les catégories d'erreur sont consultables sur ce site avec la définition https://www.webfx.com/web-development/glossary/http-status-codes
  • Puis vérifiez si l'erreur persiste. Normalement les erreurs de type 5xx sont temporaires, elles ne nécessitent aucune action. Vous pouvez tout de même vérifier l'état du serveur.
  • Vérifiez le fichiers des logs, il vous fournira des informations supplémentaires.
  • Vérifiez également si une modification ou l'installation récente d'un plugin ne cause pas de problème.

Les redirections

Une erreur est survenue lors du processus de redirection. La page ne s'affiche pas. Quel peut être le problème ?

  • Une chaîne de redirection trop longue
  • Une boucle de redirection
  • Une URL de redirection qui a dépassé la longueur maximale de l'URL
  • Une URL erronée 

Comment les corriger ?

  • Eliminer les chaînes de redirection et les boucles. Chaque URL ne doit effectue qu'une seule redirection. 

Les pages bloquée par le fichier robots.txt :

Vous avez peut être propose votre fichier sitemap.xml dans Search console de Google. Et certaines de vos URL ont été bloquées par le fichier robots.txt.

Comment corriger ? 

Faites la liste des pages que vous souhaitez voir indexées par Google puis une autre liste de pages que vous ne souhaitez pas voir indexées sur Google.

Créer votre fichier sitemap.xml ou téléchargez le fichier sitemap déjà présent à la racine de votre site et supprimez les URL des pages que vous ne voulez pas indexer. 

Puis vérifiez et modifiez, si besoin, les directives du fichier robots.txt.

Le fichier robots.txt de Joomla:

User-agent: *

Disallow: /administrator/

Disallow: /cache/

Disallow: /components/

Disallow: /images/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

URL marquée "noindex" :

Les pages qui présentent une directive "noindex" dans la balise des méta-robots ou dans les en-têtes HTTP ne sont pas indexées dans Googlet et n'apparaissent pas dans les résultats de recherche.

Comment corriger?

  • Il faut supprimer la directive "noindex"

L'URL soumise semble être un Soft 404 :

L'URL a été soumise à Google via le fichier sitemap.xml XML pour indexation. L'erreur soft 404  se produit lorsque le serveur renvoie un code d'état 200 mais que Google estime qu'il devrait afficher un 404. La page renvoie une erreur 404 pour Google. Ceci peut être du au fait que la page présente un contenu de mauvaise qualité pour Google. 

Comment corriger cette erreur? 

  • Vérifiez si cette page ne renvoie pas une vraie erreur 404. Dans ce cas précis il faut supprimer l'URL du fichier sitemap.xml
  • Retravailler votre contenu
  • Vérifiez que votre contenu n'est pas un doublon
  • S'il y a redirection. Vérifiez qu'elle est correcte

L'URL soumise renvoie une erreur 401

Ce code d'état indique que vous n'êtes pas autorisé à accéder à l'URL. Vous pouvez avoir besoin d'un nom d'utilisateur et d'un mot de passe, ou peut-être y a-t-il des restrictions d'accès basées sur l'adresse IP.

Comment corriger?

  • S'il y a des restrictions sur une URL, éliminez la du sitempa.xml
  • Supprimez l'authentification HTTP s'il y en a une et que vous n'en voulez plus

URL soumise non trouvée (404) :

Google ne peut pas explorer l'URL soumise.

Comment corriger?

  • Corrigez l'erreur
  • Créez une redirection 301 à l'URL puis ajoutez l'URL au fichier sitemap.xml
  • Si vous ne souhaitez pas que la page soit indexée, supprimez-la du plan du site XML.

L'URL soumise a un problème de crawl

Pour comprendre le problème, utilisez l'outil d'inspection des URL pour obtenir plus d'informations sur le problème.

Validée avec un avertissement

Ces pages sont indexées, mais elles sont bloquées par le fichier robots.txt. Google se comporte parfois différemment.

Comment corriger?

  • Pour éviter l'indexation d'une page utilisez plutôt le noindex que le fichier robots.txt (Recommandations Google)
  • Mettez en place une authentification HTTP
  • Faites les corrections nécessaires dans le fichier robots.txt.
  • Identifier la règle qui bloque une URL en utilisant le robots.txt testeur.

Statut exclue

Ces pages ne sont pas indexées dans les résultats de recherche.

Le rapport de couverture vous montre 15 cas possibles qui peuvent poser problème :

Exclue par la balise "noindex"

Cette directive demande aux moteurs de recherche de ne pas indexer la page.

Comment corriger ?

  • Supprimez la balise "noindex" de la page

Bloqué par l'outil de suppression de page : 

Yous avez soumis une demande de suppression d'URL pour ces URL sur la Search Console Google

Comment corriger?

  • Google bloque les URL pendant 90 jours. Utilisez les directives "noindex" ou supprimez la page.

Bloqué par robots.txt :

L'accès à Googlebot est bloqué par le fichier robots.txt.

Comment corriger? 

  • Si vous ne voulez pas que la page soit indexée, utilisez une directive "noindex" et supprimez le bloc robots.txt.

Bloqué en raison d'une demande non autorisée (401)

Bloquée en raison d'une demande non autorisée (401) : une demande d'autorisation (réponse 401) empêche Googlebot d'accéder à cette page.

Comment corriger?

  • Supprimez les identifiants d'accès ou autorisez Googlebot à accéder à votre page.

Explorée, actuellement non indexée

La page a été explorée par Google, mais pas indexée. Elle sera peut-être indexée à l'avenir.

Il n'est pas nécessaire de renvoyer cette URL pour l'exploration.

Détectée, actuellement non indexée

La page a été détectée par Google, mais n'a pas encore été explorée. En règle générale, cela signifie que Google voulait explorer l'URL, mais que l'exploration a été reportée, car votre site risquait d'être surchargé. C'est pourquoi la dernière date d'exploration ne figure pas dans le rapport.

Autre page avec balise canonique correcte

La page est un doublon d'une page que Google reconnaît comme canonique. Elle renvoie correctement vers la page canonique. Vous n'avez donc aucune action à effectuer.

Page en double sans URL canonique sélectionnée par l'utilisateur

La page a des doublons, dont aucun n'est marqué comme canonique. Nous pensons que cette page n'est pas canonique.

Comment corriger ?

  • Vous devriez désigner la version canonique de cette page de manière explicite. L'inspection de cette URL devrait indiquer l'URL canonique sélectionnée par Google.

Page en double, Google n'a pas choisi la même URL canonique que l'utilisateur

La page est marquée comme canonique, mais nous pensons qu'une autre URL serait une version canonique plus appropriée. Google a indexé la page que nous considérons comme canonique plutôt que celle-ci.

Comment corriger?

  • Nous vous recommandons de marquer explicitement cette page comme doublon de l'URL canonique. Cette page a été découverte sans demande d'exploration explicite. L'inspection de cette URL devrait indiquer l'URL canonique sélectionnée par Google.

Introuvable (404)

Cette page a renvoyé une erreur 404 lorsqu'elle a été demandée. Google a détecté cette URL sans demande explicite ni sitemap. Il se peut que Google ait détecté l'URL via un lien depuis un autre site ou que la page ait été supprimée. Googlebot continuera probablement à essayer d'accéder à cette URL pendant un certain temps. Il n'existe aucun moyen d'indiquer à Googlebot d'oublier définitivement une URL. Toutefois, il l'explorera de moins en moins souvent. Les réponses 404 ne constituent pas un problème si elles sont intentionnelles. Si votre page a été déplacée, utilisez une redirection 301 vers le nouvel emplacement. Découvrez comment corriger les erreurs 404.

Page avec redirection

L'URL est une redirection et n'a donc pas été ajoutée à l'index.

Soft 404

La page est introuvable de manière conviviale, sans inclure le code de réponse 404 correspondant.

Comment corriger ?

  • Nous vous recommandons soit de renvoyer un code de réponse 404 pour les pages "introuvables" afin d'empêcher leur indexation,
  • soit d'ajouter des informations sur la page pour nous indiquer qu'il ne s'agit pas d'une erreur de type "soft 404".

Page en double, l'URL envoyée n'a pas été sélectionnée comme URL canonique

L'URL fait partie d'un ensemble d'URL en double sans page canonique explicitement indiquée. Vous avez demandé que cette URL soit indexée, mais comme il s'agit d'un doublon et que nous pensons qu'une autre URL serait une version canonique plus appropriée, nous n'avons pas indexé cette URL. Au lieu de cela, nous avons indexé la version canonique que nous avons sélectionnée. Google indexe uniquement la version canonique des groupes de pages en double.

Bloquée en raison d'une interdiction d'accès (403)

Le user-agent a indiqué des identifiants, mais n'a pas obtenu l'autorisation d'accès. Cependant, Googlebot ne fournit jamais d'identifiants. Votre serveur renvoie donc cette erreur de manière incorrecte.

Comment corriger ?

  • Vous devez soit corriger cette erreur, soit bloquer la page par un fichier robots.txt ou noindex.

Bloquée en raison d'un autre problème de type 4xx

Le serveur a rencontré une erreur 4xx non couverte par un autre type de problème décrit ici.

 

Ressources mentionnées

Google 

 

Articles en relation

Agence Joomla

Téléphone : 0672271069

Email : contact@sylvie-ceci.info

Lun Vend 8h00 18h00

Liens utiles