WebRankInfo : la plus grande communauté francophone du référencement
Olivier Duffez
Créateur de WebRankInfo,
consultant en référencement
Ne ratez surtout pas cette technique très simple qui permet gratuitement de rendre actifs des backlinks qui pour l'instant n'aident pas votre référencement. Explications…
Publié le . Auteur : Olivier Duffez
Article mis à jour le 04/10/2016 (ajout partie liens internes), publié initialement le 08/12/2008
Sans que vous le sachiez, il y a régulièrement des gens qui font des liens spontanés vers votre site, mais qui malheureusement font une erreur dans l'URL.
A moins d'éplucher consciencieusement et régulièrement vos logs ou vos rapports d'erreurs, vous n'êtes sans doute jamais au courant. Mais n'oubliez pas que Google est votre ami 🙂 Allez dans votre compte Google Search Console, rubrique "Exploration > Erreurs d'exploration" et consultez la liste des erreurs 404 (Introuvable).
Pour chaque URL ayant provoqué une erreur 404, Google vous propose une liste de pages web qui font (ou ont fait un jour) un lien vers cette fameuse URL. Il peut s'agir de pages de votre propre site (dans ce cas ce sera simple à corriger) ou bien de pages d'autres sites (dans ce cas vous devriez contacter le site en question afin qu'il corrige son lien).
Vous pouvez consulter ces informations directement dans l'interface de Google Search Console (ça ouvre pas mal de fenêtres…) ou télécharger toutes les données dans un fichier CSV pour une analyse plus intensive et sans doute plus efficace. Le problème est que ce fichier ne liste pas les URL (internes ou externes) qui vous ont fait les liens.
Si c'est sur votre propre site qu'un lien pointe vers une page en 404, ça dégrade l'expérience utilisateur et réduit légèrement l'efficacité de votre référencement. Vous avez donc tout intérêt à :
Comprenez bien qu'à chaque fois que vous corrigez ces liens cassés en interne, vous améliorez doublement votre site (pour l'internaute et pour le SEO) !
RM Tech est l'outil d'audit SEO que j'ai développé chez My Ranking Metrics (dont je suis cofondateur). Il s'agit d'un outil complet comprenant un crawler (qui fonctionne presque comme Googlebot) et un analyseur (qui repère les problèmes et vous priorise les choses à faire).
La version gratuite vous dira si vous avez des problèmes, avec des explications ultra détaillées. La version payante vous dira quelles pages ont ces problèmes.
Voici un exemple pour un site qui a beaucoup d'erreurs dans ses liens internes :
Si jamais vous trouvez un lien erroné sur un site prestigieux, pour lequel vous pensez qu'il devrait largement contribuer à améliorer votre référencement, et que malheureusement vous n'arrivez pas à faire modifier le lien, alors je vous conseille de mettre en place une règle de réécriture spécifique qui va rediriger (en 301) vers la bonne URL.
Le cas classique est un lien issu d'un forum ou d'un blog, qui a transformé automatiquement un texte en lien mais qui a inclus une virgule ou une parenthèse fermante dans l'URL. Voici un exemple de règle d'URL Rewriting à appliquer dans ce cas :
Cet exemple redirige la mauvaise URL (contenant une parenthèse fermante) vers la bonne, transformant ainsi le lien cassé en bon backlink.
En lisant cet article, vous vous demandez sans doute s'il ne serait pas plus simple de rediriger 100% des URL qui renvoient un code 404, par exemple vers la page d'accueil.
C'est une erreur classique que je vous déconseille ! C'est normal pour un serveur de renvoyer un code 404 pour une URL qui n'existe pas. Il ne doit pas y avoir dans ce cas de redirection, qu'elle soit 301 ou 302.
Partagez l'info sur Twitter :
Selon les cas, vous utiliserez une règle de réécriture pour faire la redirection, ou bien une redirection dans un script côté serveur (par exemple en PHP).
En creusant avec cet outil, j'ai rencontré des pages (externes) qui font des liens vers des pages de WebRankInfo qui n'ont pourtant jamais existé. Vous imaginez bien que je me suis gardé de prévenir les sites qui m'offraient ces liens ! Pour chacun de ces cas, j'ai déterminé la page de mon site la plus pertinente, et j'ai défini une règle de réécriture qui redirige en 301 la page qui n'a jamais existé mais qui reçoit un backlink vers la page la plus pertinente de mon site. Ce n'est pas grand chose, mais qui refuserait un backlink gratuit dans un monde concurrentiel ?
Vous remarquez peut-être en utilisant cet outil qu'il indique des URL de pages censées provoquer une 404 mais qui n'existent plus depuis longtemps (et qui faisaient des liens vers des pages qui ont elles aussi peut-être aussi disparu).
S'il s'agit de pages internes, posez-vous la question de votre gestion actuelle des pages qui sont supprimées. Par exemple si vous avez un site de petites annonces, que faites-vous des pages d'annonces une fois qu'elles ont expiré ? Même chose avec un site de vente en ligne pour la gestion des produits retirés de la vente.
Nous avons aussi une très bonne discussion à ce sujet dans le forum : Pages supprimées : faut-il un 404, un 410 ou un 301 ?.
La méthode décrite ici repose sur l'utilisation de Google Search Console. En gros, vous ne trouverez ici que les URL 404 que Google vous indique, mais rien ne dit que la liste est exhaustive. Vous devriez donc repérer 100% des cas, par exemple en analysant vos logs ou vos rapports Google Analytics (analyse croisée des pages d'erreur et des sites référents).
N'oubliez pas non plus de prendre en compte les pages de votre site assimilées à des erreurs soft 404 par Google.
Je ne vous cache pas que ça fait des années que j'utilise cette technique de netlinking sur WebRankInfo. Mais avec cette nouvelle fonctionnalité dans GSC, c'est encore plus simple. Et vous, comment utilisez-vous cette fonctionnalité ? Avez-vous des astuces que vous accepteriez de partager avec la communauté WebRankInfo ? On en discute dans le forum : obtenir des backlinks par l'analyse des erreurs 404.
NB : si 404, 410 ou 301 ne signifie pas grand chose pour vous, je vous conseille de lire mon tutoriel sur les redirections et de consulter la liste des codes HTTP.
Crédit image : © kotoyamagami – Fotolia.com
Cet article vous a-t-il plu ?
37 commentaires
Excellente astuce, merci à vous tous pour vos inputs, et a olivier d'avoir partagé le tips.
@Olivier : Comme je n'ai que des 404 je n'étais pas certain que les 410 apparaissaient aussi. Merci pour cette précision.
Dans "Liens vers votre site" il y a uniquement les liens vers les pages qui répondent favorablement (codes 304 et 200) ?
@Nicolas : oui, j'ai l'impression qu'il s'agit de pages qui répondent OK, mais je n'en ai pas la certitude
Oui Nicolas, il me semble que Google ne liste que les pages qui répondent correctement
@Olivier : merci pour cette précision.
J'utilise Myrankingmetrics pour vérifier les liens internes 😉
Concernant les liens externes est-ce que tu penses que Google Search Console affiche aussi les liens externes vers des pages qui sont de types 4xx (410 par exemple) ?
@Nicolas : dans le rapport des erreurs 404 ou 410, Google liste aussi bien des URL internes que externes comme source de liens. Cela répond-il à la question ?
@Olivier Duffez : merci pour cette précision. Etrangement, j'ai toujours eu cet onglet (sauf depuis le 4 octobre dernier, date à laquelle il a disparu) avec 0 erreur serveur / 0 introuvable / 0 bloqué. Bonne fin de journée.
@Olivier
Effectivement j'ai oublié de préciser "une fois désindexée".
Ce que je veux dire c'est que Google peut tenter de crawler régulièrement une page qui n'existe plus depuis plusieurs années. Il peut dans certains cas être intéressant de la supprimer définitivement avec une erreur 410.
D'après toi au pire combien il faut de temps pour désindexer une page avec une erreur 410 ?
@Nicolas : ça semble dépendre de la durée pendant laquelle cette page a existé et a été indexé, et de la masse des liens qui restent pointés vers elle (évidemment, il faut s'assurer à l'aide d'un crawler qu'aucun lien interne ne pointe vers elle, et qu'elle n'est plus listée dans des sitemaps)
Bonjour,
Lorsqu'une page n'existe plus il m'arrive de la mettre en erreur 410 (page supprimée qui n'a pas de redirection) dans la configuration Nginx du domaine concerné.
Pour cela il faut que la page (ancienne page on va dire) :
– soit très spécifique et elle n'a pas de pages "similaires".
– n'ait pas de BL externes.
Dans ce cas elle n'a pu lieu d'exister, j'économise ainsi un crawl ^^
@Nicolas : en effet dans ce cas la 410 peut fonctionner (c'est encore mieux de l'accompagner d'un message personnalisé adapté à la page, à destination de l'internaute). Mais tant que Google ne la désindexe pas (ça peut prendre un peu de temps), il va continuer de la crawler, donc je ne suis pas 100% d'accord avec ta dernière remarque.
Bonjour Olivier. Pour information, l'onglet "Téléphone multimédia" a disparu depuis ce matin de la rubrique "Erreur d'exploration". Je n'avais d'ailleurs jamais bien saisi la différence avec l'onglet "Smartphone". Bonne fin de journée.
@Supermaury : un onglet n'est présent pour une propriété Search Console que si en ce moment il y a des erreurs à lister pour l'onglet concerné. donc ça peut disparaitre puis revenir. A moins que j'aie raté un épisode précis sur l'onglet "Téléphone multimédia" mais je n'ai rien vu passer à ce niveau.
Il n'y a pas de rubrique "diagnostic" dans Google Webmaster Tools ou bien l'article n'est plus à jour.
En effet Steph, j'ai mis à jour l'article, l'emplacement est désormais Etat de santé > Erreurs d'exploration
D'ailleurs, concernant les backlinks on se demande d'ailleurs comment faire sur ce blog pour pouvoir laisser un commentaire intéressant mais qui, comme beaucoup d'autres déposé sur ce site, dispose d'un lien vers le site web du redacteur? je ne vois que le champs de saisie nom pseudo et adresse email mais pas de champs pour laisser l'adresse de son site. Comment ont bien pu faire ceux qui comme Axxion ont laissé un lien au dessus de leur commentaire avec un "rel="external" ? Est-ce une prestation de webrankinfo?
pendant longtemps j'ai laissé des liens dans les commentaires, mais j'ai capitulé tellement les spammeurs me faisaient perdre du temps
je considère qu'on n'a pas besoin de mettre un lien vers son site pour discuter d'un sujet…
C'est vrai qu'on ne pense pas toujours à modifier les pages 404 !! Et moi le premier, il va falloir que je mette en pratique ces bons conseils, je suis sur que c'est bénéfique aussi! Vous avez des chiffres là dessus ou c'est juste du vécu ?
C'est intéressant
Pensez aussi à faire un tour sur l'outil Bing Webmaster Tool, je le trouve bien mieux outillé que GWT (pour une fois)
+
Ok pour la technique, mais sur mon htaccess, je suis vite arrivé à 600 lignes, après ça fait long
C'est pas normal d'avoir besoin de 600 lignes…
Bonjour à tous,
J'ai lu ce post avec attention. J'ai un souci que je n'arrive ou je ne comprends pas la source du problème.
Webmaster tools de Google m'annonce un rapport ou toutes mes pages (sous-catégories de site sont passées en 404).
Je n'en connais pas la raison, voici l'exemple d'une de ces pages http://www.e-devis.ch/vie-pratique-demenagement.html
Pourriez-vous m'orienter sur la cause de ces pages non indexées et affichées en 404.
Merci pour vos retours
David
Bonjour à tous,
je suis un peu largué !
Patrick
Le titre de cet article n'est pas si trompeur que ça: il s'agit en effet de reconstruction d'un backlink depuis un lien brisé (intentionnellement ou non) donc il s'agit bien d'obtention, et encore plus avec la règle de réécriture on va vraiment se le reprendre de droit, il sera bien mérité 🙂
Bonsoir
Effectivement le titre est légèrement érroné. Je m'attendais à un autre article du type "comment obtenir des backlinks ?". Ceci étant, l'article reste productif.
amicalement
Bien intéressant effectivement, merci!
C’est vrai que cet article est interessant, mais le titre est un peu trompeur: il ne s’agit pas vraiment d’obtenir des backlinks, mais plutot de les optimiser
Très intéressant à savoir. merci.
@farang: pas tout à fait ! Un lien qui mène à une 404 n'est pas un lien, en tout cas pas exploitable du tout. Une fois corrigé, cela devient un lien.
C'est vrai que cet article est interessant, mais le titre est un peu trompeur: il ne s'agit pas vraiment d'obtenir des backlinks, mais plutot de les optimiser….
C'est vrai que la fonctionnalité des liens erronés dans GWT est excellente ! D'ailleurs, j'ai vu aussi dernierement que Google avait ajouté une modif pour augmenter et ou baisser le taux du passage du bot !
Très intéressant cet article, je viens encore d'apprendre des choses 🙂
Merci
Le mieux est encore (en php) de personnaliser sa page 404 de sorte qu'à chaque fois qu'elle s'affiche elle envoie également un mail avec l'URL de la page demandée, le referrer (on peut rajouter l'IP, le navigateur etc…). Cela permet de traiter en temps réel les 404
Google est sensible à ce genre de choses c'est clair. Comme par exemple il n'apprécie pas les sites conçus de manière à ne pas retourner d'erreurs 404, surement parce que çà ressemble aux générateurs automatique de pages…
Je vois qu'on utilise les mêmes techniques Olivier 😉 Pour l'un des sites pour lequel j'ai bossé, en optimisant à fond les ressources de cet outil j'ai vu "étrangement" mon nombre de visiteurs en provenance de Google multiplié par 3, et mon nombre de visiteurs en provenance de sites tiers multiplié par 2 😉
Oui j'ai vu cette liste (en anglais, merci pour ta traduc) et j'ai un petit article là-dessus à terminer…
Hello, comme c'est un des 69 points de la liste que j'ai publié, je mets le lien au cas où çà intéresserait (voir lien sur mon pseudo).
Les commentaires sont fermés
Inscription à la newsletter
Catégories
Consulting SEO
Envie d'améliorer votre référencement ?
Consultant SEO depuis 2003, j'ai une très grande expérience en audit et consulting. Que ce soit pour une demande ponctuelle, pour un audit ou du long terme, je peux vous aider.
WebRankInfo / Tous droits réservés 2022 – Mentions légalesMe contacter

source

Catégorisé:

Étiqueté dans :