10 min pour l’audit SEO d’une page introuvable
Ce billet est la traduction plus ou moins fidèle du billet « 10 minute missing page audit » publié par Dr. Pete sur SEOmoz.
Cet audit en 10 minutes ne remplacera pas un audit complet et professionnel de votre site mais il vous permettra de déterminer pourquoi une page est absente des résultats de recherche, pourquoi elle ne se positionne pas, vérifier si elle a été pénalisée et pointer les problèmes de duplication.
0:00-0:30 – Vérifiez que le site est indexé
Il faut toujours commencer par le début : est-ce que votre page est réellement introuvable? La commande site: de Google est votre meilleure alliée pour vérifier ce point. Combinée à des mots clefs (« mots clefs » pour rechercher l’expression exacte) et des opérateurs tels que intitle: inurl: etc elle vous permet d’en savoir plus. La commande la plus basique est juste :
Utilisez ici le domaine racine. On ne sait jamais quand Google indexe de multiples sous-domaines (ou le mauvais sous-domaine et cette information sera utile plus tard. Ici on veut juste vérifier que Google connait l’existence de votre site.
0:30-1:00 – Vérifiez que la page n’est pas indexée
Admettons que Google connait l’existence de votre site, il est temps de vérifier une page spécifique. On peut entrer le chemin complet derrière la commande site: ou utiliser une combinaison de site: et inurl:
Si la page n’est pas indexée, remontez le problème en testant le « /répertoire » et vérifier si d’autres pages au même niveau sont indexées. Si la page n’est pas indexée du tout, la prochaine étape ne sert à rien.
1:00-1:30 – Vérifiez que la page ne se positionne pas
Si la page est indexée mais que vous ne pouvez pas la trouver dans les résultats de recherche, entrez un extrait de la balise TITLE et faites une « recherche exact » (entre guillemets) dans Google. Si vous ne pouvez toujours pas la trouver, combinez site:example.com avec la TITLE de votre page ou une partie de la TITLE. Si la page est indexée mais ne se positionne pas, vous pouvez sauter les prochaines étapes et reprendre à la 4ème minute.
1:30-2:00 – Vérifiez le robots.txt
Admettons que votre site soit indexé partiellement mais que la page en question est absente de l’index. Bien que les erreurs dans le robots.txt soient de plus en plus rares, il n’est pas inutile d’y jeter un oeil pour vérifier que vous n’avez pas bloqué accidentellement les robots. Le robots.txt se trouve ici : http://www.iana.org/domains/example/.
Ce que vous cherchez ici c’est un bout de code qui ressemble à ceci :
Cela peut être une directive bloquant tous les user agents ou juste un comme Googlebot. Vérifiez toutes les directives qui utilisent le « disallow » vers la page spécifique ou le dossier en question.
2:00-2:30 – Vérifiez la META Noindex
Un autre problème bloquant peut arriver avec une mauvaise utilisation de la META Noindex. Dans le header du code source HTML (entre <head> et </head> on recherchera quelque chose comme ceci :
Bien qu’il puisse paraître étrange de bloquer une page que l’on souhaite voir indexer, la mauvaise utilisation d’une META Noindex et Rel=Canonical (voir ci-dessous) peut résulter de l’installation de certains CMS.
2:30-3:00 – Vérifiez le Rel=Canonical
Ce point est un peu plus délicat. Le tag Rel=Canonical est souvent une bonne chose qui aide à la déclaration d’une page canonique et qui évite la duplication de contenu. Le tag ressemble à cela :
Le problème arrive lorsque vous canonisez trop étroitement. Par exemple si toutes les pages de votre site possèdent un tag canonical avec l’url « www.example.com » Google comprendra qu’il faut réduire votre index de recherche à UNE seule page.
Pourquoi feriez-vous cela? Vous ne le voulez certainement pas mais cela peut arriver du fait de la mauvaise configuration d’un CMS, d’un plugin ou autre. Ce problème est d’ailleurs en pleine expansion.
3:00-4:00 – Vérifiez les mauvaises redirection dans le header
Dans certains cas une page peut renvoyer un mauvais header, un code d’erreur (404 par exemple) ou une redirection mal structurée (301/302) qui empêchera une bonne indexation. Vous avez besoin d’un vérificateur d’entête pour cela (il en existe beaucoup de gratuits sur le net), essayez HTTP Web-Sniffer. Vous cherchez un code « 200 OK« . Si vous trouvez une liste de redirection, une 404 ou tout autre code d’erreur (4xx ou 5xx) vous pouvez avoir un problème. Si vous avez une redirection (301 ou 302) vous envoyez votre page introuvable vers une autre. Supprimez donc la redirection.
4:00-5:00 – Vérifiez la duplication par d’autres sites
Il y a deux causes possibles à la duplication de contenu : la duplication par votre propre si ou celle par d’autres sites. La seconde arrive lorsque vous partagez votre contenu (par exemple avec vos affiliés) ou lorsque des sites vous scrappent. Le problème est que si Google détecte la duplication, il va probablement indexer une page et ignorer les autres.
Si vous suspectez que le contenu de votre page introuvable a été copiée par un autre site, cherchez un bout de phrase unique de votre contenu et Google le surlignera (faites une recherche exacte). Si un autre site apparait dans les résultats, il est probable que votre page a été considérée comme une duplication.
5:00-7:00 – Vérifiez la duplication interne
La duplication interne arrive habituellement lorsque Google crawl de multiples variations d’une URL pour la même page, comme quand il y a des paramètres de session dans l’URL. Si Google arrive sur une même page avec 2 urls différentes, il voit deux pages différentes et l’une d’entre elle sera probablement ignorée. Parfois cela passe, mais des fois Google ignore la mauvaise.
Pour la duplication interne, utilisez une recherche avec site: et quelques mots clefs unique de la TITLE de la page (toujours entre guillements) ou utilisez intitle:. Les URL dupliquées ont naturellement la même TITLE et le titre de la page est le meilleur endroit pour détecter le problème. Si vous trouvez la même page plusieurs fois avec des URLs différentes ou une ou deux pages suivies de :
il est fort probable que votre page introuvable ait été filtrée à cause d’une duplication interne.
7:00-8:00 – Listez les textes de vos ancres
Les deux points suivants sont un peu plus délicats et subjectifs. Mais ils peuvent être utiles si vous suspectez une dévaluation ou pénalisation de certaines de vos pages. Un moyen facile de détecter le problème est quand vous avez une liste d’anchor text suspectes, en général un mot clef non commun qui revient trop souvent dans vos liens entrants. Cela peut venir d’une trop agressive campagne de linking ou de quelque chose tel qu’un widget qui va dominer votre profil de liens.
Open Site Explorer vous permet de trouver facilement les ancres de vos backlinks. Entrez votre URL, cliquez sur « Anchor Text Distributions » et sélectionnez « Phrases » :
Ce que vous cherchez est un échantillon de répétions non naturelle. Quelques répétions peuvent être ok car vous allez naturellement utilisez comme ancre votre non de domaine ou votre marque par exemple. Mais par exemple imaginons que 70% des liens pointant vers SEOmoz aient pour ancre « Danny Dover est formidable », cela ne serait pas naturel. Si Google pense que c’est un signe de manipulation, vous pouvez voir la page cible pénalisée.
8:00-10:00 : Vérifiez la qualité de votre profil de liens
Un profil de liens de qualité c’est très subjectif et vous n’avez pas le temps de le faire en 2 minutes. Mais si vous avez une pénalité en cours, c’est parfois facile de pointer les mauvais liens rapidement. Nous allons encore utiliser Open Site Explorer et nous allons utilisez les options : Followed + 301, External Pages Only, All Pages on The Root Domain :
Vous pouvez exportez les liens sur Excel mais ici, vérifiez rapidement. Pointez les problèmes tels que :
- Ancre de liens suspectes
- Sites hors sujets
- Liens positionnés dans des blocs « échange de liens » ou « liens payants »
- Liens qui proviennent d’un footer pleins d’autres liens
- Liens publicitaires qui sont suivis (et qui ne devraient pas)
De plus, vérifiez tous les liens de basse qualité comme commentaires de blogs, articles marketing, etc. Si déterminer votre profil de liens peut prendre des heures, repérer les liens spammy ne prend que quelques minutes. Si vous pouvez repérer ce problème rapidement, Google le pourra lui aussi.
10:00 – Et voilà
Dix minutes c’est relativement court (vous avez mis peut être plus de dix minutes pour lire ce post, quant à moi j’ai mis plus de 10 minutes pour l’écrire!) et vous pouvez apprendre beaucoup sur votre site en quelques minutes. Bien entendu trouver et résoudre un problème sont deux choses très différentes mais j’espère que cette méthode vous permettra de détecter certains problèmes de votre référencement.
Damien
Merci pour cet article, il est vrai qu’en peu de temps on peut diagnostiquer les problèmes relatifs à l’indexation d’une page. Le plus difficile c’est bien entendu le positionnement qui demande du temps, du contenu et des liens !
Crunch
Je ne connaissais pas 2 trucs sur la dizaine proposée mais c’est vrai qu’un fois la méthode acquise, ça passe comme sur des roulettes ! 🙂
.-= Crunch@ps3 theme´s last blog ..Hitman-Blood money by Shado =-.
Matthieu
Très bonne idée de détailler pas à pas les méthodes nécessaires à l’identification d’un problème.
Et très bonne idée de l’avoir traduit 😉
.-= Matthieu@Référencement naturel Google´s last blog ..Gérer Feedburner et ses redirections =-.
Thierry
Merci pour cette traduction. C’est bien utile.
Le SEO est souvent complexe pour les néophytes comme moi. J’aime bien les deux derniers points de l’article.
.-= Thierry@Grammaire française´s last blog ..Météore- météorite et météroïde =-.
Mikaël
Super, ça peut toujours servir et je ne connaissais pas Open Site Explorer c’est un bon site à connaitre 🙂
Merci comme toujours un article bien chiadé !
.-= Mikaël@Technicien Informatique´s last blog ..Supprimer le lien « Powered by Phoca Gallery » sur 274 =-.
lemoussel
Article très didacticiel et clairement exprimé.
Bravo Marie 😉
.-= lemoussel@aloe vera´s last blog ..Capsule Aloe Vera =-.
mikiweb
J’aime beaucoup le titre accrocheur mais je trouve le contenu un peu pauvre quand même.
C’est du survol SEO, vraiment le basic du basic mais surement très utile pour certain.
Ça aurai été super de mettre les solutions à adopter après dépistage du problème => peut être un prochain billet 😉
YvanDupuy
Et dire que l’on trouvait des erreurs que tu mentionnes sur le site France.fr…Ton billet est parfaitement synthétique, j’aurais quand même mentionné les erreurs 404 pouvant être générées et traquées, le contenu masqué (très peu aimé de google) au même titre que le duplicate content, ainsi que l’achat ou la revente de liens ou tout autre technique de black hat, qui peut rapidement faire sauter une page…
.-= YvanDupuy´s last blog ..Magie et tours de cartes- du nouveau du coté de Jean Pierre Vallarino =-.
Moa
Bonne petite check list pour auditer un problème relatif à l’indexation d’une page.
J’avais jamais pensé à vérifier la qualité du profil des liens….
1 remarque tout de même:
Cela prend certainement au commun des mortels bien plus que 10 minutes pour réalisaer un audit complet
(PS: Marie, je crois que MinuteS prend un S en anglais également quand elles sont 10 😉 )
Maxime
J’avais lu l’article sur SEOmoz, mais merci pour cette traduction, elle pourra servir aux éventuels collaborateurs ne maitrisant pas la langue de Shakespeare, où simplement trop fatigué pour lire de l’anglais 😉
Cerbere
Moi j’aime quand on m’explique les choses tranquillement.
Tu as une pensée synthétique que je trouve très pratique.
Je n’ai jamais été confronté au problème d’une page introuvable, cependant ton article me servira à l’avenir dans ma méthodologie.
.-= Cerbere@Blog Affiliation´s last blog ..La dure vie d’un affilié français =-.
Winsa
Merci pour cette traduction forte intéressante. Cela m’a fait penser a une solution qu’il faudrait que j’essai sur un site.
Christophe BENOIT
Lu en anglais, j’avais moi aussi apprécié cet article : simple et efficace comme d’hab.
.-= Christophe BENOIT´s last blog ..Maximiser son référencement grâce aux pages satellites en 2010 ! =-.
Keeg
J’ai lu ce billet aussi quand il est sorti en anglais, le concept est pas mal. D’ailleurs, ça m’a donné une autre idée de billet arrangé à ma sauce, que je n’ai toujours pas écrit.
Le billet est bien foutu sinon.
.-= Keeg´s last blog ..Cadeaux aux blogueurs – Produits de fou de Sandisk =-.
Sylvain
Un bon article bien SEO comme je les aime. Même si c’est juste une traduction, elle a le mérite de rendre la méthode accessible aux non-anglophone.
ps : je le trouve pas donné opensitexplorer en version pro…
.-= Sylvain´s last blog ..20 annuaires de qualité =-.
Référencement naturel google
Merci marie, je viens de perdre 10 mins ^^.
Nous pouvons aussi utiliser Yahoo pour les liens externe, mais dans 2 ans terminé.
Aurélien
On peut aussi regarder du côté des meta refresh, redirection en JS et des frames, si si, même en 2010 cela arrive.
.-= Aurélien@Pink hat´s last blog ..Un faux Google bombing – Sarkozy de nouveau classé comme un trou du cul =-.
Bruno Hug
Merci Marie, je connaissais l’article mais la traduction est vraiment bien faite, bravo à toi
.-= Bruno Hug@Blog Référencement et SEO´s last blog ..Verifier l’indexation d’une page avec SEO Quake =-.
Antoine
Merci pour cet article intéressant. Premier commentaire sur votre blog que je suis régulièrement.
Sebastien
Merci pour cette traduction bien utile car il y avait plusieurs trucs que je ne connaissais pas. Une question cependant car j’ai le problème inverse (des pages que je ne veux pas indexer pour éviter le duplicate content sont indexées) : est-il possible que Google indexe des pages qui sont en meta noindex ? Car j’ai ce problème depuis quelques jours. Si c’est déjà arrivé à quelqu’un ici et qu’il sait comment éviter ce problème, je lui serais très reconnaissant de m’indiquer sa méthode.
Bruno Hug
Logiquement si tu couple ça avec des précisions dans robots.txt ça devrait fonctionner.
.-= Bruno Hug@Blog Référencement et SEO´s last blog ..Verifier l’indexation d’une page avec SEO Quake =-.
RDD
Je link je tweet et j’oublie de commenter, bravo moi !!!
Sympathique traduction de l’article de seomoz, qui en plus a le mérite de faire de la pub pour open site explorer (développé par … seomoz oui c’est bien ça ;)).
linkdiagnosis est également cool pour un diagnostic des bl, mais beaucoup plus lent que open site explorer.
.-= RDD@Renardudezert´s last blog ..Clients SEO- si on vous disait la vérité =-.
Jimmy Braun
Bravo pour la version française de cet article bien utile, dont le modèle est très pertinent et pédagogique pour expliquer le but d’un audit auprès d’un client. Merci Marie ! (et au Doc. Pete)
.-= Jimmy Braun´s last blog ..introduction =-.
Caroline
Se faire indexer son site par Google, c’est facile…
Se faire référencer sur des mots compétitifs, c’est une autre histoire !!!
le juge
C’est un bon article pour les débutants et ca nous soulagera de temps en temps peut etre vis a vis des questions clients et internautes qui ne comprennent pas pourquoi leur page « super optimisée » ne se positionne pas sur le mot clé qu’il veulent ou n’est pas indexée!
.-= le juge@Muscle Référencement´s last blog ..Comment Modérer son Blog =-.
Pierre
Merci pour la traduction, une check list complète… qui sert de reminder pur certain et sera peut être une grande découverte pour d’autres 🙂
sebguerin
Un très bon article.
La partie dédié au duplicate content des autres sites est un bon rappel…surtout pour moi qui pratique l’affiliation sur mes produits.
Seul bémol: les points à vérifier sont isolé mais on a pas les solutions à mettre en œuvre pour pallier à ces problèmes. En même temps c’est pas le but d’un Audit.
Bonne journée
cougar
je tombe pour la première fois dsur ce blog, et surprise j’y découvre une synthèse vraiment sympathique et clair sur le SEO.
.-= cougar´s last blog ..Nokia N8 – Dot- la plus petite animation en stop motion au monde =-.
Djolhan
C’est une très bonne idée de l’avoir traduit cet article.
Opensiteexplorer est un très bon outil, s’enregistrer permet de débloquer certains fonctionnalités donc autant en profiter 😉
blackat
Trés bon article (comme d’habitude j’ai envie de dire), même si il ne s’agit que d’une traduction, il a bien fallut la remetre en forme.
ceci dit, je me pose une question : Certain audit « pro » que j’ai vue passé chez des clients étaient encore moins fournit que ca, et plusieurs centaine d’euros était facturé. …
Es ce que les SEO en question étaient de mauvais fois, ou tout simplement le site avait énormément de problème et ne sont pas aller chercher plus loin ?
doit on perdre du temps quand un site a de grosse lacune, ou se contenter du minimum, en disant qu’une nouvelle prestation serait mieux (tout simplement) , vue que le client (lambda) ne comprendra pas la moitié de ce qu’on lui explique de toute facon ?
(ouf)
.-= blackat@techniques de référencement´s last blog ..Etes-vous un bon client … ou un mauvais client =-.
Campagne (Jean-Luc)
Excellent, en particulier les derniers points. Merci pour cette traduction.
Referenceur freelance
Mais ces 10 minutes suffisent pour diagnostiquer le problème d’une page. Donc cette petite liste est bien utile pour chacun de nous. De plus moi qui fait de la formation, j’adore les articles qui résument certains aspects de notre métier, car ils sont faciles à intégrer dans un cours et aisément compréhensible.
Chronoduweb
Nice, mais les laps time sont largement optimisable !
Dites moi il ne faudrait pas prendre en considération la date de mise en ligne de la page au passage … Si je check après demain la mise en ligne d’une page intégré sur mon site aujourd’hui, ça peut aussi jouer.
.-= Chronoduweb´s last blog ..chronoduweb- Cest décidé je répondrais toujours à mes Mp sur Twitter !! =-.
Le Juge
@Blackat
C’est vrai que des fois certains audit « pro » sont assez léger. C’est justement pour cela que cet article est plutot bien, il permet au « clients » d’avoir certaines bases pour jauger de la qualité d’une prestation.
blackat
@Le Juge : oui , ils sont parfois léger. mais un « consultant » doit il aller plus loin ? ou cela donne deja beaucoup de travail rien qu’en disant le minimum ? Quand dans un site il y a beaucoup ( tout ) à jeter , doit on réelement passer des heures a tout détailler ? car a la fin ca reviens a faire un nouveau cahier des charges, et non plus à faire un audit ( oui je caricature ).
suis je dans l’erreur, ou pas ? ^^
@tous : ce sont des questions ouvertes à tous 😉
.-= blackat@techniques de référencement´s last blog ..Etes-vous un bon client … ou un mauvais client =-.
Gael
J’ai rit jaune en lisant le « 2:00-2:30 », la semaine dernière j’ai fait l’énorme bourde de laisser cette balise lorsque j’ai publié la V2 d’un site pour un ami …
Google n’a pas du tout ignoré cette balise contrairement à ce que je pensais, il a fallu 1 semaine pour que tout revienne … et une belle perte de CA …
la honte totale 🙁
andré
Merci à vous…Quel gain de temps!
Marie Jospin
Je ne m’attendais pas à trouver un tel article si clairement écrit. Un gain pour moi, merci 🙂
JB
Merci de remettre à plat certaines choses qui sont rentrées dans la routine de nombreux SEO 🙂 au moins maintenant je saurais ce que je fais …
.-= JB@blog seo´s last blog ..Revue de liens SEO 2 – gestion de projet SEO- launchlist- partage de connaissances =-.
Référéenceur SEO Labidi Kamel
article très intéressant qui m’a aidé à faire mon meilleur analyse dans les un délais bien précis.
e-majine
je ne connaissais pas Open Site Explorer , j’utilise plutôt yahoo site explorer ou linkdiagnosis. la méthodologie de la procédure est claire. bravo pour la trad.
Benoit
Bon résumé de la question. Toutefois, comme le précise Damien, le référenceur a plutôt pour habitude d’avoir du mal à positionner plutôt qu’à indexer ! Mais il y a un début à tout…
Wilfried
Un article qui a le mérite d’être bien rédigé et plutôt exhaustif en 10 min ( et quelques^^)
Merci encore
Marketing Internet : Montréal
Bonjour Marie,
je ne manquerai pas de présenter cet article à tous mes nouveaux stagiaires en référencement car il est très fréquent que cela arrive et qu’ils sont déboussolés.
France
L’article a beau être complet (et clair), j’ai mis presque plus de temps à lire les commentaires… quel succès ! 🙂 En tout cas merci pour la traduction, ça change des articles en anglais qui demandent un peu de gym au cerveau, du moins en ce qui me concerne !
alterTIC
J’avais apprécié le côté synthétique et structuré de l’article d’origine et j’avoue qu’ayant eu la flemme de le traduire j’apprécie ce billet, thanks 😉
Très utile pour faire un petit topo simple et vulgarisé à ses clients sur l’indexation et la sur-optimisation.
Pour lister les ancres et analyser mes profils de liens j’avoue que depuis près de 2 ans je ne jure que par le couple Advanced Web Ranking et Advanced Link Manager. Et je saupoudre tout ça de temps à autre par un chouia de LinkAssistant et SeoSpyGlass. Ca m’évite de m’éparpiller, désormais je m’en tiens à ça + Excel + bloc note et armée de post-it…
Bonne continuation!