Depuis de nombreuses années maintenant, Google propose des options permettant de filtrer les résultats de son index selon des options bien précises. Ces options ou opérateurs de recherche vont permettre d’adapter le périmètre d’une recherche.
Par défaut, la recherche sur les moteurs se fait par l’intermédiaire de mots-clés. Jusque-là, pas de problèmes.
En parallèle, Google autorise l’intégration d’opérateurs pour une recherche dite avancée [1] permettant un filtrage “manuel” des résultats pour plus de précision.
Dans cette perspective, il est par exemple possible de contraindre le moteur de recherche à baser ses résultats sur un seul site (site:ndd.extension mot-clé de la recherche) ou encore de remonter toutes les URLs contenant telle ou telle expression ou encore des variables.
Il existe de nombreux opérateurs de recherche ; certains sont utiles quotidiennement (site:, info:) d’autres ne sont plus viables et tombent progressivement dans l’oubli (link: ,inanchor:).
Cet opérateur permet d’avoir le nombre total de pages connues et donc indexées par Google à un instant t. Il est utilisé en tant qu’alternative au rapport “Etat de l’indexation” fournit au sein de la Search Console. Si vous ne l’utilisez pas quotidiennement, il y a un problème.
Cette formule permet de connaître la totalité des pages indexées pour un domaine précis. Bien entendu, ce volume bouge sans cesse et reste un indicateur approximatif.
Il est ensuite possible d’avoir le nombre de pages indexées d’un répertoire, d’un sous-domaine etc. Ici, on constate que Google a enregistré 93 pages dans le répertoire /apple.
Astuce
Cet opérateur est très pratique mais peut s’avérer trompeur s’il est mal utilisé. Il faut veiller à utiliser le nom de domaine afin d’englober la totalité des pages. Par exemple, la recherche site:journaldunet.com remonte 1,6 millions de résultats à l’heure ou cet article est rédigé quand la recherche site:www.journaldunet.com n’en remonte, elle, que 746 000. En effet, la recherche avec www ne prend pas en compte tous les sous-domaines affiliés au nom de domaine qui représentent au final la moitié des pages indexées par Google pour le domaine journaldunet.com.
Pour éviter les callosités et l’érosion de vos touches C et V, voici un petit bout de code à placer dans vos favoris pour générer un site: pour la page sur laquelle vous vous trouvez le tout en un seul clic .
Astuce
Si vous mettez le nom de domaine, Google vérifiera si la page d’accueil est indexée. Cette fonction est très utile mais n’est pas encore automatisée. L’opérateur site: ne fournissant qu’un échantillon du nombre de pages effectivement indexées, si vous souhaitez vérifier si toutes les pages de votre site sont indexées, vous devez nécessairement passer par cet opérateur.
Tout comme le site:, le info: est utilisé très fréquemment. Vous pouvez donc exploiter le même bout de code que celui fournit pour le site: simplement en modifiant site: par info:.
filetype: est un opérateur de recherche qui peut s’avérer très utile. En ajoutant cet opérateur à votre recherche, vous pourrez demander à Google de ne remonter qu’un seul type de fichiers dans les résultats. Par exemple, si vous souhaitez ne récupérer que des exemples de tableur sur de la comptabilité ou de la stratégie, une recherche « plan de financement PME filetype:xls » vous permettra de récupérer des fichiers téléchargeables sur lesquels vous baser.
Cet opérateur ne fonctionne pas avec toutes les extensions de fichiers mais les plus utilisées sont compatibles :
L’opérateur booléen OU
Cet opérateur a également un usage limité. Il permet de coupler les résultats entre deux termes lors d’une recherche sur une même thématique par exemple lorsque les appellations possibles sont multiples.
Exemple d’utilisation : Annales 1ère S OU Annales première S
Ici, on demande à Google de remonter les résultats concernant les annales de première S peu importe la version utilisée dans les résultats des pages ; chiffrée ou littérale.
Astuce
Cet opérateur est rarement utilisé seul mais peut s’avérer très utile. Par exemple, si on sait que l’on veut un smartphone d’une marque spécifique mais que l’on ignore la marque ou le modèle, l’opérateur peut vous permettre de regrouper tous les résultats sur une seule et même recherche. Il est l’équivalent du caractère | (Alt Gr + 6)
Les autres opérateurs
Il existe de nombreux autres opérateurs de recherche. Ces derniers restent relativement peu utiles dans le cadre d’une analyse SEO.
#requete – permet de faire une recherche de hashtag
@requete – permet de faire une recherche focalisée sur les réseaux sociaux
requete AROUND(X) requete – permet de remonter les pages avec un nombre maximum de mots entre les deux parties de la requête
define:requete – permet d’avoir une définition souvent tirée de Wikipédia
map:ville – permet d’avoir directement la carte d’une région
stocks:entreprise – permet d’avoir le cours en bourse d’une société cotée
weather:ville – permet d’avoir une vue globale sur la météo d’une ville/région
etc.
Connaître la progression d’une migration
Si vous avez effectué une migration pour passer sur la version sécurisée du protocole HTTP, vous pouvez vérifier l’évolution de la transition.
site:monsite.extension pour avoir le nombre de pages indexées sur un domaine
site:monsite.extension inurl:https pour avoir le nombre de pages indexées en HTTPS
site:monsite.extension -inurl:https pour vérifier que le nombre correspond au total de l’étape
Connaître la répartition de l’indexation par catégorie
Si vous souhaitez savoir comment Google indexe votre site dans le détail, vous pouvez faire des recherche par répertoire, par langue, par variable etc.
site:monsite.extension pour avoir le nombre de pages indexées sur un domaine
site:monsite.extension/repertoire-n pour avoir le nombre de pages indexées sur les n répertoires
Connaître le nombre de pages paginées indexées pour un site
site:monsite.extension pour avoir le nombre de pages indexées sur un domaine
Identifier la variable relative à la pagination sur le site (exemple « p= » ou encore « page= »)
site:monsite.extension inurl:page=2..100 pour avoir le nombre de pages de pagination indexées pour un site (le = et le & ne sont pas pris en compte, l’ajout d’une échelle numérique permet de contourner le problème)
Par exemple, pour le site Aushopping.com du groupe Auchan, en utilisant les opérateurs de recherche, on peut voir que le site n’a pas de problème de pagination. Sur plus de 2 millions de pages indexées, le site n’a plus que 536 pages de paginations dont la moitié sont des pages 2 et 3. Par ailleurs, on note qu’aucune d’entre elles ne remonte sur les pages positionnées des outils d’analyse (Yooda et SEMrush pour le test).
Les opérateurs de recherche permettent d’avoir une vue globale sur une étape encore peu analysée par les outils : l’indexation. Ces derniers ont cependant une limite ; ils ne peuvent intégrer des contraintes relatives au code source. Par exemple, si vous souhaitez savoir pour une quelconque raison la répartition des pages indexées par ordre de prix, le seul moyen d’aller plus loin est de scraper toutes les pages pour récupérer le prix des produits puis de vérifier si chacune d’entre elles est indexée.
Seul Google connaît dans le détail les URLs indexées d’un site. S’il propose un nombre approximatif au sein de la Search Console et avec l’opérateur site: (qui ne sont jamais équivalent), il ne permet toujours pas de les récupérer. Si vous souhaitez donc savoir comment récupérer la totalité des URLs indexées pour un site donné, il vous faudra automatiser les requêtes site: et info: … mais Google n’aime pas trop シ!
[1] On différencie ici la recherche avec opérateurs et la fonctionnalité Recherche avancée proposée par le moteurDéfinition : Les opérateurs de recherche Google, c’est quoi en réalité? Par défaut, la recherche sur les moteurs se fait par l’intermédiaire de mots-clés. Jusque-là, pas de problèmes. Fig. 1 : Recherche standard En parallèle,…
Je gère mes abonnements push
Les informations recueillies sont destinées à CCM Benchmark Group pour vous assurer l’envoi de votre newsletter.
Elles seront également utilisées sous réserve des options souscrites, par CCM Benchmark Group à des fins de ciblage publicitaire et prospection commerciale au sein du Groupe Le Figaro, ainsi qu’avec nos partenaires commerciaux.
Le traitement de votre email à des fins de publicité et de contenus personnalisés est réalisé lors de votre inscription sur ce formulaire. Toutefois, vous pouvez vous y opposer à tout moment
Plus généralement, vous bénéficiez d’un droit d’accès et de rectification de vos données personnelles, ainsi que celui d’en demander l’effacement dans les limites prévues par la loi.
Vous pouvez également à tout moment revoir vos options en matière de prospection commerciale et ciblage. En savoir plus sur notre politique de confidentialité ou notre politique Cookies.