Sélectionner une page
Publié par Olivier Andrieu | 15 Juin 2022 | À lire sur Réacteur | | Temps de lecture : 3 minutes
Commençons par la définition du contenu dupliqué et pour cela reprenons l’explication officielle de Google :
« Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques dans la même langue ou sensiblement similaires. Dans la plupart des cas, ces contenus ne sont pas trompeurs à l’origine. »
En se basant sur cette définition, nous pouvons facilement élaborer quelques typologies de contenu dupliqué.
En fonction du lieu d’apparition du contenu en double, on peut avoir :
En fonction du taux de similitude, on distingue :
En fonction de la nature des duplications :
A ces trois types de duplications, on peut ajouter une 4ème :
Selon le type de duplication, la gravité, la réaction et les méthodes de correction ne seront pas les mêmes. C’est ce que nous allons voir plus tard dans cet article.
Du côté des moteurs de recherche, la comparaison de documents web dans l’objectif d’en identifier les doublons est toujours une affaire de compromis entre précision et ressources machine consommées.
Beaucoup d’algorithmes qui sont à notre disposition et que nous pouvons utiliser sans aucun problème pour nos projets, s’avèrent très vite inefficaces à l’échelle du Web quand il faut effectuer la comparaison avec des millions, voire des milliards de pages web.
Pour identifier si un site contient du contenu dupliqué, Google utilise plusieurs niveaux, méthodes et algorithmes d’analyse.
…
[Cet article est disponible sous sa forme complète pour les abonnés du site Réacteur. Pour en savoir plus : https://www.reacteur.com/2022/06/contenu-duplique-et-seo.html]Un article écrit par Alexis Rylko, consultant SEO senior chez iProspect (https://www.iprospect.com/ & https://alekseo.com/)
Partager :
Note :
Laisser un commentaire (*** Cliquez ici pour lire la charte de saisie de commentaire ***)
Votre adresse e-mail ne sera pas publiée.
La charte Abondance.com pour la soumission de commentaires est la suivante :
– Champ Nom : obligatoire. Seuls les noms de famille et/ou prénoms sont acceptés. Un commentaire n’est pas écrit par une entreprise, mais par une personne physique. Les textes d’ancre (sur)optimisés et les noms d’entreprises indiqués dans ce champ verront automatiquement l’URL associée supprimée et la mention [Anonyme] indiquée à cet endroit.
– Champ E-mail : obligatoire. L’adresse mail n’est pas affichée si le commentaire est validé.
– Champ Site web : facultatif. Uniquement affiché si le champ “Nom” contient le patronyme d’une personne (voir ci-dessus). Le mieux est certainement d’y indiquer l’URL de votre compte Facebook, Twitter ou Google+. Mais vous pouvez également y indiquer l’URL de votre site web (page d’accueil uniquement).
Merci !!!
Consultez le site Livre Référencement !
© Abondance | Toute l'actualité sur le SEO et les moteurs de recherche