Marketing

Est-ce que Google utilise Wikipedia pour évaluer les sites depuis la mise à jour de juin 2019 ?

Le 27 juin 2019 - 12 minutes de lecture
mercola-seobserver-seo

Le site alternatif de santé, Mercola, a publié qu’ils ont perdu 99% de leur trafic à cause de la mise à jour de juin 2019 de Google. L’article cite les Quality Raters Guidelines et affirme que l’algorithme de Google cible les sites qui sont décrits avec un sentiment négatif dans Wikipedia.

Google pourrait-il utiliser Wikipédia pour abaisser le classement des sites Web ?

Mercola prétend que Wikipedia est responsable du classement des chutes de classement

Le Dr Mercola cite plusieurs articles qu’il a lus en ligne afin de démontrer que les déclarations négatives publiées sur Wikipedia au sujet de Mercola.com sont la raison pour laquelle Google a cessé de classer Mercola pour les questions de santé.

Selon le Dr Mercola :

Google abaisse manuellement le classement des contenus indésirables, en se basant largement sur l’évaluation de l’auteur ou du site par Wikipédia.

Les citations sélectives peuvent être trompeuses

Cet énoncé est basé sur ce qui est écrit dans le guide des évaluateurs de la qualité. La partie citée est une instruction disant aux évaluateurs de qualité d’utiliser Wikipedia pour vérifier la réputation d’un site Web.

Mais c’est une citation sélective. Une citation sélective est une citation où quelqu’un cite une partie d’une déclaration pour prouver un point. Mais ce point s’effondre quand on le lit dans tout le contexte.

Par exemple, c’est comme si quelqu’un citait une autre personne comme ayant dit : « J’ai battu mon fils… » alors qu’en fait, la personne avait dit : « J’ai battu mon fils en jouant au Monopoly ».

Le contexte complet de ce qui se trouve dans les Quality Raters Guidelines est l’utilisation de paramètres de recherche avancés dans Google, les instructions pour vérifier d’autres sites d’évaluation, pour vérifier ce que les gens sur les médias sociaux disent sur ces sites.

Les instructions pour faire des recherches sur la réputation d’un site Web vont bien au-delà de la consultation de Wikipédia.

Ce que disent les lignes directrices sur l’évaluation de la qualité

Utilisez la recherche sur la réputation pour savoir ce que les vrais utilisateurs, ainsi que les experts, pensent d’un site Web. Recherchez des critiques, des références, des recommandations d’experts, des articles de presse et d’autres informations crédibles créées/écrites par des personnes sur le site Web.

Les articles d’actualité, les articles de Wikipédia, les billets de blogue, les articles de magazine, les discussions de forum et les évaluations d’organismes indépendants peuvent tous être des sources d’information sur la réputation…

Google fournit même des conseils sur la façon d’utiliser les opérateurs de recherche avancée :

En utilisant ibm.com comme exemple, essayez une ou plusieurs des recherches suivantes sur Google :
● [ibm -site:ibm.com] : Une recherche pour IBM qui exclut les pages sur ibm.com.
● [« ibm.com » -site:ibm.com] : Une recherche pour « ibm.com » qui exclut les pages sur ibm.com.
● [ibm reviews -site:ibm.com] Une recherche d’avis sur IBM qui exclut les pages sur ibm.com.
● [« ibm.com » reviews -site:ibm.com] : Une recherche d’avis sur « ibm.com » qui exclut les pages sur ibm.com.
● Pour les créateurs de contenu, essayez de chercher leur nom ou leur pseudonyme

Il est clair que la mention de Wikipédia s’inscrit dans le contexte de l’enseignement des lignes directrices sur l’évaluation de la qualité de la recherche d’information sur la réputation dans le but de fournir des commentaires sur la qualité des résultats de recherche.

Rien dans ces instructions, y compris l’utilisation d’opérateurs de recherche avancée, n’indique que Wikipedia est utilisé par l’algorithme de Google.

Utiliser cette section pour deviner que Google utilise Wikipedia pour le classement de réputation est un saut extrême.

Ce n’est pas une preuve de l’utilisation de Wikipedia par l’algorithme de Google.

Quality Raters Guidelines et l’algorithme de Google

Une erreur que beaucoup de SEOs font aujourd’hui est de supposer que ce qui est dans le Quality Raters Guidelines reflète ce qui est dans l’algorithme de Google. C’est une erreur.

Le Quality Raters Guideline est un manuel pour les évaluateurs de qualité qui leur apprend comment évaluer les sites Web dans le but d’évaluer les changements expérimentaux de l’algorithme de Google.

Par exemple, John Mueller a récemment décrit les évaluateurs effectuant un examen côte à côte des résultats de recherche avec et sans modification de l’algorithme (voir la vidéo ici).

Essentiellement, nos évaluateurs de la qualité, ce qu’ils font, c’est que lorsque les équipes de Google apportent des améliorations à l’algorithme, nous allons essayer de tester ces améliorations.

Nous allons donc envoyer aux évaluateurs de qualité une liste de pages de résultats de recherche avec une version avec et sans ce changement, et ils verront quels sont les meilleurs résultats et pourquoi ils sont meilleurs.

Et pour les aider à évaluer ces deux résultats, nous avons les Quality Raters Guidelines.

Le Quality Raters Guidelines demande aux évaluateurs d’utiliser Wikipedia pour vérifier la réputation d’un site. Mais il demande également aux évaluateurs d’utiliser les blogs, les journaux, les sites d’évaluation et les opérateurs de recherche avancée pour faire des recherches sur la réputation d’un site.

Il est raisonnable de prendre ces instructions au pied de la lettre que Google indique aux évaluateurs de qualité comment vérifier si Google renvoie des sites de haute qualité.

C’est un énorme bond en avant que de prendre l’instruction aux évaluateurs de vérifier Wikipedia comme signifiant que Wikipedia est également utilisé par Google pour juger la réputation d’un site.

Google utilise-t-il Wikipedia pour l’analyse de réputation ?

Je n’ai jamais vu de recherches ou de brevets décrivant l’utilisation de Wikpiedia pour analyser la réputation d’un site Web. Les recherches que j’ai rencontrées portent sur des solutions comme l’utilisation de Wikipedia pour classer les chaînes YouTube et pour identifier les entités qui partagent le même nom.

Bill Slawski est un expert en brevets liés à la recherche. J’ai fait une recherche rapide sur le site SEOByTheSea de Bill Slawski pour tout ce qui concerne Wikipedia et il n’a rien publié qui indique que Google utilise Wikipedia pour analyser la réputation.

Le problème avec les hypothèses SEO

Une hypothèse est une explication à quelque chose. Une théorie est basée sur des preuves, comme des expériences.

Dans le référencement, il existe de nombreuses hypothèses et théories. Une hypothèse est celle où quelqu’un propose que Google utilise quelque chose, mais manque de preuves telles que des recherches ou des brevets de Google (ou de tout autre organisme de recherche comme une université ou Microsoft).

Les hypothèses sont fondées sur des données de zéro à faible épaisseur, telles que des études de corrélation sommaire. D’après mon expérience, la plupart des hypothèses se sont toujours révélées fausses.

Le fait est qu’à l’heure actuelle, dans les Quality Raters Guidelines de Google, Google demande aux évaluateurs de consulter Wikipedia pour évaluer les changements apportés à l’algorithme de Google. Point final.

Lire entre les lignes de ces instructions pour conclure qu’il est directement lié à l’algorithme de Google serait une erreur.

Bill Slawski sur Wikipédia pour le classement de réputation

J’ai demandé à Bill Slawski, s’il connaissait des brevets liés à l’utilisation de Wikipedia pour l’analyse de réputation et le classement.

Ben Gomes a fait une déclaration sur les lignes directrices des évaluateurs de la qualité » »Ils (les lignes directrices des évaluateurs de la qualité) ne vous disent pas comment l’algorithme classe les résultats, mais ils montrent fondamentalement ce que l’algorithme devrait faire. »

J’ai vu des mentions de Wikipédia dans Google Patents, mais aucune ne dit que Google pourrait utiliser l’information à partir de là pour aider à classer la qualité des pages en fonction de la réputation d’une entreprise ou d’un créateur de contenu.

J’ai ensuite demandé à Bill s’il était possible d’utiliser les Quality Raters Guidelines pour trouver des indices sur la façon dont Google classe les sites Web :

Ces évaluations humaines ne sont qu’une tentative de la part des humains pour permettre aux ingénieurs de recherche d’avoir une certaine rétroaction sur la qualité des pages dans les résultats de recherche. Ils fournissent des outils pour les aider à fournir de la rétroaction, et non pour classer ces pages de la même façon que Google pourrait l’être.

Bill Slawski m’a également renvoyé à la recherche Google de 2018 qui utilise Wikipédia pour comprendre les relations entre les mots et leur contexte dans les phrases. sa recherche porte sur la compréhension des mots dans leur contexte. Il ne s’agit pas d’utiliser Wikipédia pour juger et classer les sites Web.

Il s’agit simplement d’un exemple de recherche Google qui s’appuie sur Wikipédia.

Google juge-t-il la réputation d’un site ?

En 2010, Google a officiellement annoncé qu’il effectuait une analyse de sentiment afin de juger les sites Web. L’article du blog écrit par l’ancien directeur de Google Search s’intitule : Being Bad to Your Customers is Bad for Business.

L’annonce faisait référence à un article paru dans le New York Times qui donnait l’impression que les liens vers un mauvais commerçant provenant de sites disant des choses négatives sur le commerçant l’avaient bien placé.

Cela fait partie de l’annonce :

…au cours des derniers jours, nous avons mis au point une solution algorithmique qui détecte le commerçant à partir de l’article du Times ainsi que des centaines d’autres commerçants qui, à notre avis, offrent une expérience utilisateur extrêmement mauvaise.

L’algorithme que nous avons incorporé dans nos classements de recherche représente une première solution à ce problème, et les utilisateurs de Google en tirent une meilleure expérience.

L’article a ensuite été relié à un document de recherche de 2007 intitulé Large-Scale Sentiment Analysis for News and Blogs (PDF).

Le document de recherche dit :

Nous déterminons le sentiment du public sur chacune des centaines de milliers d’entités que nous suivons, et comment ce sentiment varie avec le temps.

Il existe une autre version de ce même document de recherche qui est plus longue et plus complète.

La version plus longue conclut :

Il y a beaucoup de directions intéressantes qui peuvent être explorées. Nous nous intéressons à la façon dont les sentiments peuvent varier selon le groupe démographique, la source des nouvelles ou l’emplacement géographique. En élargissant notre analyse spatiale des nouvelles entités à des cartes de sentiment, nous pouvons identifier les régions géographiques d’opinions favorables ou défavorables pour des entités données.

Nous étudions également la mesure dans laquelle nos indices de sentiment prédisent les changements futurs de popularité ou de comportement du marché.

Il existe également un PDF de Google Research de 2008 intitulé Leveraging User Annotations in Sentiment Summarization. Il fournit une vue d’ensemble de l’extraction du sentiment positif ou négatif dans les commentaires des utilisateurs.

L’algorithme de Google utilise-t-il l’analyse des sentiments ?

Jusqu’à présent, j’ai écrit sur l’analyse de réputation. Cependant, c’est ce qu’on appelle généralement l’analyse du sentiment. Il y a eu beaucoup de recherches sur l’analyse du sentiment au milieu des années 2000. Google continue de publier des recherches à ce sujet.

L’une des publications les plus récentes s’intitule « Multilingual Multi-class Sentiment Classification Using Convolutional Neural Networks ».

Le document propose un moyen indépendant du langage d’évaluer ce que les gens pensent de choses comme les produits et les entreprises (analyse des sentiments).

Le document de recherche dit :

Cet article décrit un modèle indépendant du langage pour l’analyse de sentiment multi-classe utilisant une architecture de réseau neuronal simple… L’avantage du modèle proposé est qu’il n’a pas les caractéristiques suivantes
s’appuient sur des caractéristiques propres à la langue comme les ontologies, les dictionnaires ou le prétraitement morphologique ou syntaxique.

Les médias sociaux ont révolutionné le Web en transformant les utilisateurs, qui n’étaient plus des destinataires passifs de l’information, en contributeurs et influenceurs. Cela a un impact direct sur les entreprises, les produits et la gouvernance.

Beaucoup de messages des utilisateurs sont des opinions sur des produits et des marques qui ont un impact sur les décisions d’achat d’autres consommateurs et affectent la fiabilité de la marque. Les critiques négatives diffusées en ligne peuvent causer des problèmes critiques pour la réputation, le pouvoir concurrentiel et les chances de survie de toute entreprise.

Rien ne prouve que Google utilise un tel système pour analyser les sentiments. Cependant, le fait que ce document de recherche existe constitue une bonne preuve de concept que ce type d’analyse des sentiments a fait l’objet de recherches et est théoriquement possible. Plus intéressant encore, il s’appuie sur les médias sociaux comme Twitter et il n’y a aucune mention de Wikipédia du tout.

Plats à emporter : Aucune preuve que Google utilise Wikipédia pour juger les sites Web

  1. Il n’existe aucun brevet ou document de recherche de Google qui énonce un processus d’utilisation de Wikipedia pour extraire des informations sur les sentiments à des fins de classement.
  2. Il est incorrect d’utiliser les directives des Quality Raters Guides sur la façon de faire des recherches sur un site Web comme preuve que l’algorithme de Google fait la même chose.

Article sur le site Mercola.com : https://articles.mercola.com/sites/articles/archive/2019/06/24/google-latest-algorithm-update-buries-mercola.aspx

Traduction de l’article : https://www.searchenginejournal.com/google-june-update-wikipedia/313731/

Charles

Rédacteur sur différents médias, dont SEOTECH