Google News : L'algorithme "Quality" a pénalisé les petits sites d'actualité


  • FrançaisFrançais



  • google-news-quality-update

    L’algorithme « Quality » a pénalisé de nombreux petits éditeurs dans Google News ou comment faire le pire en essayant d’arranger les choses.


     

    Il y a quelques jours, Google a confirmé qu’il a déployé un nouvel algorithme que les éditeurs ont surnommé « Quality ». C’est une mise à jour qui concerne le principal algorithme de Google et il prétend favoriser la qualité du contenu même si cela fait des années qu’on ignore les véritables critères de cette prétendue qualité.

    Sur le web standard, les impacts ont été plus ou moins fluctuants avec des sites proposant des articles How to qui ont été le plus pénalisés. Etant donné que ces sites créent une tonne de contenus en variant les titres pour surfer sur les tendances populaires, on peut imaginer que l’algorithme « Quality » les a descendu en flamme. On n’a rien contre parce que ce type de sites pourrissait vraiment les résultats.

    Mais il y a eu aussi un dommage collatéral dans Google News où des petits éditeurs ont été pénalisés. Ce n’est pas qu’ils créaient un mauvais contenu, mais il semble que Google ait privilégié l’approche du raser une forêt entière pour supprimer quelques arbres pourris.

    L’algorithme « Quality » s’inspire de Panda

    En premier lieu, je pense que Quality s’inspire de Panda puisque les 2 visent la qualité du contenu en priorité. Panda est un filtre à grande échelle tandis que Quality semble se concentrer sur certaines pratiques spécifiques des Spammeurs.

    Depuis de nombreuses années, Google donne une mauvaise note systématique aux nouveaux sites. Le fait est que les Spammeurs créent de nouveaux sites chaque mois avec des noms de domaine différents pour tenter de capturer le max de trafic. Et donc, Google va laisser du temps au nouveau site avant de lui donner un certain type de classement. C’est pourquoi Google recommande toujours d’attendre que l’analyse soit totalement complète sur un nouveau site avant d’envisager à une certaine pénalité. (Le fameux effet Sandbox).

    Les Spammeurs ont tenté de trouver de nouveaux moyens pour contourner ce garde-fou de Google et leur tâche était encore plus difficile avec l’arrivée de Panda. Mais les Spammeurs misent sur le volume d’un contenu automatique et de temps en temps, Google les affichait dans ses résultats ou plutôt certains passaient entre les mailles du filet.

    La première version de Panda a été très stricte et les versions qui ont suivis tentaient d’être modérés sur la sanction. Et les Spammeurs se sont engouffrés dans cette brèche et les sites de Spam ont de nouveau pullulés sur la toile. De nouveau, Google a dû modifier son algorithme pour proposer cette mise à jour « Quality », mais on dirait qu’il l’a aussi appliqué à Google News. Ce sont des observations personnelles, mais je pense que les algorithmes du Web standard ne sont pas appliqués à 100 % aux sites de Google News. Celui-ci possède son propre algorithme puisqu’il n’utilise que les sites qui sont acceptés. Et la preuve est que l’algorithme Mobile Friendly ne s’applique pas encore dans les sites de Google News.

    Les Spammeurs ont débarqués dans Google News

    Alors pourquoi Google a décidé de déployer l’algorithme  » Quality  » à la fois sur le web standard, mais également sur Google News ? Depuis l’année dernière, des sites de Spam ont débarqués dans Google News. Ce sont généralement des sites qui copient-collent le contenu appartenant à des médias reconnus et ils tentent de se classer le plus rapidement possible. Cela fait des mois que les utilisateurs anglophones se plaignent des sites poubelles qui polluent Google News. Il faut préciser que les effets étaient très visibles sur Google US, car Google France avait été plutôt bien épargné.

    On a des sites avec de l’extraction automatique de contenu, des sites qui proposent des traductions automatiques avec Google Translate. Déjà, on se demande comment ce type de site a pu être accepté par Google News, alors qu’en tant qu’éditeur, je sais à quel point c’est difficile. Mais le pire est que ces sites avec un contenu Spammy s’affichaient même dans la page d’accueil de Google News et ils étaient en bonne position dans les différentes sections de Google News. Et c’est là que Google s’est dit qu’il en avait marre de sanctionner individuellement les sites (puisqu’ils se débrouillaient pour réapparaître sous un nouveau nom) et qu’il a décidé de sévir avec la tronçonneuse.

    La logique débile de Google News avec l’algorithme « Quality »

    On a mentionné que Google considère automatiquement les nouveaux sites comme douteux. De ce fait, il a appliqué la même logique avec ce nouveau algorithme de Google News :

    Un petit site d’actualité peut contenir du spam = tous les petits sites d’actualité sont des Spams

    Et il ne pouvait pas faire autrement puisqu’il ne peut pas (ou ne veut pas) sanctionner individuellement les sites douteux. On sait que l’algorithme « Quality » renforce certains critères qui existent déjà dans Panda. Et je parie que l’un des critères qui a désormais le plus de poids est l’autorité du site.

    Dans un Hangout, John Mueller avait déclaré concernant Panda que Google utilise parfois un index global de sites avec d’excellents contenus comme des guides de départ. Et ensuite, ils l’utilisent comme des critères pour l’algorithme. L’index est juste une base de départ, mais cela suffit.

    Mais dans le cas de Google News, il semble que Google ait donné beaucoup plus de poids aux médias de masse en les utilisant comme son index. Il l’a fait en se basant sur la réputation du média, mais également son volume de publication. Il n’est pas rare qu’un gros média publie plus de 100 articles par jour. Mais c’est très con, car si le Spammeur ne fait que copier-coller le contenu, il peut atteindre le même volume d’articles.

    Je dirais que Google News a sélectionné certains médias de masse reconnu… par la masse et il a pénalisé les autres sans aucune distinction. Depuis quelques semaines, les petits éditeurs se plaignent qu’ils n’apparaissent jamais dans la section ou la page d’accueil de Google News. On a notamment un fil du forum de Google News qui explique ce problème.

    Les 3 manières d’être visible dans Google News

    Vous avez 3 manières d’être visible dans Google News :

    • Vous apparaissez dans la page d’accueil
    • Vous apparaissez dans les principales sections (Technologie, Sport, International, etc)
    • Vous apparaissez dans l’encadré Dans l’actualité selon une requête donnée

     

    Les petits éditeurs ont été pénalisés sur la page d’accueil et les principales sections. Ces 2 éléments sont ceux qui génèrent le plus de visites et Google a choisi de privilégier les médias de masse. J’ai trouvé un site appelé Databees qui compile la part des médias dans Google News à intervalles réguliers sur la page d’accueil et les principales sections du site.

    Section A La une (page d’accueil). Ces données sont sur les dernières 24 heures :

    • Lemonde
    • Lefigaro
    • Leparisien
    • Ouest-france
    • Liberation
    • Lepoint
    • Tf1
    • Tempsreel.nouvelobs.com
    • Lexpress

     

    Section Internationale

    • Lefigaro
    • Lemonde
    • Rfi
    • Ici.radio-canada
    • Tempsreel.nouvelobs.com
    • Francetvinfo
    • Lepoint
    • Lavenir
    • Romandie
    • Liberation

     

    Section France

    • Lci.tf1
    • Lemonde
    • Francetvinfo
    • Lefigaro
    • Ouest-france
    • Leparisien
    • Lepoint
    • Tempsreel.nouvelobs.com
    • Liberation
    • Europe1

     

    Section Economie

    • Lefigaro
    • Lesnewseco
    • Challenges
    • Lemonde
    • Latribune
    • Boursier
    • Lepoint
    • Boursorama
    • Lesechos
    • Liberation

     

    Section Science

    • Zdnet
    • Lesnewseco
    • 20minutes
    • Ouest-france
    • 24matins
    • Bfmtv
    • Cowcotland
    • Rts
    • Clubic
    • Cnetfrance

     

    Section Divertissement

    • Telerama
    • Allocine
    • Tempsreel.nouvelobs.com
    • Next.liberation
    • Lefigaro
    • Lepoint
    • Videos.leparisien
    • Rfi
    • Lexpress
    • Metronews

     

    Section Sport

    • Sports
    • Leparisien
    • 20minutes
    • Eurosport
    • Ouest-france
    • Sport
    • Franceinfo
    • Goal
    • Butfootballclub
    • Mercato.eurosport

     

    Section Santé

    • Pourquoidocteur
    • Francetvinfo
    • Sante.lefigaro
    • Lci.tf1
    • Lemonde
    • 5minutesatuer
    • Leparisien
    • Europe1
    • Lefigaro
    • Lesoir

     

    Je suis médusé ! A part quelques variations, ce sont les mêmes sites qui prédominent dans chaque section alors que la thématique est totalement différente. J’ajoute que je ne peux pas garantir la fiabilité des données du site Databees, mais il correspond avec mes propres observations sur Google News.

    Mais peut-être que ces gros médias apparaissent parce qu’ils sont des experts en technologie, en science, en sport, etc. J’ai regardé les articles de ces sites qui étaient affichés dans chaque section (le site permet ce découpage). J’ai pris la catégorie Science. Dans le cas de Zdnet, les articles sont plutôt cohérents avec la thématique puisque c’est un site spécialisé dans la technologie, mais il appartient aussi à un gros groupe de médias.

    Zdnet

    • « Vol » de documents via Google : la condamnation de Bluetouff
    • Test – Quel Samsung Galaxy S6 pour les pros ?
    • Mobile – Accord entre les opérateurs pour couvrir les zones

     

    Mais vérifions l’expertise de 20minutes :

    • Les immanquables du jour: Fait divers sordide, arnaque au Bon
    • Daesh s’empare de la notoire prison de Palmyre
    • La torture, une pratique courante en Ukraine selon Amnesty

     

    Non, c’est un mauvais exemple, on va prendre Ouest-France :

    • Téléphonie. Vers la fin des zones blanches en France
    • Équipe de France. Ntep convoqué par Deschamps
    • Présidence de la Fifa. Luis Figo se retire et soutient le Prince Ali

     

    Donc selon Ouest-France, je dirais que Deschamps, le plus grand scientifique de France va mener l’équipe des scientifiques de France au tournoi du CNRS

    Pour 5minutesàtuer dans la catégorie Science :

    • Le café réduit les troubles de l’érection !
    • Un exercice de math pour élèves de CE2 fait le buzz !

     

    Bon ok, je laisse tomber. Evidemment, il y a des articles scientifiques plutôt pertinents et je n’ai pris que les pires exemples, mais comment des contenus aussi médiocres peuvent faire la une d’une section aussi importante que celle de Science ? On voit également que les gros médias ne cessent de décliner leurs sites principaux avec des sous-domaines pour multiplier le nombre de vues en publiant le même contenu de manière croisée. Et un petit éditeur ne peut pas concurrencer les gros médias sur le volume de contenu. Non pas qu’il ne pourrait pas, mais Google l’impose à un cercle vicieux. Le problème est que si Google voit beaucoup d’articles qui proviennent d’un petit éditeur, alors il aura tendance à le marquer comme un Spammeur tandis que ce sera un avantage pour le média de masse.

    En renforçant la présence des gros médias et en sanctionnant les petits éditeurs, Google News a fait un très, très mauvais choix. Et ce n’est pas un parti pris provenant d’un éditeur, mais je déteste voir ce type de news lorsque je suis un utilisateur de Google News.

    La logique de Google News parait pertinente. Il se dit que si on supprime la visibilité des sites de spam, alors ces sites ne rapporteront plus de revenus et ils disparaîtront d’eux-même. Mais c’est con, mais tellement con. Les petits éditeurs font également face à des problèmes financiers. Dans le forum de Google News, j’ai vu un éditeur qui disait qu’il avait une équipe de 4 personnes, mais que la pénalisation de son site par Google News allait le forcer à fermer.

    Et je ne parle même pas de la duplication de contenu, car évidemment, les gros médias possèdent des journalistes qui se partagent les mêmes contenus et ça tourne en boucle. Les observateurs ont également remarqué que les articles restent plus longtemps dans Google News ce qui supprime le critère de la fraicheur qui était l’un des principaux par Google News. On se retrouve avec un algorithme « Quality » qui a crée plus de problèmes qu’il n’en a résolu.

    Mais Google News n’a pas pénalisé totalement les petits éditeurs, car ils ont une chance d’apparaître dans l’encadré Dans l’actualité selon une requête donnée. Mais cela reste aléatoire, car le petit site est rapidement submergé par les gros médias. Google News propose aussi le concept de Cluster qui sont des articles groupés sur la même thématique, mais là encore, on voit que l’algorithme « Quality » est appliqué à pleine puissance.

    Déjà que les gros médias faisaient de la merde et maintenant Google les récompense pour le faire.

     

    N'oubliez pas de voter pour cet article !
    1 étoile2 étoiles3 étoiles4 étoiles5 étoiles (No Ratings Yet)
    Loading...

    Houssen Moshinaly

    Rédacteur en chef d'Actualité Houssenia Writing. Rédacteur web depuis 2009 et vulgarisateur scientifique.

    Je m'intéresse à tous les sujets scientifiques allant de l'Archéologie à la Zoologie. Je ne suis pas un expert, mais j'essaie d'apporter mes avis éclairés sur de nombreux sujets scientifiques.

    Pour me contacter personnellement :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.