Le mot de Kat : Les résultats du moteur de recherche Google sont spammés et de mauvaise qualité selon une étude de ... chercheurs allemands. Google répond : On peut rien y faire, c'est la faute au SEO dopé à l'IA qui pourrit notre moteur.
Par Meera Navlakha le 18 janvier 2024 (mis à jour pour intégrer la réponse de Google)
Vous n'êtes pas le seul, la recherche sur Google a vraiment empiré Une nouvelle étude menée par des chercheurs allemands a révélé que la recherche sur Google est infestée de spam SEO. Votre expérience de la recherche sur Google a-t-elle changé pour le pire ? Vous n'êtes peut-être pas le seul.
Cette révélation provient d'une nouvelle étude menée par des chercheurs allemands de l'université de Leipzig, de l'université Bauhaus de Weimar et du Center for Scalable Data Analytics and Artificial Intelligence (Centre pour l'analyse des données évolutives et l'intelligence artificielle). Les chercheurs ont posé la question "Google devient-il pire ?" en examinant 7 392 requêtes d'évaluation de produits sur Google, Bing et DuckDuckGo pendant un an.
Les chercheurs se sont appuyés sur des rapports indiquant qu'"un torrent de contenu de faible qualité, en particulier pour la recherche de produits, continue de noyer tout type d'information utile dans les résultats de recherche". Un nombre important de résultats trouvés en réponse à des requêtes liées à des produits étaient des "spams de référencement de produits".
La recherche a montré que les sites de spam sont très répandus, apparaissant en haut des classements de Google dans ce qui est une "bataille constante" entre les sites et le moteur de recherche. En d'autres termes, écrivent-ils, "les moteurs de recherche semblent perdre le jeu du chat et de la souris qu'est le spam SEO".
"Le référencement est une bataille constante et nous observons des schémas répétés d'entrée et de sortie de spams dans les résultats, alors que les moteurs de recherche et les ingénieurs en référencement ajustent leurs paramètres à tour de rôle", peut-on lire dans le rapport. Bien que Google, Bing et DuckDuckGo éliminent les spams, les chercheurs affirment que cela n'a qu'un "effet positif temporaire".
Un porte-parole de Google a déclaré à Mashable que l'étude "ne reflète pas la qualité et l'utilité globales de la recherche". Il a souligné que l'étude ne portait que sur un ensemble restreint de requêtes, à savoir la recherche de produits.
"Cette étude ne s'intéresse qu'au contenu des critiques de produits et ne reflète pas la qualité et l'utilité globales de la recherche pour les milliards de requêtes que nous recevons chaque jour. Nous avons apporté des améliorations spécifiques pour remédier à ces problèmes, et l'étude elle-même souligne que Google s'est amélioré au cours de l'année écoulée et que ses performances sont supérieures à celles des autres moteurs de recherche. De manière plus générale, de nombreux tiers ont mesuré les résultats des moteurs de recherche pour d'autres types de requêtes et ont constaté que Google était d'une qualité nettement supérieure aux autres", a déclaré le porte-parole.
L'étude en question a montré que les résultats de Google se sont améliorés "dans une certaine mesure" entre le début et la fin de l'expérience des chercheurs. Néanmoins, ils ont constaté "une tendance générale à la baisse de la qualité des textes dans les trois moteurs de recherche". Avec la présence de spam généré par l'IA, la situation ne peut que s'aggraver, prévient l'étude.
"Nous concluons que le spam contradictoire dynamique sous la forme d'un contenu commercial de faible qualité produit en masse mérite plus d'attention", écrivent les chercheurs.
Comme le rapporte 404Media, d'autres chercheurs ont remarqué que Google était inondé de spam. Search Engine Journal, par exemple, a déclaré qu'en décembre 2023, Google a été submergé par une attaque massive de spam qui a duré plusieurs jours.
Find out what noreferrer, noopener, nofollow attributes are and if they affect your SEO performance
Are noreferrer and noopener attributes affecting my backlinks or outgoing links in terms of SEO?
Short answer: No
Noreferrer, noopener, and nofollow are not related to each other. Each attribute has its own purpose. Let’s look at what each is used for.
Noreferrer is related to analytics and tracking. The referrer value shows the previous page where a user came from. By using the noreferrer attribute on a link, you are preventing other pages from seeing that traffic came from a click on your link.
Example:
<a href="https://www.website.com" rel="noreferrer">Link to yoursite.com</a>
Impact on SEO: 0, but may impact analytics and tracking.
Noopener is related to security. It closes a browser security issue called reverse tab nabbing which lets an attacker have partial access to the previous page and is typically used when a link is set to open in a new tab with target="_blank".
Note: With the release of Chrome 88, all links with target="_blank" will be treated as noopener.
Example:
<a href="https://www.website.com" target="_blank" rel="noopener">Link to yoursite.com</a>
Impact on SEO: 0
The nofollow attribute was used in the past to tell search engines to simply ignore a link. Google would not crawl these links and did not pass value through them. Their treatment of nofollow links changed in 2020 and now it’s more complicated. They treat nofollow as a hint, which means they can choose to crawl and pass value through them, or not.
Impact on SEO: it depends on whether they decide the links are valuable or not. There’s no way to determine which links they use and which they do not.
Example:
<a href="https://www.website.com" rel="nofollow">Link to yoursite.com</a>
You can get more useful info about nofollow links from here:
https://ahrefs.com/blog/nofollow-links/
https://ahrefs.com/blog/nofollow-ugc-sponsored/
Entre 1998 et 2003, rechercher quelque chose sur Google était magique. Je me souviens avoir saisi une vague notion comme "lait maternel du pétrole" et avoir été dirigé vers une interview de Thomas Gold, un astrophysicien qui postulait que les gisements d'hydrocarbures se remplissaient d'eux-mêmes en raison de la pression géologique.
Aujourd'hui, si vous cherchez quelque chose de technique, de spécifique, d'académique ou de généralement non commercial, bonne chance. Le meilleur système de recherche d'informations au monde s'est transformé en quelque chose qui rappelle le Digg de 2006 : Un indice de popularité contrôlé par un petit nombre d'acteurs motivés par le commerce. Ils se font appeler "SEOs".
Les spécialistes de l'optimisation technique des moteurs de recherche ont un laissez-passer : Ils rendent généralement le web plus rapide, plus sûr et plus accessible. Les "Black hat" SEOs sont des méchants évidents. Ils améliorent leur propre classement sur le web en enfreignant la loi (par exemple, en piratant un site web pour ajouter des liens vers le leur). Mais les "black hats" sont les petits criminels du monde du référencement. Ce sont les SEO "à chapeau blanc", les supposés gentils, qui sont les loups déguisés en moutons.
Ces spécialistes du marketing web ont une stratégie simple : étouffer la concurrence en concentrant l'autorité. Ils marchent en arborant une bannière de légitimité et d'autosatisfaction, et comme un régime totalitaire, ils pensent que la fin justifie les moyens. Voici quelques-unes des tactiques qu'ils utilisent.
S'il vous est déjà arrivé de relire un article et de jurer que le titre, les hyperliens et les en-têtes avaient été modifiés, vous ne l'imaginez pas. Les spécialistes du référencement "optimisent" les anciens articles pour les rendre plus commercialisables (et pour diriger les visiteurs vers des contenus plus récents et plus commerciaux). Lorsque je regarde des articles que j'ai écrits il y a dix ans, je constate qu'ils ont été mis à jour avec du texte que je n'ai pas écrit et qui porte des significations que je ne voulais pas.
"L'élagage du contenu" est une tactique de référencement efficace sur les sites Web importants et établis. Au lieu d'archiver le vieux contenu ayant une signification historique, de nombreux sites Web le suppriment de leurs serveurs et renvoient un code d'état 410. Disparu. L'objectif est d'optimiser le "budget d'exploration", afin que Google se concentre sur le contenu qui compte aujourd'hui. Le résultat est un web sans mémoire institutionnelle ni responsabilité.
Montrez-moi une salle de rédaction moderne et je vous montrerai un stratège de contenu que les rédacteurs sont censés consulter. Mais lorsque les journalistes se sentent contraints d'écrire sur des sujets qu'ils ne maîtrisent pas, ou lorsqu'ils sont obligés de formuler les choses d'une manière spécifique, les "meilleures pratiques de référencement" commencent à ressembler à de la propagande. C'est l'effet de l'information par câble, où un stratège en coulisse édite le script et pousse chaque tendance comme une "nouvelle de dernière minute".
Donner l'illusion du choix
Une poignée de sociétés d'édition possèdent des centaines de sites web de médias qui reçoivent collectivement des milliards de visites de moteurs de recherche chaque année. Faites une recherche sur "meilleur smartphone" et vous verrez peut-être des résultats de sites Web comme TechRadar, Android Central, T3, Tom's Guide, Anandtech, iMore ou Top Ten Reviews. Peu importe le site pour lequel vous votez avec votre clic, le scrutin est pipé : Tous ces sites sont détenus par une seule et même entreprise.
Les liens sont la monnaie du web. Sans eux, les moteurs de recherche ne pourraient pas juger de la valeur relative d'une page par rapport à une autre. Malheureusement, de nombreux grands sites Web thésaurisent leur capital de liens en refusant de créer des liens vers des sites Web externes ou en utilisant un attribut rel="nofollow" sur chaque lien externe (c'est-à-dire en demandant aux moteurs de recherche d'ignorer ces liens). L'ensemble du web s'en trouve appauvri.
Le référencement est un jeu à somme nulle qui compte un perdant pour chaque gagnant. Mais nous sommes tous perdants lorsque le référencement encourage le gaslighting, le link rot, la conformité, le monopole et la subversion. Je me souviens quand il était facile de trouver la logique, les faits et la rationalité sur le web. Puis, quelqu'un les a optimisés.
Traduit avec www.DeepL.com/Translator (version gratuite)
Peut-être vous-êtes-vous déjà demandés si l’utilisation d’une police web personnalisée ou une Google Font, avait une incidence négative comme positive votre visibilité organique. Pour lever le voile sur ce sujet, nous avons décidé de nous replonger dans les déclarations passées de notre ami John Mueller, Webmaster Trends Analyst chez Google.
En d’autres mots, il s’agit de savoir si Google prenait en compte le choix de la police web pour juger de la qualité de votre contenu, par exemple si une police personnalisée conduisait Google à considérer le contenu comme moins pertinent que des qu’un même contenu utilisant d’autres types de web fonts.
Cette question avait été posée à John Mueller en 2017 lors de la vidéo Webmaster Office Hours ci-dessous.
Le cadre de chez Google affirme que le choix de la police d’écriture n’a pas d’impact sur votre référencement. Du moment que Google peut explorer la page et voir le contenu, l’analyse fonctionnera normalement.
La seule situation où John indique que cela pourrait être un peu délicat est si vous utilisez des images au lieu de texte sur une page. Ok, Google fait de l’OCR (Optical Character Recognition : processus de convertir une image en texte) sur les images, mais cela reste un procédé nouveau qui n’est pas pleinement sollicité pour l’indexation des pages web (cela exige beaucoup trop de ressources).
Le même sujet a été abordé sur Twitter en 2020. Toujours auprès de John Mueller. Cette fois-ci, la question initiale était de savoir si le choix de sa police avait un impact sur les performances de vitesse du site, puis de savoir s’il y avait des polices recommandées par Google.
1 - Tous les éléments qui composent une page web, comme la police, ont un impact sur la vitesse de chargement.
2 - Le choix de la police n’a pas d’importance pour le SEO.
Ces deux réponses sont contradictoires puisque le temps de chargement est considéré comme un facteur de ranking SEO. Ainsi, si votre police web impacte le temps de chargement, elle influence indirectement votre SEO.
Bon ok, ce n’est pas nouveau que la police impacte le temps de chargement, c’était d’ailleurs un point majeur soulevé dans notre article sur l’optimisation de votre vitesse de site sous WordPress.
Par conséquent, si vous utilisez une police personnalisée parce que vous voulez mettre en avant votre branding, faites attention à ce que cette dernière n’impacte pas trop vos performances. Surtout avec l’introduction des Core Web Vitals en tant que facteurs de positionnement SEO.
Évidemment, si vous optez pour des polices web personnalisées totalement illisibles, cela aura un réel impact sur la compréhension qu’auront les visiteurs du contenu de votre site. Veuillez donc à ne pas trop en faire et à trouver l’équilibre entre branding et expérience de navigation.
Mais améliorer l’expérience utilisateur signifie aussi que chaque milliseconde compte. De ce fait, il existe de nombreuses façons d’améliorer la vitesse, comme l’optimisation des images et des polices de caractères web.
Commençons par une note positive : il est facile d’adopter une belle typographie gratuitement pour votre site comme vous pouvez en trouver dans les magazines papier. Des sociétés comme Fontawesome, Google et Adobe proposent énormément de polices gratuites qui vous permettront de construire votre site selon votre image. Cependant, un grand nombre auront impact drastique sur la vitesse de vos pages… pouvant vous faire perdre de précieuses secondes et chuter votre score sur PageSpeed Insights.
Voyons donc ensemble comment ces satanés polices web peuvent autant impacter votre temps de chargement en se focalisant sur les polices Google.
Les Google Fonts peuvent représenter plusieurs problèmes pour vos performances de site. Mais pas que…
Lorsque votre site est en train de charger sur un navigateur, vous avez peut-être remarqué des messages dans la barre d’état tels que « connecting to fonts.gstatic.com » ou « waiting for fonts.googleapis.com ». Il s’agit du navigateur qui télécharge la police sur laquelle votre site repose à partir de serveurs qui hébergent ces polices.
Pour analyser ce processus de plus près, il suffit de se rendre sur des sites de mesure de vitesse de page tels que GTmetrix ou Pingdom et de tester votre URL. Il y a de fortes chances que vous soyez surpris par le nombre de requêtes que votre site nécessite pour télécharger des fichiers de polices. Mais… attendez deux p’tites secondes… ces polices ne sont-elles pas transférées à partir d’un Google Cloud super méga rapide ?!!
Oui, les polices web sont fournies par le CDN de Google. Google a optimisé et continue d’optimiser ces fichiers pour un transfert plus rapide. Néanmoins, il s’agit de demandes supplémentaires de données supplémentaires dont la plupart des sites et blogs peuvent se passer. Les néo webmasters commencent souvent avec un hébergement mutualisé chez OVH, et souvent avec un ensemble de plugins redondants qui alourdissent les performances globales de leur site. Dans la plupart des cas, les fichiers de polices web ne font que s’ajouter à la masse.
La taille typique d’un fichier de police est de 35-50ko. Cependant, selon la façon dont votre site est développé, il peut nécessiter plusieurs fichiers de polices ou parfois, même un seul fichier de police peut atteindre un poids de quelques mégaoctets. Cela s’explique par le fait qu’un site peut utiliser plus d’une langue, nécessiter plusieurs formats de fichiers ou devoir être disponible en mode hors ligne. Parfois, les thèmes et les plugins qui utilisent les Google Web Fonts font plusieurs demandes pour la même ressource. Pire encore, votre site peut obliger un visiteur à télécharger des éléments qui ne sont jamais utilisés. La plupart du temps, les visiteurs de votre site peuvent se passer de tout cela.
Du coup, une question légitime que l’on pourrait se poser serait de savoir si la mise en cache avait un impact ? Un navigateur ne va-t-il pas stocker ces polices pour une utilisation ultérieure ? La réponse courte : pas tout.
La mise en cache du navigateur ne permet d’accélérer que les visites répétées, et non les premières visites. Pour les visiteurs réguliers, le webmaster du site a le pouvoir de définir la durée pendant laquelle le navigateur doit mettre en cache une ressource localement. Vous pouvez fixer une date d’expiration lointaine (d’un mois ou plus) pour les ressources statiques telles que les images, etc… mais pas pour tout ! En effet, pour les ressources fournies par des tiers, comme Facebook ou Google, le propriétaire du site n’a aucun contrôle. Leur date d’expiration est fixée par les sites qui les fournissent.
Alors que les fichiers de polices de base peuvent avoir une date d’expiration lointaine, les ressources de style liées aux polices ont une date d’expiration de seulement 24h00 en général. Ainsi, lorsqu’un fichier de police a été modifié et qu’un abonné email clique sur le lien d’une newsletter pour lire votre dernier article, ce visiteur fidèle devra télécharger à nouveau toute la police web requise. Inutile de dire que si votre abonné dispose d’une connexion internet pourrie, vous ne l’aidez pas.
Alors, pourquoi ne pas simplement fournir les polices à partir de votre site et de contrôler l’expiration du cache du navigateur ?
Les polices web étant OpenSource, vous pouvez les héberger localement sur votre site, réduire le nombre de requêtes HTTP et contrôler l’expiration du cache. Il existe des plugins gratuits pour vous aider à y parvenir. Toutefois, Google déconseille cette pratique. Cela m’amène à poser la question suivante : pourquoi Google adopterait-il une pratique aussi gourmande en termes de ressources, puis déconseillerait dans le même temps une solution permettant de consommer moins et d’optimiser les performances ?
La raison officielle invoquée par la firme de Mountain View est qu’il héberge et fournit les polices afin que vous ayez les plus récentes et les plus optimisées à disposition pour votre site web. Cependant, la vérité se cache peut-être ailleurs…
Quelques pays, comme la Chine, bloquent l’accès à aux serveurs Google, ce qui signifie que les sites utilisant les Google Fonts n’auront pas la même apparence partout dans le monde. De nombreuses autres personnes ont fait part de leurs inquiétudes quant à la confidentialité des données liées aux polices Google, en particulier dans le sillage de la mise en œuvre de la politique européenne RGPD. En effet, en fournissant la police de votre site, Google a un accès direct à ses entrailles. Pour vous faire une idée, jetez un œil à la quantité gargantuesque de données collectées par Google à travers ses polices en consultant les statistiques du site Google Font Analytics.
Les polices web représentent un pilier essentiel pour le secteur des éditeurs. La capture à grande échelle des données d’utilisation de ses polices peut potentiellement aider Google à créer un modèle freemium classant les polices gratuites et premium afin de convaincre les navigateurs (tels que Firefox, Safari ou Internet Explorer) d’inclure certaines de ces polices en tant qu’option native dans leurs futures versions. Autre possibilité, l’API Google Fonts pourrait suivre le chemin de l’API de Google Maps, qui exige désormais des propriétaires de sites qu’ils fournissent des informations de carte bancaire pour pouvoir l’utiliser.
Qu’est-ce qu’une image ?
Une image est une représentation visuelle de quelque chose, ça pourrait être une photographie, un graphique, un dessin…
Il existe plusieurs formats d’images utilisés sur les sites Web : JPEG (extension .jpg), GIF (extension .gif), PNG (extension .png)
Dans l’optimisation de votre site, ne négligez pas la balise alt et le poids des images qui peuvent contribuer au référencement de vos pages. Pour le moment, les moteurs de recherche n’arrivent pas encore à interpréter le contenu visuel d’une image, ce qui ne saurait tarder. En attendant il existe des techniques comme par exemple les balises alt pour indiquer aux moteurs de recherche ce que contient une image.
Dans ce dossier nous verrons présenterons ces techniques plus en détail.
Parce que lorsque vous utilisez des images dans vos pages, l’espace occupé par ces dernières, c’est de l’espace en moins pour le contenu texte qui lui est lu et interprété par les moteurs de recherche.
Pour continuer à utiliser des images et donc améliorer l’aspect graphique de votre site tout en optimisant le référencement de votre site voici quelques conseils...
Comment optimiser les images ?
Si une image met trop de temps à charger, Google ou les autres moteurs de recherche ne scanneront pas votre page et le visiteur quittera votre site sans attendre la fin du chargement. Dès qu'elle dépasse 200 Ko, une image peut être considérée comme lourde. Yakaferci vous aidera à détecter ces images problématiques.
Par exemple, si votre image représente un schéma sur comment référencer un site, nommez la ainsi : « schema-referencement-site.jpg ». Vous indiquez ainsi aux moteurs de recherche qui viennent pour le crawl de votre site que l’image que vous utilisez pour illustrer la page représente un schéma sur comment référencer un site. Il interprètera avec plus de précision le contenu de la page. Si vous souhaitez utiliser une expression pour nommer une image, préférez alors comme séparateur de mots, les tirets ( - ) à l'underscore ( _ ) : les moteurs de recherche ne considèrent pas l'underscore comme un séparateur. De plus, nommer l'image sans majuscule et sans caractères accentués. En résumé pour référencer votre image : Préférez ce nom : referencer-image.gif plutôt que celui-ci : Référencer_image.gif
La balise « ALT », en complément du nom de l’image, permet d’associer un mot clés ou une expression à une image. Le mot clé placé dans la balise ALT remplacera l’image si le navigateur a des difficultés à afficher l’image en question. Les mots contenus dans les balises « ALT » contribuent également à améliorer le référencement de votre site puisqu'elle permet d’employer des mots clés supplémentaires qui seront lus par les moteurs.
La balise alt ou l'attribut alt (alternate text) ne s'applique qu'à la seule balise <img>, permettant ainsi un affichage alternatif ( en remplacement de l'image ) pour les navigateurs qui ne supporteraient pas les graphiques.
Le message texte défini avec la balise alt apparaîtra également pendant le téléchargement de la page et avant l'affichage de l'image. N'oublions pas aussi que certains utilisateurs à connexion Internet bas débit ont choisi de désactiver l'affichage des images !
L'attribut title est un attribut générique qui s'applique à pratiquement toutes les balises HTML et dont le rôle est d'apporter des informations supplémentaires ou un commentaire sur un élément spécifique d'une page Web (élément qui peut être un mot, une phrase, un paragraphe, un élément multimédia, un objet, etc...)
Toujours dans le but d’indiquer aux moteurs ce que vos images représentent, faites précéder l'image d'un titre situé dans une balise de niveau 3 ou supérieur (h3 ou h2 ou h1) Le titre doit bien sur être en rapport avec l’image et surtout contenir les principaux mots clés avec lesquels vous souhaitez vous faire référencer.
Un en-tête en image (header)
Très souvent des sites sont conçus avec un en-tête en image. Il est courant de voir le logo de la société occuper la quasi largeur d’une page.
A éviter ! La partie supérieure d'une page (le header) est une des zones les plus importantes de votre site où vous devriez insérer vos mots-clés principaux pour optimiser votre SEO.
Si vous utilisez une image occupant tout l’espace, vous aurez gâché cet emplacement puisque les moteurs de recherche ne savent pas encore lire les contenus graphiques. Evitez également les images avec du texte. C’est certainement plus attrayant d’un point de vue visuelle mais pas d’un point de vue référencement (SEO) puisque ce texte ne sera pas indexé par les moteurs.
Vous pouvez bien sur utiliser votre logo en employant une approche « hybride » : Placez votre logo sur toutes vos pages mais veillez à ce qu’il n’occupe pas toute la largeur. La place restant dans l’en-tête devrait être optimisé avec du texte.
Des éléments graphiques dans le menu de navigation
La problématique est la même que dans le cas précédent avec les textes dans sur les images. Tous les liens internes de votre site devraient contenir des mots-clés, qui donneront un avantage supplémentaire dans le référencement de votre site. Si pour des raisons d’esthétisme vous avez employé des éléments graphiques pour votre menu, les moteurs de recherche ne pourront pas indexer le texte des liens. Evitez si possible l’utilisation d’un menu graphique, dans le cas contraire spécifiez au moins les balises ALT pour toutes les images.
Note : le site yakaferci.com qui publiait cet article n'est plus en ligne. Le lien sous le titre de cette page mène à la "photo" de la page originale hébergée sur Wayback Machine.