Google : les textes par IA seront désormais sanctionnés

Google prend désormais en compte l’utilisation de l’IA dans son classement des sites. Certaines pratiques pourraient entraîner de lourdes pénalités.

La question du positionnement de Google face aux textes générés par l’IA interroge le monde du SEO depuis la fin de l’année 2022. Jusqu’à présent, le discours de la firme était toujours le même : que le texte soit généré ou non grâce à l’IA, c’est la qualité du contenu qui compte, en particulier le respect des critères E-E-A-T (Expérience, Expertise, Autorité et Fiabilité). Mais le moteur de recherche semble avoir changé son fusil d’épaule en ce début d’année.

Dans le cadre d’une intervention au Search Central Live Madrid, repérée par la spécialiste SEO Aleyda Solís, le responsable des relations avec Google Search, John Mueller, a mis en lumière la nouveauté : « La note la plus basse s’applique si tout ou presque tout le contenu principal de la page (y compris le texte, les images, l’audio, les vidéos, etc.) est copié, reformulé, intégré, généré automatiquement ou par une IA, ou repris d’autres sources avec peu d’effort, peu ou pas d’originalité, et peu ou aucune valeur ajoutée pour les visiteurs du site. » Cette directive se détourne quelque peu du discours tenu jusqu’ici par Google, qui affirmait que l’usage de l’IA n’était pas pris en compte dans les classements.

Le document Search Quality Evaluator Guidelines de Google, dans sa version du 23 janvier 2025, mentionne également cette orientation. Il y est écrit que « le contenu provenant d’une seule page ou de nombreux sites web, résumé, reformulé ou paraphrasé par des personnes ou des outils d’IA générative » est désormais considéré comme « du contenu copié ou paraphrasé ». Mais la démarche de Google se veut tout de même équilibrée. Le document précise : « L’utilisation seule d’outils d’IA générative ne détermine ni le niveau d’effort ni l’évaluation de la qualité de la page. Les outils d’IA générative peuvent être utilisés aussi bien pour créer du contenu de haute qualité que de faible qualité. »

Comment Google détecte-t-il les textes générés par IA

Comment Google peut-il détecter qu’un texte est généré par l’intelligence artificielle, alors même qu’aucun outil de détection n’a montré de résultats 100 % fiables à ce jour ? Dans son document, le moteur de recherche partage quelques pistes. Les sites affichant les caractéristiques suivantes sont mentionnés :

  • Des contradictions entre le contenu et les mentions légales : par exemple, une page peut se présenter comme un guide pour les parents, alors que les conditions d’utilisation du site précisent qu’il s’agit d’un projet destiné aux passionnés d’IA.
  • Un manque de transparence sur l’origine du contenu : certains sites indiquent que des articles sont générés (ou partiellement générés) par IA, sans spécifier lesquels. Ce flou rend l’ensemble des contenus moins fiables aux yeux de Google.
  • Une finalité déclarée comme expérimentale : lorsqu’un site précise que son contenu a été publié uniquement à des fins de recherche ou de démonstration, cela remet en question sa valeur pour un public plus large. Il en va de même pour les sites qui admettent que les informations peuvent contenir des erreurs ou ne pas être à jour.
  • Des auteurs fictifs ou trompeurs : certains sites utilisent des profils inventés ou générés par IA (photos, biographies, identités) pour faire croire que les contenus sont écrits par de vraies personnes. Cette pratique peut être perçue comme manipulatrice.
  • Des indices textuels révélateurs d’un contenu généré automatiquement : certaines pages contiennent des phrases caractéristiques d’un texte rédigé par une IA, comme « En tant que modèle de langage… » ou des références à des dates limites d’accès aux données (typiquement : les données limitées à septembre 2021). Cela indique une production automatisée avec peu, voire aucune, intervention humaine.

Prise en compte de l’IA par Google : quelles conséquences pour les sites ?

Google ne s’attaque pas à l’utilisation de l’IA en soi, mais reconnaît désormais que les outils d’IA générative peuvent aider à produire un contenu pauvre. Le Search Quality Evaluator Guidelines précise ainsi qu’est spécifiquement pénalisée « l’utilisation des outils automatisés (IA générative ou autres) pour produire, avec peu d’effort, un grand nombre de pages qui apportent peu ou pas de valeur ajoutée aux visiteurs, comparé à d’autres contenus disponibles en ligne sur le même sujet ».

Le moteur de recherche semble donc s’attaquer aux sites entièrement, ou en grande partie, conçus par l’intelligence artificielle et dont les contenus n’ont pas vocation à apporter une réelle plus-value pour le lecteur. Les critères de pénalisation intégrés semblent même indiquer que seuls les usages les plus grossiers, qui n’intègrent presque aucune forme d’intervention humaine, seront désavantagés. Une IA utilisée pour produire un texte utile ne devrait donc faire l’objet d’aucune sanction, pour le moment.

Source: BDM

Total
0
Shares
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Previous Post

ChatGPT: pour la première fois, Sam Altman évoque un partage de revenus avec les artistes

Next Post

TikTok intègre les avis client à sa plateforme pour concurrencer Google

Related Posts