Tout ce que nous savons sur le contenu de l'IA et le référencement (plus ce que les experts spéculent)

Publié: 2023-02-03

Je vais passer en revue tout ce que nous savons pour savoir si le contenu de l'IA peut et doit être utilisé pour le référencement, ainsi que les avantages, les inconvénients et les risques associés.

Préparez-vous à un coup de fouet extrême.

Note rapide (importante) pour être clair sur ce dont je parle exactement : les référenceurs et les spécialistes du marketing de contenu utilisent des outils alimentés par l'IA pour la recherche SEO depuis des années (pensez à Surfer, Clearscope, MarketMuse, et al). Ce n'est pas ce que je veux dire. Je fais spécifiquement référence à l'utilisation d'un outil LLM alimenté par l'IA comme OpenAI's GPT-3, ChatGPT ou Jasper/n'importe lequel des autres outils innombrables utilisant l'API d'OpenAI pour écrire du contenu qui a une intention SEO derrière lui - produisant des articles complets, des paragraphes, des pages de destination , etc. que vous avez l'intention de classer sur Google. Il existe d'autres cas d'utilisation pour ces LLM (rédaction de titres/brainstorming, rédaction de méta-descriptions, etc.), mais ici, je parle de l'écriture du contenu lui-même à l'aide de l'IA.

Chose que nous savons #1 : nous sommes dans une période d'extrême incertitude

Quiconque vous dit le contraire ment, est extrêmement naïf ou arrogant au point que vous devriez vous enfuir.

Il n'y a aucune personne non sous Google NDA qui sait comment Google réagira au contenu de l'IA à l'avenir. Google lui-même n'a probablement pas décidé et fera très certainement évoluer sa réflexion au fil du temps.

Qu'est-ce que cela signifie pour vous

Bien que tout référencement regorge de "ça dépend" et de meilleures pratiques qui devraient vraiment être testées, ce niveau d'incertitude autour de l'IA = risque sérieux. Si Google décide de supprimer le contenu de l'IA, il pourrait le faire de différentes manières :

  1. similaire à la façon dont ils ont déclaré qu'ils commençaient à gérer les liens de spam : dévalorisez tout contenu individuel écrit par l'IA, ou
  2. les sites Web avec du contenu IA (en particulier beaucoup) pourraient recevoir une pénalité à l'échelle du site et disparaître de la face de la planète Google.

Donc, oui, dans le pire des cas, chaque élément de contenu d'IA que vous publiez revient à planter une bombe à retardement avec un compte à rebours cassé sur votre site Web.

Chose que nous savons #2 : Google a déjà pénalisé les sites Web avec de grandes quantités de contenu d'IA.

Les futures pénalités théoriques de Google décrites ci-dessus ne sont pas toutes théoriques. Nous avons déjà des exemples de sites Web avec des sanctions complètes à l'échelle du site. Voici un graphique du trafic de recherche d'un de ces sites :

via Sistrix via Kevin Indig

Je laisserai Kevin Indig, qui a réalisé l'étude de cas, l'expliquer ici plus en détail, mais une mise en garde importante à ce sujet est qu'il s'agissait d' un mauvais contenu d'IA. Allez le lire dans l'article si vous ne me croyez pas, mais, genre, à peine lisible mauvais (et marrant, car il s'agit de célébrités).

En voici un autre (site non divulgué) de Mark Williams-Cook (l'une de mes personnes préférées à suivre sur ce sujet):

Ma mise en garde sur celui-ci : Mark a publié 10 000 éléments de contenu IA sur ce site. Cela signifie qu'il y a deux raisons pour lesquelles sa pénalité aurait pu se produire qui ne condamnent pas le contenu de l'IA dans son ensemble :

  1. Comme Ross Hudgens en a beaucoup parlé récemment, il y a un sérieux danger à publier très rapidement à grande échelle. Cela aurait pu être la cause de la pénalité de Mark, et cela n'avait rien à voir avec l'IA. (Personnellement, je doute que ce soit le seul facteur qui mène à…)
  2. Il s'agissait d'un contenu d'IA pur et non édité.

Le fait est que le précédent est ici, maintenant, les amis.

Qu'est-ce que cela signifie pour vous

Pour l'amour de votre site Web, si vous allez publier du contenu IA, ne publiez pas de contenu IA merdique. L'IA a besoin d'un éditeur humain pour l'instant. Et, le contenu de l'IA donne à presque tout le monde le pouvoir de pomper d'énormes volumes de contenu. Cela, sans vraiment savoir ce que vous faites, demande des ennuis.

Chose que nous savons n ° 3: les gens classent le contenu pur de l'IA.

Attends quoi?

Ouais, c'est un peu l'opposé de Thing #2, mais avec une bonne dose de nuance.

Cette nuance est une combinaison de cette liste :

  • L'échelle n'est pas massive (donc le risque d'être pris est plus faible)
  • Le contenu est meilleur (si c'est de l'IA pure, cela signifie une meilleure ingénierie rapide et des modèles affinés)
  • Les sites sont dans des niches moins compétitives (moins de concurrence, juste plus facile de classer les choses)
  • Le contenu est plus court (plus il est court, meilleure est l'IA pour le faire. L'IA se décompose de manière spectaculaire sur la forme longue)
  • Ils n'ont pas (encore) été attrapés
Graham le fait ! (Mais lisez certainement son article avant d'essayer cela à la maison.) De plus, il est écossais et il y a de fortes chances que vous ne l'êtes pas.

Mes années de formation dans le référencement ont appris de Whiteboard Friday, où la pensée était que si vous ne faites pas de référencement à 100%, vous êtes un idiot - Google est tout simplement trop intelligent. J'en ai maintenant assez vu pour savoir qu'il y a beaucoup de gens qui gagnent le jeu du chat et de la souris contre Google pendant de longues périodes et gagnent beaucoup d'argent en le faisant.

Qu'est-ce que cela signifie pour vous

Si vous avez des compétences en chapeau noir et que vous voulez vous battre avec Google, allez-y (au moins sur les sites Web où vous êtes d'accord pour voir le trafic passer à zéro).

Si ce n'est pas le cas, ou si vous ne travaillez pas sur des sites où vous pouvez vous permettre d'avoir cette tolérance au risque, évitez de publier du contenu purement IA (lire : Jasper/ChatGPT/etc).

Chose que nous savons #4 : Google a commenté directement le contenu de l'IA

Avant de t'énerver contre moi pour avoir enterré la piste, lire ceci dans le contexte de ce que vous avez lu ci-dessus. Et puis lisez ce que cela signifie pour vous .

Voici ce que Google a déclaré sur Twitter le 12 janvier 2023 :

Comme vous le voyez, ils répondent à quelque chose. L'ensemble du fil est assez intéressant. Vérifiez le ici.

Sacré maquereau, dites-vous. Nous sommes en clair ! Google lui-même l'a dit !

Accrochez-vous à vos chapeaux, les gens, les choses sont sur le point de devenir méta. Dans la capture d'écran ci-dessous, découvrez ce que ce monsieur Peter, qui a clairement vu ce rodéo Google-fait-des-déclarations-sur-SEO auparavant, a commenté sur le fil LinkedIn où ce tweet était discuté. Découvrez ensuite comment notre propre responsable du contenu (et hôte du podcast Content Bounce House) Ryan Sargent a répondu à mon signalement de ce commentaire dans notre chaîne Slack interne :

Si je suis trop méta sur toi, le point est le suivant : il y a une longue histoire où Google dit quelque chose sur le référencement et les facteurs de classement de recherche, puis se sent peu ou pas obligé de s'y tenir. La définition de "principalement pour les classements des moteurs de recherche" est également sujette à interprétation.

Enfin, voici ce que Google a déjà dit à propos des signaux d'engagement des utilisateurs : (JK Google n'aime pas parler des signaux d'engagement des utilisateurs comme facteur de classement, mais tout le monde sait qu'ils prennent toutes ces délicieuses données Chrome et Android et les utilisent + pogo- s'en tenir à comprendre ce que les humains pensent de votre contenu.) Le point de cette longue parenthèse est : VOTRE CONTENU DOIT ÊTRE BON POUR CLASSER. Et le problème avec le contenu de l'IA est…

Qu'est-ce que cela signifie pour vous

Encore une fois, pour l'amour de Pete, ne publiez pas de contenu purement IA. Si Google ne vous punit pas, les personnes qui vous recherchent et vous trouvent sur Google vous puniront en rebondissant. Et puis, Google vous punira.

Chose que nous savons n°5 : la détection par IA est une course aux armements, le tatouage arrive (ou ici)

Nous avons un article de blog complet à paraître la semaine prochaine sur l'état des outils de détection de l'IA et du filigrane. Entrez votre e-mail dans cette boîte flottante pratique pour vous inscrire

Voici trois choses à savoir sur ce sujet en ce moment :

La plupart des outils de détection d'IA sont de la merde

Les outils de détection d'IA accessibles au public ne sont tout simplement pas géniaux. Ils ne sont pas assez intelligents, ce qui peut vous donner un faux sentiment de sécurité. Ils sont difficiles à interpréter (et l'interprétation des scores sur de petits volumes de contenu peut être trompeuse, car les scores fluctuent selon l'industrie, le type de contenu, etc.).

Supposons que Google a construit une détection d'IA plus grande et plus mauvaise que celle qui est accessible au public

Google est fortement investi dans la lutte contre le spam Web, et cela inclut le contenu spammé de l'IA. Il est donc probable qu'ils aient construit leurs propres outils pour le détecter, et certains ou tous ces outils ne seront jamais rendus publics.

Si le filigrane n'est pas encore là, il le sera bientôt

Vous avez entendu parler d'un filigrane sur un document. OpenAI travaille sur un filigrane pour le contenu écrit par GPT basé sur des méthodes cryptographiques. J'essaierais d'expliquer le fonctionnement interne, mais je ne suis pas assez technique. Nous vous donnerons cependant plus de détails dans ce prochain article sur les outils de détection d'IA.

Le point est : ce filigrane fonctionnera en faisant varier la probabilité du prochain mot choisi dans le contenu généré par GPT selon une séquence pseudo-aléatoire. Ces écarts modifieront légèrement les mots, mais pas d'une manière qui serait perceptible pour les humains lisant le contenu. La "clé" d'OpenAI, cependant, sera capable de reconnaître le filigrane en faisant correspondre les variances de probabilité, de sorte qu'elle peut définitivement prouver que quelque chose a été généré par leur modèle. Et pire encore, vous ne pourrez pas supprimer le filigrane en effectuant simplement quelques modifications légères - selon toute vraisemblance, vous ne supprimerez pas les bons mots, ou en supprimerez suffisamment. C'est la mère de tous les outils de détection d'IA.

Ok, comment cela s'applique-t-il au référencement ? La théorie est la suivante : OpenAI rend cette clé de détection publique, Google l'utilise, détecte le contenu écrit par GPT et punit ce contenu.

Qu'est-ce que cela signifie pour vous

Dans une histoire qui ressemble à de nombreuses stratégies SEO noires et grises du passé, la création de contenu IA et la détection IA sont dans une course aux armements. L'un peut prendre l'avantage, l'autre le surpasser… vous connaissez l'histoire. Dans les courses aux armements avec Google, votre adversaire est intelligent, bien financé et brutal. Donc:

  • Ne présumez pas que réduire un score de probabilité d'IA sur un outil public signifie que vous êtes en sécurité. Le niveau de sophistication n'est pas là.
  • Ne présumez pas que la modification du contenu de l'IA le rend indétectable
  • Supposons que le filigrane du contenu GPT est déjà en cours. (Ce n'est peut-être pas le cas, mais l'approche conservatrice consiste à supposer que c'est le cas.)

Maintenant que nous avons parcouru ce que l'on sait du contenu de l'IA et du référencement, passons au pays des boules de cristal. C'est amusant là-dedans et, que ces prédictions soient bonnes ou mauvaises, elles fournissent des informations précieuses aux spécialistes du marketing.

Création de contenu SEO et IA : ce que disent les experts

Certains référenceurs très intelligents ont mis leurs réflexions sur l'IA et le référencement. Voici un tour d'horizon de mes favoris.

Ross Hudgens, PDG de Siege Media

Euh oh annotation mienne, message de Ross

Dans ce post LinkedIn, Ross commente le contenu de l'IA, mais utilise spécifiquement le contenu de l'IA pour pousser la vitesse de publication (littéralement, la vitesse à laquelle vous publiez) à des niveaux extrêmes et malsains. Cela s'applique également au contenu humain, mais c'est beaucoup plus facile à réaliser avec l'IA. Le point? À court terme, une vitesse de publication extrême peut avoir un impact positif sur votre trafic organique, mais cela reviendra très probablement vous mordre. Théorie de Ross : si le rapport entre le contenu et les backlinks commence à grimper trop rapidement, la « fondation » des liens soutenant le contenu s'effondre.

Lily Ray

Si vous êtes dans le domaine du référencement depuis un certain temps, Lily Ray n'a pas besoin d'être présentée. Et ce tweet nécessite peu d'explications. Lily prédit que ce qui est arrivé aux sites des études de cas de retour dans Thing # 2 se produira dans un avenir proche.

Mark Williams-Cook

Mark fait une autre apparition dans cet article avec son adaptation du classique Gartner Hype Cycle. Dans ce cas, le creux de la désillusion est le creux où le trafic de votre site Web tombe à zéro. Pour équilibrer les perspectives assez négatives de Mark ici, notez simplement que les récentes spéculations bien informées prévoient que le GPT-4 arrivera au cours du premier semestre 2023. Ainsi, bien que les cycles de Gartner soient souvent mesurés en années, celui-ci… peut être beaucoup plus rapide.

Beaucoup de démentis de notre tour d'horizon d'experts. Notez cependant qu'ils utilisent tous les trois "contenu de masse/volume élevé" dans leurs publications. Nous avons déjà vu l'aversion de Google pour le très haut volume (en particulier de faible qualité et de volume élevé), il est donc difficile de contester la probabilité que ce cas d'utilisation particulier pour le contenu de l'IA se termine mal.

Où tout cela se termine (ce que vous devriez emporter)

Phew.

Accroché là? C'est beaucoup. Si vous ressentez actuellement une version de, 'Huh. Eh bien, je veux les avantages de l'IA, mais tout cela me fait flipper, 'vous n'êtes pas seul.

Voici où j'en suis avec tout cela, et ce que je pense que vous devriez rapporter aux sites Web de votre laboratoire :

Supposons ce qui suit :

  • Tout cela va continuer à changer, rapidement. Je fais ça depuis un moment et je n'ai jamais vu les choses évoluer aussi vite. Gardez votre oreille au sol.
  • Google a une meilleure détection de l'IA que celle dont vous disposez, et elle ne fera que s'améliorer.
  • OpenAI va bientôt, ou l'est déjà, filigraner tout le contenu GPT. L'édition légère ne supprimera pas le filigrane. L'édition lourde ne le sera probablement pas. Le faire passer par un autre LLM différent (ou peut-être un spinner de contenu) le fera probablement. Mais genre, pourquoi ?

Dites simplement non au contenu purement IA :

  • Au-delà du risque SEO, la publication de contenu IA (en particulier de mauvaise qualité) représente également un risque pour la marque. Ne cherchez pas plus loin que la décision de CNET de suspendre son utilisation du contenu de l'IA après la réaction du public
  • Ce n'est pas bon non plus pour vos utilisateurs humains. Et ils comptent parce que ce sont eux qui achètent réellement les choses + les signaux d'engagement
  • L'IA pure est si bon marché et si rapide qu'elle encourage les mauvais comportements des spécialistes du marketing de recherche : publier trop, trop vite, trop peu de qualité, trop loin de la promesse principale de votre site Web.

Créez avec soin du contenu assisté par l'IA :

  • Passer 5 minutes à éditer la sortie Jasper n'améliorera pas tout. (Nous avons essayé.)
  • Faire attention au début du processus (grâce à une ingénierie rapide et à l'injection d'humains tout au long du processus, pas seulement à la fin) et utiliser des éditeurs formés aux spécificités de l'édition de l'IA sont tous nécessaires pour faire chanter ce truc (ou du moins passer d'à peine lisible à bonne lecture)

Où utiliser l'IA compte :

  • Tout d'abord, considérez votre site Web et sa place sur Internet. Concourir sur un créneau hyper concurrentiel et avoir un site où une baisse de trafic organique serait catastrophique pour vous/votre client ? Ouais, peut-être pas l'IA.
  • Ne laissez pas votre nouveau marteau IA brillant vous faire croire que tous vos besoins en contenu sont des clous qui attendent d'être enfoncés. Comme les humains, l'écriture LLM a des forces et des faiblesses. Déployez-le sur le contenu là où cela a du sens, mais ne le forcez pas au-delà.

Comme pour moi? Aucun des sites Web sur lesquels je travaille ne reçoit de contenu d'IA de sitôt. Ils sont dans des créneaux concurrentiels. Ils dépendent fortement du trafic organique pour la survie des entreprises. J'ai besoin que les gens lisent le contenu pour convertir. Le contenu de l'IA peut être lisible, mais ce n'est pas une bonne lecture. Enfin et surtout, j'ai peur de Google.

Il ne s'agit pas d'une condamnation générale du contenu de l'IA. Si j'étais une agence au service de clients locaux et de petites PME qui ne pouvaient pas se permettre un contenu humain de haute qualité et avaient un blog triste et vide ? Zut ouais (ouais ouais pour un contenu bien conçu et assisté par l'IA, c'est-à-dire).

Si vous êtes arrivé jusqu'ici, merci pour la lecture. Si vous avez des questions ou des réflexions ou si vous n'êtes pas d'accord avec moi, paul[at]verblio.com.