Début décembre 2019, j’ai eu l’occasion de participer à l’événement Queduweb à Paris, organisé par deux personnes talentueuses : les Frères Peyronnet.

En tant que Speaker, j’ai souhaité aborder le prisme du SEO au travers de la data science. J’ai donc choisi d’évoquer mon expérience précédente en agence web lorsque je faisais de la R&D sur le côté mais également mon expérience actuelle qui me permet aussi de jouer avec la donnée de masse. La science de la donnée et plus exactement l’intelligence artificielle n’a rien de nouveau mais c’est un sujet qui est de plus en plus évoqué dans notre industrie ces dernières années. Mon objectif, pour cette conférence, était d’introduire brièvement les principaux concepts de la data science à travers le machine learning mais également de répondre à la question suivante : quand utiliser la data science en SEO ? Est-ce que la data science est simplement un buzzword dans notre industrie ? Et si tel n’est pas le cas, quand l’utiliser, comment et pourquoi ?

Brève introduction à la science de la donnée

La science de la donnée est à la croisée des chemins avec la big data et l’intelligence artificielle lorsqu’il est question d’analyser et de traiter de la donnée nommée dataset (données d’entraînement / de production).

Google Trends illustre très clairement que la science de la donnée, en tant que domaine de recherche, augmente au fil des années depuis 2014.

L’intention de recherche pour le machine learning a augmenté également et figure parmi les termes de recherche dont la progression est la plus forte. Il s’agit d’un des deux apprentissages permettant « d’exécuter » l’intelligence artificielle et c’est également le sujet sur lequel le présent article a vocation à se concentrer.

Quelle est la relation concrète entre l’intelligence artificielle et Google ?

En 2011, Google a créé Google Brain, une équipe dédiée à l’intelligence artificielle. L’objectif principal étant de transformer les produits de l’intérieur en utilisant les bénéfices de l’intelligence artificielle pour les rendre plus rapide, plus intelligent et plus utile.

On comprend facilement que le moteur de recherche est leur produit le plus puissant considérant sa part de marché (93% en 2019), et il ne fait nul doute que l’intelligence artificielle est employée pour améliorer la qualité des résultats de recherche.

Qu’est-ce que le machine learning ?

Apprentissage automatique en bon français, il est l’une des deux branches définissant l’intelligence artificielle. Le machine learning tend à résoudre un problème au travers d’un cadre de référence (défini par l’homme) et dont l’output (résultat) est vérifié par un humain, considérant que ces usages contiennent toujours un taux d’erreur.

Selon J. Ah-Pine de l’Université de Lyon 2, le machine learning est ainsi défini :

L’apprentissage automatique consiste à programmer des algorithmes permettant d’apprendre automatiquement de données et d’expériences passées pour résoudre au mieux un problème considéré.


Plus simplement, les algorithmes de machine learning reçoivent des données d’entraînement. Ensuite, l’algorithme s’entraîne afin de comprendre et d’identifier les différents patterns qui lui ont été soumis au travers des données de test. Plus l’algorithme est entraîné, meilleurs seront ses résultats.

principes machine learning

Le fonctionnement de Google images en est certainement la meilleure illustration avec une recherche par image par exemple et qui donne, en sortie, des résultats similaires ou, pour l’exemple pris en conférence, une réponse à : « Comment s’appelle ma plante ? Voici la photo que j’ai prise ».

machine learning google images

Quel est le lien concret entre l’intelligence artificielle et le SEO ?

En 2015 et pour simplement évoquer les principaux algorithmes (ceux qui ont fait parler d’eux), Rankbrain a été déployé afin d’améliorer la qualité des résultats de recherche. A cette époque, environ 15% des requêtes n’avaient jamais fait l’objet d’une recherche auparavant. Le but était donc de mieux comprendre, et ce de manière automatique, la requête afin de proposer des résultats pertinents. Rankbrain a été développé par Google Brain.

Plus récemment, en 2019, Bert a été déployé à son tour pour mieux comprendre les intentions de recherche.

En tant que SEO, il est important de noter qu’on ne peut pas optimiser un site web pour l’un ou l’autre (ndlr. des deux algorithmes). Ils ont en effet été pensés pour mieux comprendre et mieux répondre aux recherches. En somme, leur déclenchement se fait en amont de l’output. Il n’y a donc pas là moyen d’en soutirer une quelconque optimisation.

On le voit donc au travers de cette démonstration, Google utilise le machine learning. Il fait donc sens d’en comprendre les grands principes ainsi que son fonctionnement.

Quel est l’intérêt en SEO ?

Les points suivants, enfants du machine learning, sont intéressants considérant qu’ils peuvent être intégrés à l’opérationnel SEO selon mon expérience :

  • Prédiction.
  • Génération.
  • Automatisation.

À partir de là, le reste de l’article va soit vous donner envie de tester si ce n’est déjà fait soit vous faire dire que ce n’est rien d’autre que du bullshit. Dans les deux cas, la lecture est nécessaire pour se faire une opinion 🙂

Prédiction

Le code pour réaliser la visualisation ci-dessous est disponible (et a été écrit par Mark Edmonson). L’idée est d’établir le postulat suivant : si je rankais en première position pour mes principaux mots-clés, quel serait mon chiffre d’affaires ?

rankings revenue prediction

Le résultat de sortie met en avant la position actuelle ainsi que le revenu possible en tenant compte d’une marge d’erreur.

Ce type de prédiction peut permettre de convaincre sa direction de l’intérêt d’investir en SEO ou encore un prospect si vous travaillez en agence pour lui montrer, tout en gardant en tête qu’il s’agit d’une science inexacte, les possibilités qui s’offre à lui.

Génération

Rédiger du contenu est certainement l’une des tâches les moins efficientes en SEO, qu’il s’agisse de rédiger soi-même le contenu ou, à minima, de rédiger le brief à destinateur du rédacteur. Dans les deux cas, il est souvent difficile de trouver l’inspiration et de travailler efficiemment.

C’est pourquoi la génération automatique de contenu est intéressante. Comme je l’ai déjà souligné, le machine learning comporte un taux d’erreur. C’est pourquoi ce type de génération doit être vu comme permettant d’obtenir une ossature éditoriale.

Le code pour réaliser la génération de contenu est disponible dans un autre article de mon blog.

Egalement, obtenir une première ossature éditoriale peut aider à semi-automatiser le maillage interne en mettant en avant, de façon manuelle, les ancres primaires et secondaires. C’est d’ailleurs l’intérêt d’un prochain article. 🙂

Google, via son équipe dédiée à l’IA, a publié plusieurs papiers intéressants sur la génération automatique de contenu (ce qui est plutôt drôle finalement à mon sens). L’un deux a retenu mon attention : « Générer Wikipedia en résumant de longues séquences« . Cela fera également l’objet d’un prochain article, je l’espère.

Automatisation

L’automatisation, dans mon cas, a été très utile pour nommer des images et également des vidéos grâce à l’algorithme de détection d’objet de Tensorflow. Le code est également disponible ici.

L’idée est d’automatiser le nommage des fichiers mais également les attributs alt de manière très simple.

Egalement, l’automatisation peut être utilisée pour faire de l’A/B test du fait qu’il soit relativement simple d’apporter des changements sur une page. A date, l’usage le plus commun en SEO pour l’A/B test est d’utiliser les données en provenance de Google Ads telles que : le CTR et les conversions pour mieux comprendre le type de contenu (title et description des annonces) qui fonctionne le mieux auprès des utilisateurs et qui pourrait être répliqué pour le SEO. Dans ce cas, l’idée serait d’automatiser l’A/B test via la génération automatique de contenu et sa mise à jour, automatique elle aussi, basée sur les performances.

Conclusion

Je termine simplement cet article avec le partage de mes slides de la conférence Queduweb.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *