Introduction
Début novembre, nous avons eu l'occasion de partager avec nos confrères - au GA4 Champ Meet up de Google - un comparatif entre deux philosophies d'enrichissement de ses données de conversion : la modélisation et la collecte avancée.
Ce sont deux philosophies différentes notamment par leur temporalité. La première agit en amont de l'usage de la donnée, ce qui permet son application à des fins marketing et la seconde agit à posteriori pour un usage d'audit et de suivi.
Nous souhaitons rendre accessibles à toute la communauté les résultats que nous avons trouvés. Ceux-ci sont fondamentaux, surtout dans le contexte des réglementations en vigueur.
Dans cet article, vous trouverez :
En 2015, l'une des questions les plus posées dans le domaine de la web analytics était la suivante : pourquoi mes données sont différentes dans mon back office et mon Google Analytics ?
Question légitime, surtout dans un écosystème intrinsèquement mesurable et dont l'exhaustivité des données est disponible. Dans ce contexte, la réponse pouvait varier en fonction des écoles.
- Certains parlaient des restrictions navigateurs, avec en cause les adblockers des utilisateurs.
- D'autres annonçaient des erreurs d'intégration indiquant que le dataLayer ne se déclenchait pas toujours correctement et/ou contenait des erreurs.
- Une troisième version était qu'un outil de web analytics n'a jamais l'intégralité des données pour de nombreuses raisons, mais doit pouvoir retranscrire correctement les tendances.
Aujourd'hui, la réponse est unanime, RGPD (Règlement Générale à la Protection des Données) oblige. Néanmoins, la question mérite d'être posée. La mise en place d'une demande de consentement vient englober et masquer les aspérités d'une data collection et data quality parfois imparfaite.
Le Consent Mode est l'outil Google de modélisation des données non consenties, mis à l'usage de la plateforme Google Analytics 4 et Google Ads. Son fonctionnement avancé, selon la documentation, peut se résumer ainsi :
- Les utilisateurs ayant consenti à ce que leurs données soient collectées dans Google Analytics envoient logiquement leurs données navigationnelles à Google Analytics.
- Les utilisateurs n'ayant pas consenti envoient les informations à un serveur différent et sans identifiant persistant. Ces évènements permettent d'alimenter un moteur de modélisation qui va pouvoir estimer la partie du trafic n'ayant pas consenti.
Son fonctionnement basique n'envoie même pas les données anonymisées. Le moteur de modélisation devra donc déterminer un volume sans aide.
De son côté, le tracking technique des conversions a un objectif clair : obtenir une base de données des conversions iso avec le Back Office en y ajoutant les informations stratégiques de consentement. Celle-ci, dans votre cloud, à côté de votre base de données Google Analytics 4. Aujourd'hui, c'est un standard de nos implémentations de part son pouvoir de catalyseur de nombreux cas d'usage de la donnée.
Voici quelques exemples de KPIs permettant de mieux comprendre son usage :
- Mieux comprendre ses acheteurs par catégorie de consentement (Panier moyen, Récurrence Fréquence Monétisation, Average Order Frequency, Return Over Advertising Spends)
- Comprendre et anticiper le biais des outils d'analyse comportementale et d'audience grâce aux informations de transactions consenties / non consenties
- Définir les points d'amélioration de son dataLayer sur la conversion principale
- Mettre en place un système d'alerting sur des niveaux de captation ou à la transaction près
- Identifier les poches de croissance avec un Conversion Rate par consentement
Vous l'avez compris, les cas d'usage sont nombreux et applicables à plusieurs domaines tel que l'analyse de données, la collecte ou la data quality :
Aujourd'hui, le consent mode agit en amont de l'usage marketing de la donnée et occupe une place de plus en plus prépondérante. Ainsi, les outils de web marketing en sont de plus en plus dépendants. Il est donc impératif de mettre en place un système de contrôle de la qualité de la modélisation.
Afin de mesurer la qualité de la modélisation opérée par Google, nous utilisons le server side tagging et ses Key Performance Indicators distinctifs.
En comparant les volumes de transactions modélisés et non consenties, nous constatons que le consent mode applique un redressement conservatif, sans inventer des transactions. Cela lui permet de compenser pour la captation des données imparfaites, en plus des transactions non consenties.
En combinant une captation élevée et une modélisation importante, Google Analytics est en mesure d'utiliser jusqu'à 98,4% des transactions consenties et non consenties effectuées dans la journée. En moyenne, la modélisation rattrape 65% des transactions manquantes, ce qui depuis 2018 est une révolution.
Suite à l'introduction de la notion de consentement pour le suivi des comportements utilisateurs en ligne, 20% des transactions étaient perdues. L’utilisation du consent mode permet de faire tomber ce chiffre à 10%.
Dans notre cas d'usage, nous avons trouvé que le Consent Mode applique un redressement conservatif, au maximum 98.42% de la réalité et en moyenne 89.95% des transactions, ce qui représente + 10 p.p. sur la captation des transactions.
Statistiquement, le consent mode et sa modélisation sont en mesure de compenser de manière fiable 50% du volume de conversions manquantes depuis 2018. Le sens de l'histoire, selon les plateformes majeures de l'industrie, est la modélisation conjuguée avec le tracking augmenté et la correspondance augmentée. Ces derniers ajoutent plus de données et plus de précisions, comme nous l'avons expliqué dans cet article.