Plus le temps passe et plus les bases de données se remplissent, c’est inévitable. Nous vous expliquions précédemment pourquoi faut-il exporter ses données Google Analytics 4 vers BigQuery. Comme vous l’aurez compris, aujourd’hui, nous allons évoquer l’importance des custom queries pour importer vos données de BigQuery dans vos dashboards Looker Studio.
Il faut garder en tête que les connexions standardes entre BigQuery et Looker Studio sont pratiques mais encombrantes. Ces dernières ne vous permettent pas de choisir quelles données vous récupérez et donc vous perdez beaucoup en temps de chargement. C’est typiquement pour éviter cela que les custom queries nous sont utiles.
Vous retrouverez dans cet article :
- La flexibilité des requêtes
- Un contrôle total sur la structure de vos données
- Une optimisation de vos dashboards
- Un coût moindre
Les custom queries, pas toujours utilisées
Chez Optimize Matter, cela fait longtemps que l’on utilise les custom queries. Aujourd’hui nous allons vous expliquer comment et surtout pourquoi ! Avant tout, il faut comprendre que pour s’en servir, il faut au préalable disposer d’une (ou plusieurs) table sur BigQuery. Une fois cette condition remplie, vous pouvez vous intéresser aux raisons rendant les custom queries nécessaires.
L’un des nombreux avantages que les custom queries proposent est la flexibilité des requêtes. Utiliser des custom queries va vous permettre plusieurs choses :
- Pouvoir répondre à un besoin plus spécifique
Vos chiffres sont faussés par trop de dimensions dans votre source de données ? Grâce aux custom queries, vous pouvez récupérer uniquement les informations dont vous avez besoin. En faisant parler vos données correctement, vous retrouverez des chiffres cohérents.
- Personnaliser ses dimensions et métriques
Effectuer vos calculs depuis votre custom query va permettre de gagner en temps de chargement de votre dashboard. En effet, le calcul se fera lors de l’appel des données et non au moment ou le dashboard va se charger.
Si vous souhaitez, par exemple, transformer votre dimension “country” directement dans votre dashboard, c’est un mauvais réflexe. En effet, cela risque de ralentir son affichage. Prenez l’habitude de le faire lorsque vous appelez vos données, puisque l’appel des données a moins d’impact sur le temps d’affichage.
- Modifier vos connexions avec simplicité et rapidité
Modifier votre connexion n’a rien de compliqué, il vous suffit tout d’abord de vous rendre dans l’onglet ressources.
L’organisation et la manipulation précise des données sont deux aspects cruciaux pour garantir la fiabilité des rapports et des analyses ultérieures. Les custom queries ouvrent un champ d’action étendu permettant d’exercer un contrôle minutieux sur la structure des données que vous utilisez dans vos dashboards Looker Studio. À travers les diverses fonctionnalités de SQL et BigQuery, vous pouvez affiner vos données au plus près de vos besoins analytiques.
La réalisation de jointures entre différentes tables de données est une fonction essentielle pour construire des data sets complets et pertinents pour vos analyses. En associant correctement les données issues de différentes tables au moyen de requêtes personnalisées, vous pouvez :
- Consolider les données : Les jointures vous permettent de regrouper dans une même vue des données issues de différentes tables, offrant ainsi un panorama plus complet pour vos analyses.
- Enrichir vos analyses : En combinant différentes sources de données, vous accédez à un niveau d’analyse plus approfondi, permettant de croiser des métriques et des dimensions issues de divers horizons.
En somme, l’usage judicieux de jointures intelligentes et un filtrage initial efficace vous offre un contrôle précis sur vos données mais optimise également considérablement l’usage de vos ressources et la performance de vos dashboards Looker Studio.
Tout au long de cet article, nous n’avons cessé d’évoquer l’impact positif des custom queries sur le temps de chargement de votre dashboard. Cependant, ce n’est pas la seule technique pour accélérer son chargement.
Un moyen connu qui n’est pas toujours utilisé est l’utilisation des paramètres standards et plus précisément des paramètres de plage de dates. En effet, l’utilisation des paramètres “@DS_START_DATE” et “@DS_END_DATE” va permettre d'appeler uniquement les données présentes entre la date de début et de fin de votre plage de dates de votre dashboard.
Ici, plutôt que d’appeler l’entièreté des données présentes dans notre table, on appelle uniquement celles correspondant à notre plage de dates. Cela réduit fortement la quantité de données et donc le temps de chargement.
Une autre façon d’optimiser votre dashboard est de bien gérer vos sources de données. Les custom queries sont très pratiques mais il ne faut pas sélectionner toutes les données dont vous avez besoin sur le dashboard en un seul appel. Cela vous donnerait quasiment autant de dimensions et métriques que sans custom query. Il ne faut donc pas hésiter à créer plusieurs sources de données, toutes via des custom queries en fonction du type de données que vous allez traiter (acquisition, produit…).
Utiliser un "SELECT *" (ou sélectionner tous les champs) dans une requête signifie que vous demandez à la base de données de récupérer toutes les colonnes disponibles pour les lignes concernées. Dans le cas de grandes bases de données, cela entraîne l'extraction d'une immense quantité de données, dont une grande partie pourrait être superflue. Cela se traduit non seulement par une utilisation accrue des ressources, mais aussi par des coûts plus élevés, car de nombreuses plateformes facturent en fonction de la quantité de données interrogées.
À l'inverse, une sélection précise où vous définissez spécifiquement les dimensions et métriques nécessaires pour votre analyse permet de minimiser la quantité de données extraites. Vous ne payez alors, dans BigQuery, uniquement pour les données réellement pertinentes pour votre besoin.
Regardons ça plus précisément, dans BigQuery j’ai une table d’environ 27,34 Go dans laquelle je vais faire deux tests :
- un SELECT * sur 7 jours ;
- un SELECT très simple concernant seulement les métriques dont j’ai besoin, soit la date, les pays, les sessions, les users et les purchases sur 7 jours.
Ma sélection de toute ma base de données pour environ 6 Go.
Ma sélection de toute ma base de données pour environ 600 Mo.
Comme vous pouvez le constater, dans notre cas nous avons payé dix fois moins cher notre requête en sélectionnant seulement les dimensions et métriques qui nous intéressent, ce qui n’est pas anodin.
Les custom queries, bien que puissantes, ne sont pas toujours intuitives pour tout le monde. La maîtrise de ce type de requêtes nécessite une compréhension approfondie du langage de requête SQL ainsi qu'une connaissance détaillée de la structure de vos données. Le SQL est un langage complexe qui offre une multitude de fonctions et de possibilités. Sans une formation adéquate, il est facile de se perdre dans sa syntaxe ou d'utiliser des fonctions qui ne sont pas optimales pour vos besoins.
Pour formuler efficacement une requête, il est essentiel de connaître votre schéma de données de vos tables, les relations entre elles et la manière dont elles sont indexées. Sans formation, il est tout à fait possible que vous ralentissiez vos dashboards voire même que vous ne concrétisiez pas du tout votre requête.
Une mauvaise requête peut causer plus de problèmes qu'elle n'en résout, en particulier en termes de performances. Si vos requêtes ne sont pas bien construites, elles peuvent prendre beaucoup plus de temps à s'exécuter. Cela peut ralentir tout votre système, surtout si de nombreuses personnes exécutent simultanément des dashboards basés sur ces requêtes.
BigQuery peut gérer de grandes quantités de données, mais cela ne signifie pas que toutes les requêtes s'exécutent rapidement. Il est crucial d'optimiser vos requêtes, surtout si vous travaillez avec de vastes ensembles de données (voir la partie sur l’optimisation de vos dashboards).
La sécurité doit toujours être une priorité, en particulier lorsqu'il s'agit de données appartenant à votre entreprise. Une erreur dans la formulation de votre requête pourrait potentiellement exposer des données que vous ne souhaitiez pas rendre accessibles.
De plus, il est essentiel de s'assurer que seules les personnes autorisées peuvent créer ou modifier des custom queries. Une mauvaise gestion des droits d'accès pourrait permettre à des utilisateurs non autorisés de visualiser ou de manipuler des données sensibles.
La combinaison entre BigQuery et Looker Studio peut se révéler très utile dans beaucoup de cas, comme pour optimiser et personnaliser vos dashboards. Cependant, comme tout outil puissant, il nécessite une utilisation judicieuse et une bonne compréhension de ses capacités et de ses limites. Si elles sont bien utilisées, les custom queries peuvent transformer votre expérience avec Looker Studio, vous permettant de tirer le meilleur parti de vos données. Assurez-vous de former adéquatement votre équipe ou de consulter un expert si nécessaire pour exploiter pleinement cette fonctionnalité.