Cinq façons de maintenir la qualité des données dans vos analyses
Publié: 2017-06-15Une stratégie basée sur les données est un élément essentiel de tout rôle marketing, faisant de la qualité des données une priorité absolue pour les spécialistes du marketing senior. Mais comment pouvez-vous vous assurer que vos données sont propres et exactes ?
Un récent rapport d'AT Internet a exploré les 5 dimensions clés de la qualité des données dans l'analyse numérique . Voici quelques points clés du rapport, ainsi que certaines choses que les spécialistes du marketing peuvent faire pour maintenir la qualité de leurs données.
- 55% des entreprises utilisent des données pour prendre des décisions …[1]
- … mais seulement 33 % des PDG font confiance à leurs propres données [2]
- 56 % des dirigeants déclarent que la mauvaise qualité des données entraîne la perte d'opportunités de vente [3]
- 51 % des dirigeants déclarent que les mauvaises données font perdre du temps et entraînent de l'inefficacité [3]
Ce contenu a été réalisé en association avec AT Internet
1. Exclure le trafic des robots
Selon le rapport 2016 d' Incapsula sur le trafic des bots , plus de 50 % du trafic sur le Web peut être attribué aux bots , comme le montre le graphique ci-dessous.
Image reproduite avec l'aimable autorisation d' Incapsula
Ce trafic peut être décomposé en « bons » et « mauvais » bots. Les ' bons ' bots sont soit :
- Les robots des moteurs de recherche d'entreprises comme Google, Bing ou Yandex (7 %)
- Les récupérateurs de flux comme l'application mobile Facebook, le bot du framework Android et le bot Twitter (12 %)
- Robots commerciaux – généralement utilisés pour extraire des données pour les outils de marketing numérique (3 %)
- Robots de surveillance, comme le bot de pingback WordPress (1%)
Les « mauvais » bots sont très probablement des « imitateurs » qui assument une fausse identité afin de contourner la sécurité du site Web. Les plus malveillants peuvent exécuter des attaques par déni de service distribué (DDoS) contre les sites qu'ils frappent. Ces types de robots représentaient 24% du trafic Internet total en 2016, avec 1,7% supplémentaires provenant des scrapers Web.
Un trafic de bots de cette proportion a deux effets dont les spécialistes du marketing doivent être conscients. Un, il gonfle artificiellement les volumes de trafic (si votre apparence du site comme il commence à se faire plus de trafic que ce soit), et deux, il apporte des mesures de taux de conversion vers le bas (si vos campagnes semblent moins efficaces qu'ils ne le sont).
Supprimer ce trafic est essentiel pour une analyse comparative précise. Sans données « propres », il est beaucoup plus difficile de prendre des décisions éclairées au sujet de la stratégie.
2. Vérifiez les balises manquantes ou cassées
Lors des mises à jour du site et des modifications apportées aux applications mobiles, il est essentiel de garantir l'intégrité des balises d'analyse pour collecter de bonnes données , en particulier sur les sites comportant un nombre élevé de pages, tels que les éditeurs ou les détaillants en ligne qui ajoutent et modifient fréquemment des pages.
Bien que les erreurs peuvent être difficiles à détecter, ils sont essentiels pour identifier et corriger afin d'assurer l'exactitude des rapports.
Les balises manquantes, dupliquées ou incorrectes peuvent avoir un impact sur la mesure des campagnes , ce qui conduit à des conclusions erronées sur l'efficacité de certaines campagnes. Les sites spécifiques à un événement sont souvent sujets à des balises manquantes, car les équipes sont souvent soumises à une pression de temps intense avant le lancement, ce qui peut entraîner des oublis techniques.
Malheureusement, ces erreurs peuvent également être les plus coûteuses à commettre, car l'événement - comme une publicité télévisée ou une conférence - représente souvent un investissement important de la part de l'entreprise.
3. Gardez le formatage de vos données cohérent
L'utilisation de chaînes numériques (ID de catégorie, SKU) dans les URL peut sembler être une victoire sur de longues chaînes de texte brut encombrantes. Mais bien que cela puisse être pratique lors de la capture de données, cela peut causer des problèmes lors de leur analyse. Les valeurs de texte intelligibles sont d'une grande aide pour comprendre d'où viennent les données et quelles chaînes peuvent être consolidées.
Il est également important de garder les valeurs de texte cohérentes. Une incohérence courante réside dans les paramètres de langue, où les mêmes valeurs sont souvent écrites de différentes manières , par exemple en utilisant « EN » et « anglais » pour représenter le texte en anglais.
Dans cet exemple, chacun apparaîtrait dans des lignes différentes dans un rapport et nécessiterait une consolidation manuelle par un analyste.
4. Utilisez une « version unique de la vérité »
L'utilisation d'une multitude d'outils peut être problématique pour la collecte et l'analyse des données. Différents systèmes peuvent utiliser des définitions et des calculs uniques pour les mêmes dimensions et métriques. Par exemple, différents outils d'analyse peuvent attribuer des sources de trafic différemment selon qu'une campagne est en cours ou non.
Un problème courant est la mesure entre appareils. Un utilisateur qui visite un site sur son téléphone en se rendant au travail, puis à nouveau sur son ordinateur lorsqu'il se rend au travail, peut être compté comme deux utilisateurs différents.
L'utilisation d'un outil unique capable de mesurer le comportement de connexion sur tous les appareils et plates-formes est une solution efficace – vous évitant les tracas des rapprochements et des déduplications manuels.
5. Utilisez des analyses en temps réel pour identifier les problèmes
Les fournisseurs d'intelligence numérique haut de gamme peuvent donner aux utilisateurs un aperçu du comportement des visiteurs en temps réel. Cela permet aux équipes d'obtenir des commentaires instantanés sur des campagnes spécifiques à une période donnée et de répondre aux problèmes qui surviennent, tels que les erreurs 404 et les plantages d'applications mobiles, au fur et à mesure qu'ils se produisent.
Un autre cas d'utilisation est celui d'un événement d'actualité, où un site médiatique peut suivre les performances d'articles individuels en temps réel, fournissant un aperçu basé sur les données du type de contenu qui intéresse le plus les utilisateurs.
[1] http://www.oxfordeconomics.com/thought-leadership/leaders-2020
[2] https://home.kpmg.com/xx/en/home/campaigns/2016/06/ceo-outlook.html
[3] https://www.edq.com/globalassets/white-papers/building-a-business-case-for-data-quality-report.pdf
Pour en savoir plus au sujet de la préservation de votre qualité de données, télécharger AT Internet rapport complet ': Qualité des données dans Digital Analytics: Les 5 dimensions clés.
Cet article a été réalisé en collaboration avec AT Internet . Cliquez ici pour lire les directives de contenu collaboratif de ClickZ.