Détecter les cas de piggabacking

Comment détecter les phénomènes de piggybacking sur votre site ?

Vous utilisez des tags pour collecter de la donnée sur votre site internet. Vous les configurez dans votre TMS, déterminez leurs conditions de déclenchement et les données qu’ils doivent collecter. Vous allez peut-être nous dire que vous avez une parfaite visibilité de ce qu’il se passe sur votre site. Mais saviez-vous que des tags peuvent se déclencher sur vos pages sans que vous n’en ayez conscience ? Oui, votre site évolue dans un écosystème mouvant et par un phénomène d’encapsulation, il se peut que des tags présents sur votre site appellent à leur tour d’autres tags qui appellent à leur tour d’autres tags qui … bref vous avez compris l’idée. Ce phénomène, appelé piggybacking peut avoir des répercussions sur votre conformité RGPD. D’une part car la réglementation impose de connaître tous les tags présents sur votre site. D’autre part car il se peut que ces tags collectent des données personnelles sur vos internautes. 

Dans cet article, nous allons voir comment une équipe data a réussi à prévenir les phénomènes de piggybacking et identifier plus de 20 tags qui n’étaient pas désirés sur son site. 

Une volonté de contrôler le bon déclenchement des tags 

Imaginons un acteur e-commerce qui propose une multitude de services : du drive, de la livraison à domicile, du click and collect, de la consultation de promotions … Cette multitude de services fait que nous sommes face à un site web de plusieurs centaines de milliers de pages et administré par une dizaine d’équipes différentes. L’environnement digital est donc très complexe, les enjeux autour de la data très forts, et le recours aux tags pour collecter de la data indispensable. 

Les données collectées par le tag Google Analytics servent à mesurer et analyser le nombre d’impressions de produits sur les pages catégories et suivre le taux d’ajout de produits au panier. Les tags médias et marketing quant à eux ont pour objectif de mesurer l’efficacité des différentes campagnes : acquisition, retargeting, display… 

Les équipes en charge de la data ont une forte sensibilité pour les problématiques liées au déclenchement des tags, notamment dans le cadre du RGPD. Mais entre le nombre de pages sur le site, le nombre d’intervenants autour de la donnée et le nombre de partenaires médias et marketing, il est compliqué pour l’équipe d’avoir une vue précise de tous les tags présents sur le site web, de s’assurer de leur bon déclenchement et surtout de la pertinence, la pérennité et la qualité des données exploitées par tous ces partenaires pour piloter le business.

Afin de gagner en visibilité sur le déclenchement de son tag Analytics et des 15 tags médias présents sur son site, l’équipe data a mis en place un process de contrôle.

Au niveau du tag Analytics, les différents Product Owner ont pour mission de générer une demande de ticket en cas de constatation d’un régression du tracking ou lorsqu’ils souhaitent faire évoluer l’existant. Celle-ci est gérée directement par le responsable data ou transférée à l’équipe IT. Une fois la correction effectuée, elle est recettée sur 3 environnements de tests avant de pouvoir être effective lors de la prochaine mise en production. Ce process demande du temps et ne permet pas de faire une recette préventive du tracking.

En ce qui concerne les tags médias, avant chaque mise en production ou lors de modification du tracking, l’équipe en charge de la recette vérifie manuellement le bon déclenchement de chacun des 15 tags sur 4 à 5 pages du site internet. 

Elle procède également au contrôle du déclenchement sur plusieurs pages dès lors qu’un nouveau tag est ajouté.

Un contrôle manuel qui ne permet pas de détecter les cas de piggybacking.

Ces vérifications des différents tags demandent du temps à l’équipe et ne sont pas exhaustives.

D’une part car si un tag se déclenche bien sur une page, cela ne veut pas dire qu’il en est de même sur les centaines de milliers d’autres pages du site. Malgré le temps alloué, quelle est la probabilité de détecter une anomalie lorsque la vérification ne concerne que 0.0004% des pages du site? 

Ensuite, et c’est certainement le point le plus important, le contrôle effectué ne concerne que les tags connus et gérés par les équipes.  Il leur est tout bonnement impossible de chercher à détecter des tags dont elles ne maîtrisent pas toujours le déclenchement et ce sur un nombre aussi important de pages.

La volonté de l’équipe data serait donc de pouvoir contrôler automatiquement que tous les tags nécessaires à la collecte de données et à l’analyse des performances du site et la rentabilité des campagnes médias se déclenchent correctement.

Ensuite, elle souhaiterait être informée en cas de piggybacking. C’est à dire lorsqu’un tag non souhaité serait détecté sur le site et pouvoir identifier quel tag est à l’origine de son déclenchement sur ses pages.  

C’est ce que seenaptic a permis de faire.

Une cartographie des tags pour détecter les cas de piggybacking

L’équipe data a décidé de mettre en place un outil permettant de contrôler automatiquement le bon déclenchement de ses tags sur son site et de faire une cartographie de tous les tags présents sur ses pages. 

Cette vérification automatique permet de contrôler chaque semaine le déclenchement de l’ensemble des tags sur plus de 10 000 pages du site. Plus de 15 parcours utilisateurs sont simulés pour reproduire une acceptation de cookie par un internaute et confirmer que les tags se déclenchent bien conformément aux choix de consentement de l’utilisateur. Si un tag est absent ou ne se déclenche pas, alors une alerte est lancée pour informer immédiatement les équipes. De même, elles sont informées lorsqu’un tag qui n’est pas présent dans leur référentiel est détecté sur le site. Elles savent dès lors, quel est ce tag, sur combien de pages il est présent et d’où il provient.

20 tags inconnus détectés sur le site

A la suite de tests automatisés, l’équipe data a reçu une alerte lui indiquant que plus de 20 tags “non connus” avaient été détectés sur 75% des pages testées. Grâce à l’arbre de déclenchement de seenaptic, elle a pu identifier le partenaire à l’origine du piggybacking, un prestataire spécialisé dans le retargeting, la génération de trafic et le display à l’origine de ce déclenchement. Elle lui a demandé de corriger cette anomalie en s’appuyant sur les résultats de tests de l’outil.

Depuis, le dysfonctionnement a été corrigé par le prestataire et la correction a été confirmée lors des tests automatisés. De son côté, l’enseigne a gagné en sérénité et peut désormais attester, en cas de contrôle de la CNIL, d’un process de vérification de ses tags. 

Vous voulez en savoir plus sur les solutions pour vérifier les données de votre site et assurer votre conformité RGPD ? Contactez-nous : contact@seenaptic.com

Julie Dulot

Responsable Communication chez Netvigie et pour seenaptic
Maman d'une petite chipie
Runneuse, pâtissière à mes heures perdues, et adepte de lecture
Fan de Dirty Dancing et de Céline Dion (plaisir coupable)

Vous aimerez peut-être

EPrivacy & RGPD: Nos fonctionnalités pour valider votre conformité

CMP : Benchmark des principaux acteurs en France

CNIL et Google Analytics : Interview de Maitre TESSONNEAU

ePrivacy : Comment y répondre par la data Quality

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *