menu

Data Quality : mieux comprendre les différentes solutions et leurs fonctionnalités

Publié le 30 mars 2021 par Maitre Blaise
Temps de lecture : 17 minutes

Pour combattre un hydre à plusieurs têtes, il est indispensable de bien choisir ses armes afin d’être certain de remporter la partie. Et dans ce combat que vous devez remporter, l’importance de maîtriser toutes les fonctionnalités des solutions de data quality est essentielle !

Attention cher lecteur, ceci n’est pas un comparatif de logiciel de qualité des données. Si vous êtes arrivés jusqu’ici, c’est que vous avez déjà fait le tour de tous les articles du genre et que vous avez consulté des dizaines de pages consacrées à ces solutions.

Sans prétention, voici un listing non-exhaustif des fonctionnalités des logiciels Data Quality que vous pouvez trouver sur G2.com ou Gartner. Nous allons juste détailler ensemble les grandes applications possibles de ces outils, pour vous permettre de faire votre choix.

Nous avons déjà expliqué notre point de vue sur les comparateurs de solutions ici

Découvrez les différentes fonctionnalités des solutions de data quality

L’objectif est bien d’avoir une donnée documentée, intégrée, automatisée et enrichie, juste et conforme RGPD.

Sécuriser les données à l’entrée où comment couper la tête de l’hydre dès le départ

L’une des premières solutions pour garantir et améliorer la qualité des données, c’est de valider l’entrée de la data dès le formulaire – qui reste un incontournable de l’acquisition de donnée. Il est possible par exemple d’obliger le prospect à renseigner son adresse mail professionnelle, en interdisant les entrées en @gmail.com, @hotmail.fr et ainsi de suite…

Vous pouvez également appliquer une condition de format sur le numéro de téléphone, en fonction du champ du pays ou le lieu de résidence. Et même ajouter une option de liste dans le champ “company” ou “entreprise”, en invitant la personne à saisir les 3 premières lettres de sa société pour faire son choix dans une liste déroulante. Et ainsi éviter les orthographes hasardeuses de la même société : M/L, Merlin/Leonard, MerlinLeonard, Leroy Merlin 😅

Enfin, le Google Recaptcha oblige à saisir un code permet encore de contrôler que le visiteur est bien humain, évitant de gonfler artificiellement votre base avec de la mauvaise donnée.

Mais prenez bien garde à ne pas multiplier à l’infini les contraintes. Vous devez rester prudents et trouver un juste équilibre qui permet d’éviter le taux de rebond, en privilégiant une expérience utilisateur qui soit la plus fluide possible.

Verrouiller les données des listes de valeurs

Verrouiller les données par liste de valeur : bonne idée ou pas ? Excellente solution de contrôle de la data quality, sauf si votre liste de choix ne propose pas toutes les options. 

Attention toutefois à utiliser les mêmes listes de valeurs dans votre CRM et vos outils de marketing automation. Sinon gare à l’accident ! Vous risquez de voir un certain nombre de données rejetées, car incompatibles sur l’une ou l’autre des interfaces utilisées. Assurez-vous donc que chaque système utilise bien le même jeu de valeurs.

Corriger des données erronées en temps réel

Les solutions de data quality permettent également de détecter en temps réel des données erronées. Prenons l’exemple d’une personne qui répond depuis le Royaume-Uni : elle est susceptible de renseigner à la fois United Kingdom, UK ou Great Britain dans le champ “pays”.

L’une des fonctionnalités des solutions de qualité des données, c’est donc de détecter toutes les variations possibles d’une occurrence et de les corriger automatiquement, en privilégiant la dénomination préconfigurée; chez Merlin/Leonard “United Kingdom” par exemple.

Corriger des données erronées en batch

Vous pouvez utiliser la même technique en batch pour corriger les données de votre base en masse. Pour cela, effectuez une passe one shot en utilisant le même système de vérification. Attention, c’est un gros chantier, vous allez devoir vous armer de patience !

Déduire des données à partir d’autres données

La déduction de données est une autre fonctionnalité très intéressante des logiciels de qualité de la donnée. L’objectif est entendu d’améliorer l’expérience utilisateur, en réduisant le nombre de champs à renseigner dans les formulaires.

Prenons un exemple simple, celui de la civilité. A partir du prénom renseigné, votre CRM ou votre solution de marketing automation est capable de prédire si “Jeanne” est un homme ou une femme. En effet, de nombreux prénoms sont teintés masculin ou féminin et votre système peut être capable de trouver la civilité correspondante.

Autre exemple chez Merlin/Leonard : nous déduisons le niveau décisionnaire et le service (Marketing, communication, ventes…) depuis le champ “job title” ce qui évite de le demander.

N’oubliez pas que tout champ en moins est un point de conversion en plus dans votre formulaire. Et c’est la même chose au niveau du CRM chez les commerciaux ! 😉

Enrichir la fiche contact et le compte

Grâce aux solutions de data quality, vous allez également pouvoir enrichir facilement vos fiches contact, à partir d’un petit nombre de données bien renseignées. Vous pouvez trouver de nombreuses informations complémentaires sur la personne à partir de son nom, de son job title, de sa société, de son lien Linkedin.

Ainsi, vous allez pouvoir accéder à des données très qualifiées, à partir d’un formulaire finalement assez rapide qui n’oblige pas le visiteur à renseigner une multitude de champs.

De plus, vous pouvez aussi enrichir vos infos juste à partir de l’email, en mesurant par exemple sa justesse : est-ce un email professionnel ou personnel ? Est-ce un email générique type marketing@merlinleonard.com ? Est-ce un email jetable ou piège ? Etc.

Vous allez ainsi segmenter votre base de données pour assurer une meilleure délivrabilité des messages.

Enfin, vous pouvez aussi chercher d’autres personnes appartenant à la même société que votre contact, à partir de leurs fonctions (c’est l’une des fonctionnalités offerte par Nomination). Vous pouvez alors cartographier les décisionnaires et les équipes d’une société donnée.

Normaliser des adresses, des noms ou des numéros de téléphone

Nous ne nous attarderons pas trop sur ce point, mais la data quality passe aussi par la normalisation de certaines informations :

  • Le format du numéro de téléphone ;
  • Les noms de société en majuscule ;
  • La première lettre du prénom en majuscule ;
  • La suppression des caractères spéciaux.
  • Les adresses postales

Traquer les sources d’acquisition des personnes

Votre logiciel de qualité des données doit aussi vous aider à tracker la provenance de vos leads et à identifier quelles campagnes sont les portes d’entrée vers votre formulaire ou votre solution de marketing conversationnel.

Il est indispensable de mettre en place un sourcing de vos données et de retracer l’origine de chaque campagne d’acquisition. C’est l’une des fonctionnalités faite dans Marketo grâce aux champs Person Source, Acquisition Program et les champs UTM par exemple.

Vous allez ainsi pouvoir identifier facilement : 

  • D’où viennent les leads ;
  • D’où proviennent vos revenus ;
  • Quel partenaire vous ramène du trafic…

Ici encore, la qualité des données collectées permet d’analyser de manière cohérente toutes les portes d’entrée du marketing automation et surtout quelles sont les sources les plus performantes.

Sinon comment pourrez vous répondre à votre Direction qui vous demandera : “Alors, notre événement à 20K, ça a marché?”’

Faire du reporting sur la qualité de données

Grâce aux solutions de data quality, vous avez également la possibilité d’effectuer un reporting sur la qualité des données en identifiant par exemple :

  • Des opportunités ouvertes dont la date de clôture est située dans le passé ;
  • Les comptes facturés sans possibilité de contact en cas de problème de paiement ;
  • Les leads sans source ni programme d’acquisition.

Un des principaux points ‘attention de la Data Quality pour le marketing porte sur le contact. Vous pouvez dans ce cas utiliser un indicateur visuel, type feu tricolore, pour indiquer le niveau de qualité des données collectées sur le contact. La notation va alors se baser sur la complétude de la donnée, sa fraîcheur ou sa justesse. Pratique pour indiquer aux commerciaux s’il faut travailler la donnée ou pas sur ce contact.

3 manières de détecter les doublons avec un logiciel de data quality

  1. Détecter les doublons exacts

La plupart des solutions de data quality proposent nativement cette fonctionnalité sur des champs ou des groupes de champs. Vous pouvez par exemple détecter :

  • Des contacts qui ont le même email ;
  • Des contact dont le full name (nom + prénom) est similaire ;

Mais pour une plus grande efficacité, nous vous conseillons d’effectuer cette détection sur plusieurs groupes de champ comme par exemple :

  1. email
  2. nom + prénom + société.
  3. nom + prénom
  4. nom
  1. Détecter les doublons sur plusieurs critères (clé fonctionnelle)

Les CRM peuvent nativement interdire l’entrée d’une donnée qui aurait la même clé fonctionnelle** qu’un autre groupe de champs qui définit l’unicité d’une personne.

** une clé fonctionnelle est un champ ou un groupe de champs qui va définir l’unicité de votre objet, par exemple le contact.

A vous de choisir quelle est votre “clé”. Cela peut être le cas du combo nom + prénom + société ou tout simplement l’email qui est souvent la clé côté Marketing Automation.

Il n’y a pas de solution magique:

En effet, vous pouvez très bien avoir deux “vraies” personnes avec l’adresse contact@societe.com qui choisissent d’utiliser un email générique pour ne pas partager de données personnelles.  Vous aurez alors deux entrées dans votre CRM avec la même adresse email mais ce seront bien deux personnes différentes qu’il ne faudra pas fusionner.

Et vous pouvez aussi trouver deux homonymes dans la même société qui peuvent, à tort, être considérés comme une seule et même personne.

Cette solution n’est donc pas totalement idéale pour gagner la bataille contre notre hydre multi tête. Il faut utiliser plus d’un sortilège dans notre besace…

  1. Détecter les doublons “fuzzy”

Finalement, c’est peut-être dans l’analyse des chaînes de caractère, à partir d’un score de similitude, que vous trouverez votre salut. 

Prenons un exemple simple : Mr Jean Merlin Lenchanteur est similaire à 95% à Mr Jean Merlin l’Enchanteur

Les systèmes de détection de doublons fuzzy utilisent en fait un algorithme qui s’appuie sur la formule de Jaro Winkler, qui donne un score de similitude à deux chaînes de caractères.

Par exemple une personne qui a renseigné deux fois le formulaire, une fois avec un mail pro et une seconde fois avec son mail perso, aura un score de similitude élevé si vous prenez la chaine Nom + Prénom + Company.

Fusionner automatiquement

Une fois les détections effectuées, nos logiciels de qualité de données peuvent asséner le coup de grâce à l’hydre en fusionnant les différentes entrées de votre base et permettre :

  • De définir qui est le maître et qui est l’esclave. Le maître récupère toutes les données enfants, à savoir les rendez-vous, les activités et les opportunités des différents esclaves ;
  • De choisir, champ par champ, les données à conserver selon différentes règles. Par exemple, chez Cloudingo, vous pouvez choisir de les sélectionner par rapport à l’ancienneté de la création ou de la modification, la complétion ou non, etc.

Découvrez les différentes familles de solutions data quality

Il existe de nombreux logiciels pour contrôler la data quality. Si plusieurs fonctionnalités comme la suppression des données obsolètes, la correction des données, le reporting ou le tracking peuvent être gérées par un CRM ou une solution de marketing automation, certaines tâches nécessitent l’emploi de solutions dédiées.

Où trouvez des idées pour les meilleures solutions Data Quality 

G2 est la plateforme web de référence pour vous aider à choisir le logiciel de qualité des données adapté à vos objectifs et à la taille de votre entreprise. Vous pouvez y retrouver un comparatif complet des solutions de mise en forme et nettoyage des données. Les logiciels sont évalués par la communauté et classés selon un système de score.

G2 propose également un guide complet et des retours de clients pour mieux comprendre ce qu’est la data quality et comment organiser la gestion, le management et le nettoyage de vos données clients.

Le nombre de solutions de data quality ne cesse de croître

Le nombre de  solutions et logiciels dédiés à la data quality est en constante progression selon le Martech 5000, la cartographie des technologies marketing éditée par chiefmartec.com. Les solutions de Data Quality sont réparties dans différents “univers” ci dessous.

martech-landscape-2020-martech5000-slide

https://chiefmartec.com/2020/04/marketing-technology-landscape-2020-martech-5000/

Dur de s’y retrouver…

Les grandes familles de solutions de DQ et les fonctionnalités

Pour vous aider à y voir plus clair, voici les principales familles de solutions de Data Quality et leurs fonctionnalités.

Les fonctionnalités intégrées à votre CRM

Vous pouvez débuter le nettoyage et la qualification de vos données directement à partir de votre CRM. Salesforce, MS Dynamics, E-Deal ou encore Hubspot CRM intègrent de nombreuses fonctionnalités comme par exemple :

  • le verrouillage des listes de valeurs ;
  • la correction des données erronées ;
  • la déduction de données ;
  • la suppression des données obsolètes ;
  • la mesure de la qualité de vos données ;
  • la détection des doublons (simple)

Faire de la data quality avec un logiciel de Marketing Automation

La plupart des solutions de marketing automation comme Marketo, Hubspot, Eloqua, Pardot ou Webmecanik permettent également d’effectuer de nombreuses actions liées à la qualité des données. Parmi les fonctionnalités les plus répandues, on retrouve :

  • la validation des données à l’entrée du formulaire ;
  • la correction des données erronées en temps réel ou en batch ;
  • la tracking des sources d’acquisition ;
  • la suppression des données personnelles obsolètes ;
  • la détection des doublons (simple)

Bon évidemment vous savez lequel on préfère chez Merlin/Leonard.

Les logiciels de préparation et normalisation des données

La préparation et la normalisation des données sont des étapes essentielles pour travailler à partir d’une base de contacts saine et arriver à un haut niveau de data quality. Voici quelques logiciels ou solutions déjà utilisées par Léonard :

  • Ringlead, un des logiciels leader du management de données pour les entreprises. Il permet d’organiser tout son processus de qualité des données.
  • Notre préféré Cloudingo, utilisé chez nous

Les solutions de nettoyage des données

Il est également important de bien nettoyer vos données pour garantir leur qualité. Cette étape essentielle inclut des tâches comme la fusion, la suppression ou l’agrégation des données.

Chez Merlin/Leonard, nous utilisons les workflows de Salesforce pour réaliser pas mal de petites opérations de mise en forme.

Les logiciels d’enrichissement des données

Les solutions d’enrichissement des données concernent à la fois les données de contact et les données de qualification. Elles vont scanner les différentes sources disponibles sur le web et les agréger autour d’un mail, d’une adresse IP ou d’un nom de domaine.

Parmi les logiciels d’enrichissement des données les plus populaires, on trouve notamment :

  • Nomination, la plateforme française spécialisée dans la prospection B2B qui intègre un module data quality pour enrichir les données de contact et d’entreprise.
  • Dropcontact permet de reconnaître une personne à partir de son nom, prénom et site web de l’entreprise et de vous fournir alors l’email pro plus pas mal d’infos personnelles et entreprise.. 
  • Captain Verify, une solution qui corrige et enrichit toutes vos emails afin de préserver votre réputation sur les envois emailing 
  • Clearbit qui permet de récupérer des données qualifiées pour enrichir la fiche d’un lead ou d’un client.

Nous utilisons Dropcontact et Captainverify.

Les solutions de dédoublonnage et déduplication

Le dédoublonnage et la déduplication des données font partie des étapes clés du management de la data quality. La détection et la correction des données dupliquées demande du temps et surtout une solution logicielle performante. Voici quelques exemples :

  • Cloudingo est une des solutions les plus connues pour supprimer les doublons et dédupliquer les données de votre base de prospects.
  • Ringlead est encore une fois dans les solutions reconnues sur le sujet.

Les solutions spéciales pour le RGPD et le consentement

Enfin, vous pouvez également optimiser et normaliser vos données pour le RGPD et le consentement avec la plupart des solutions de marketing automation ou un logiciel de management des cookies et du consentement.

Léonard vous a réparé un petit résumé en image pour visionner les différentes fonctionnalités de ces solutions.


Vous avez des questions sur la gestion des données et la data quality ? Merlin/Leonard peut vous aider à vaincre l’hydre qui menace la qualité de votre base de contacts. N’hésitez pas à nous contacter pour en savoir plus.

Pour discuter de votre chantier data quality, bookez votre rdv gratuit pour une discussion de 30 minutes avec notre expert.

Maitre Blaise

Maître Blaise est le scribe de Merlin et de Leonard. Il écoute à longueur de journée les discussions entre ces deux esprits et retranscrit fidèlement par écrit leurs propos.

À l'agenda