menu

Data Quality : mieux comprendre les différentes solutions et leurs fonctionnalités

Publié le 30 mars 2021 par Maitre Blaise
Temps de lecture : 15 minutes

Pour combattre un hydre à plusieurs têtes, il est indispensable de bien choisir ses armes afin d’être certain de remporter la partie. Et dans ce combat que vous devez remporter, l’importance de maîtriser toutes les fonctionnalités des solutions de data quality est essentielle !

Attention cher lecteur, ceci n’est pas un comparatif de logiciel de qualité des données. Si vous êtes arrivés jusqu’ici, c’est que vous avez déjà fait le tour de tous les sujets du genre et que vous avez consulté des dizaines de pages consacrées à ces solutions.

Sans prétention, voici un listing non-exhaustif de tous les logiciels comme G2 ou Gartner. Nous allons juste détailler ensemble les grandes applications possibles de ces outils, pour vous permettre de faire votre choix.

Nous avons déjà expliqué notre point de vue sur les comparateurs de solutions ici

Découvrez les différentes fonctionnalités des solutions de data quality

Sécuriser les données à l’entrée où comment couper la tête de l’hydre dès le départ

L’une des premières solutions pour garantir la qualité des données, c’est de valider l’entrée de la data dès le formulaire. Il est possible par exemple obliger le prospect à renseigner son adresse mail professionnelle, en interdisant les entrées en @gmail.com, @hotmail.fr et ainsi de suite…

Vous pouvez également appliquer une condition de format sur le numéro de téléphone, le champ du pays ou le lieu de résidence. Et même ajouter une option de liste dans le champ “company” ou “entreprise”, en invitant la personne à saisir les 3 premières lettres de sa société pour faire son choix dans une liste déroulante.

Enfin, le Google Recaptcha oblige à saisir un code permet encore de contrôler la data quality entrante. Mais prenez bien garde à ne pas multiplier à l’infini les contraintes. Vous devez rester prudents et trouver un juste équilibre qui permet d’éviter le taux de rebond, en privilégiant une expérience utilisateur qui soit la plus fluide possible.

Verrouiller les données des listes de valeurs

Verrouiller les données par liste de valeur : bonne idée ou pas ? Excellente solution de contrôle de la data quality, sauf si votre liste de choix ne propose pas toutes les options. 

Attention toutefois à utiliser les mêmes listes de valeurs dans votre CRM et vos outils de marketing automation. Sinon gare à l’accident ! Vous risquez de voir un certain nombre de données rejetées, car incompatibles sur l’une ou l’autre des interfaces utilisées. Assurez-vous donc que chaque système utilise bien le même jeu de valeurs.

Corriger des données erronées en temps réel

Les solutions de data quality permettent également de détecter en temps réel des données erronées. Prenons l’exemple d’une personne qui répond depuis le Royaume-Uni, elle est susceptible de renseigner à la fois United Kingdom, UK ou Great Britain dans le champ “pays”.

L’une des fonctionnalités des solutions de qualité des données, c’est donc de détecter toutes les variations possibles d’une occurrence et de les corriger automatiquement, en privilégiant la dénomination préconfigurée.

Corriger des données erronées en batch

Vous pouvez utiliser la même technique en batch pour corriger les données de votre base en masse. Pour cela, effectuez une passe one shot en utilisant le même système de vérification. Attention, c’est un gros chantier, vous allez devoir vous armer de patience !

Déduire des données à partir d’autres données

La déduction de données est une autre fonctionnalité très intéressante des logiciels de qualité de la donnée. L’objectif est entendu d’améliorer l’expérience utilisateur, en réduisant le nombre de champs à renseigner.

Prenons un exemple simple, celui de la civilité. A partir du prénom renseigné, votre CRM ou votre solution de marketing automation est capable de prédire si Céline est un homme ou une femme. En effet, de nombreux prénoms sont teintés masculin ou féminin et votre système peut être capable de trouver la civilité correspondante.

Autre exemple chez Merlin/Leonard : nous déduisons le niveau décisionnaire et le service depuis le champ “job title” ce qui évite de le demander.

N’oubliez pas que tout champ en moins est un point de conversion en plus dans votre formulaire. Et c’est la même chose au niveau du CRM chez les commerciaux ! 😉

Enrichir la fiche contact et le compte

Grâce aux solutions de data quality, vous allez également pouvoir enrichir facilement vos fiches contact, à partir d’un petit nombre de données bien renseignées. Vous pouvez trouver de nombreuses informations complémentaires sur la personne à partir de son nom, de son job title, de sa société, de son lien Linkedin.

Ainsi, vous allez pouvoir accéder à des données très qualifiées, à partir d’un formulaire finalement assez rapide qui n’oblige pas le visiteur à renseigner une multitude de champs.

De plus, vous pouvez aussi enrichir vos infos juste à partir de l’email, en mesurant par exemple sa justesse : est-ce un email professionnel ou personnel ? Est-ce un email générique type marketing@merlinleonard.com ? Est-ce un email jetable ou piège ? Etc.

Vous allez ainsi segmenter votre base de données pour assurer une meilleure délivrabilité des messages.

Enfin, vous pouvez aussi chercher d’autres personnes appartenant à la même société que votre contact, à partir de leurs fonctions (c’est l’une des fonctionnalités offerte par Nomination). Vous pouvez alors cartographier les décisionnaires et les équipes d’une société donnée.

Normaliser des adresses, des noms ou des numéros de téléphone

Nous ne nous attarderons pas trop sur ce point, mais la data quality passe aussi par la normalisation de certaines informations :

  • Le format du numéro de téléphone ;
  • Les noms de société en majuscule ;
  • La première lettre du prénom en majuscule ;
  • La suppression des caractères spéciaux.

Traquer les sources d’acquisition des personnes

Votre logiciel de qualité des données aide aussi à tracker la provenance de vos leads et à identifier quelles campagnes sont les portes d’entrée vers votre formulaire ou votre solution de marketing conversationnel.

Il est indispensable de mettre en place un sourcing de vos données et de retracer l’origine de chaque campagne d’acquisition. C’est l’une des fonctionnalités faite dans Marketo grâce aux champs Person Source, Acquisition Program et les champs UTM par exemple.

Vous allez ainsi pouvoir identifier facilement : 

  • D’où viennent les leads ;
  • D’où proviennent vos revenus ;
  • Quel partenaire vous ramène du trafic…

Ici encore, la qualité des données collectées permet d’analyser de manière cohérente toutes les portes d’entrée du marketing automation et surtout quelles sont les sources les plus performantes.

Sinon comment pourrez vous répondre à votre Direction qui vous demandera : “Alors, notre événement à 20K, ça a marché?”’

Faire du reporting sur la qualité de données

Grâce aux solutions de data quality, vous avez également la possibilité d’effectuer un reporting sur la qualité des données en identifiant par exemple :

  • Des opportunités ouvertes dont la date de clôture est située dans le passé ;
  • Les comptes facturés sans possibilité de contact en cas de problème de paiement ;
  • Les leads sans source ni programme d’acquisition.

Vous pouvez également utiliser un indicateur visuel, type feu tricolore, pour indiquer le niveau de qualité des données collectées. La notation va alors se baser sur la complétude de la donnée, sa fraîcheur ou sa justesse.

3 manières de détecter les doublons avec un logiciel de data quality

  1. Détecter les doublons exacts

La plupart des solutions de data quality proposent nativement cette fonctionnalité sur des champs ou des groupes de champs. Vous pouvez par exemple détecter :

  • Des contacts qui ont le même email ;
  • Des contact dont le full name (nom + prénom) est similaire ;

Mais pour une plus grande efficacité, nous vous conseillons d’effectuer cette détection sur un groupe de champ comme par exemple nom + prénom + société

  1. Détecter les doublons sur plusieurs critères (clé fonctionnelle)

Les CRM peuvent nativement interdire l’entrée d’une donnée qui aurait la même clé fonctionnelle qu’un autre groupe de champs qui définit l’unicité d’une personne. 

A vous de choisir quelle est votre “clé”. Cela peut être le cas du combo nom + prénom + société ou tout simplement l’email qui est souvent la clé côté Marketing Automation.

Il n’y a pas de solution magique: en effet, vous pouvez très bien avoir deux personnes avec l’adresse contact@societe.com qui choisissent d’utiliser un email générique pour ne pas partager de données personnelles.  

Et vous pouvez aussi trouver deux homonymes dans la même société qui peuvent, à tort, être considérés comme une seule et même personne.

Cette solution n’est donc pas totalement idéale pour gagner la bataille contre notre hydre multi tête. Il a plus d’un sortilège dans sa besace…

  1. Détecter les doublons “fuzzy”

Finalement, c’est peut-être dans l’analyse des chaînes de caractère, à partir d’un score de similitude, que vous trouverez votre salut. 

Prenons un exemple simple : Mr Jean Merlin Lenchanteur est similaire à 95% à Mr Jean Merlin l’Enchanteur

Les systèmes de détection de doublons fuzzy utilisent en fait un algorithme qui s’appuie sur la formule de Jaro Winkler, en incluant des critères qui permettent une analyse plus fine et plus profonde. Par exemple une personne qui a renseigné deux fois le formulaire, une fois avec un mail pro et une seconde fois avec son mail perso.

Fusionner automatiquement

Une fois les détections effectuées, nos logiciels de qualité de données peuvent asséner le coup de grâce à l’hydre en fusionnant les différentes entrées de votre base et permettre :

  • De définir qui est le maître et qui est l’esclave. Le maître récupère toutes les données enfants, à savoir les rendez-vous, les activités et les opportunités des différents esclaves ;
  • De choisir, champ par champ, les données à conserver selon différentes règles. Par exemple, chez Cloudingo, vous pouvez choisir de les sélectionner par rapport à l’ancienneté de la création ou de la modification, la complétion ou non, etc.

Découvrez les différentes familles de solutions data quality

Il existe de nombreux logiciels pour contrôler la data quality. Si plusieurs fonctionnalités comme la suppression des données obsolètes, la correction des données, le reporting ou le tracking peuvent être gérées par un CRM ou une solution de marketing automation, certaines tâches nécessitent l’emploi de solutions dédiées.

Où trouvez des idées pour les meilleures solutions Data Quality 

G2 est la plateforme web de référence pour vous aider à choisir le logiciel de qualité des données adapté à vos objectifs et à la taille de votre entreprise. Vous pouvez y retrouver un comparatif complet des solutions de mise en forme et nettoyage des données. Les logiciels sont évalués par la communauté et classés selon un système de score.

G2 propose également un guide complet pour mieux comprendre ce qu’est la data quality et comment organiser la gestion, le management et le nettoyage de vos données clients.

Le nombre de solutions de data quality ne cesse de croître

Le nombre de  solutions et logiciels dédiés à la data quality est en constante progression selon le Martech 5000, la cartographie des technologies marketing éditée par chiefmartec.com. 

https://chiefmartec.com/2020/04/marketing-technology-landscape-2020-martech-5000/ avec zoom sur la partie DQ

Les grandes familles de solutions de DQ et les fonctionnalités

Pour vous aider à y voir plus clair, voici les principales familles de solutions de Data Quality et leurs fonctionnalités.

Les fonctionnalités intégrées à votre CRM

Vous pouvez débuter le nettoyage et la qualification de vos données directement à partir de votre CRM. Salesforce, MS Dynamics, E-Deal ou encore Hubspot CRM intègrent de nombreuses fonctionnalités comme par exemple :

  • le verrouillage des listes de valeurs ;
  • la correction des données erronées ;
  • la déduction de données ;
  • la suppression des données obsolètes ;
  • la mesure de la qualité de vos données ;
  • la détection des doublons.

Faire de la data quality avec un logiciel de Marketing Automation

La plupart des solutions de marketing automation comme Marketo, Hubspot, Eloqua, Pardot ou Webmecanik permettent également d’effectuer de nombreuses actions liées à la qualité des données. Parmi les fonctionnalités les plus répandues, on retrouve :

  • la validation des données à l’entrée ;
  • la correction des données erronées ;
  • la tracking des sources d’acquisition ;
  • la suppression des données personnelles obsolètes ;
  • la détection des doublons.

Les logiciels de préparation et normalisation des données

La préparation et la normalisation des données sont des étapes essentielles pour travailler à partir d’une base de contacts saine et arriver à un haut niveau de data quality. Voici quelques logiciels ou solutions à utiliser lors de cette étape :

  • Ringlead, le logiciel leader du management de données pour les entreprises. Il permet d’organiser tout son processus de qualité des données.
  • Openprise, une solution qui permet de nettoyer, d’enrichir et d’unifier les données clients.

Les solutions de nettoyage des données

Il est également important de bien nettoyer vos données pour garantir leur qualité. Cette étape essentielle inclut des tâches comme la fusion, la suppression ou l’agrégation des données. Plusieurs logiciels de data quality permettent de finaliser cette étape :

  • DQE Software propose de nombreuses solutions de Data Quality qui aident à vérifier, normaliser et nettoyer vos données.
  • Winpure est l’outil de data cleaning le plus populaire et permet d’effectuer la plupart des actions de nettoyage. 

Les logiciels d’enrichissement des données

Les solutions d’enrichissement des données concernent à la fois les données de contact et les données de qualification. Elles vont scanner les différentes sources disponibles sur le web et les agréger autour d’un mail, d’une adresse IP ou d’un nom de domaine.

Parmi les logiciels d’enrichissement des données les plus populaires, on trouve notamment :

  • Nomination, la plateforme française spécialisée dans la prospection B2B qui intègre un module data quality pour enrichir les données de contact et d’entreprise.
  • Dropcontact qui permet de fusionner et d’enrichir des fichiers de contacts pour créer une base unique. 
  • Captain Verify, une solution qui corrige et enrichit toutes vos données à travers différentes étapes de validation et de qualification. 
  • Clearbit qui permet de récupérer des données qualifiées pour enrichir la fiche d’un lead ou d’un client.

Les solutions de dédoublonnage et déduplication

Le dédoublonnage et la déduplication des données font partie des étapes clés du management de la data quality. La détection et la correction des données dupliquées demande du temps et surtout une solution logicielle performante. Voici quelques exemples :

  • Cloudingo est une des solutions les plus connues pour supprimer les doublons et dédupliquer les données de votre base de prospects.
  • Chez DQE Software, la solution Saas DQE DEDUP permet de dédoublonner facilement sa base de données clients.

Les solutions spéciales pour le RGPD et le consentement

Enfin, vous pouvez également optimiser et normaliser vos données pour le RGPD et le consentement avec la plupart des solutions de marketing automation ou un logiciel de management des cookies et du consentement.

Léonard vous a réparé un petit résumé en image pour visionner les différentes fonctionnalités de ces solutions.

Data-Quality-Matrice-Fonctionnalités-_-Solutions-Data-Quality-a4
Data-Quality-Matrice-Fonctionnalités-_-Solutions-Data-Quality

Vous avez des questions sur la gestion des données et la data quality ? Merlin/Leonard peut vous aider à vaincre l’hydre qui menace la qualité de votre base de contacts. N’hésitez pas à nous contacter pour en savoir plus.

Pour discuter de votre chantier data quality, bookez votre rdv gratuit pour une discussion de 30 minutes avec notre expert.

Maitre Blaise

Maître Blaise est le scribe de Merlin et de Leonard. Il écoute à longueur de journée les discussions entre ces deux esprits et retranscrit fidèlement par écrit leurs propos.

À l'agenda