La Data, devenant un atout essentiel de toute activité commerciale, la qualité de la data recueillie, stockée et consommée au cours des processus commerciaux déterminera le succès des activités commerciales d’aujourd’hui et de demain.
Au terme de cet article, nous allons poser la question : Qu’est-ce que la qualité des données ? Nous examinerons l’importance de la qualité des données ; Nous verrons comment améliorer la qualité des données ; Nous décrirons les meilleures pratiques en matière de qualité des données et nous dresserons la liste de quelques bonnes ressources en matière de qualité des données.

Qu’est-ce que la Data Quality ?
Vous pouvez considérer la data (données) comme le fondement d’une hiérarchie où elle constitue le niveau inférieur brut. Au-dessus des données, se trouve l’information, c’est-à-dire des données avec un modèle d’interprétation (contexte). Dans un niveau plus élevé, nous avons la connaissance, c’est-à-dire les informations exploitables, et au niveau supérieur, nous retrouvons la sagesse, c’est-à-dire les connaissances appliquées.
Si vos données sont de mauvaise qualité, les informations ne seront pas de bonne qualité. Avec une mauvaise qualité de l’information, vous manquerez de connaissances exploitables dans les opérations commerciales et vous ne serez pas en mesure d’appliquer ces connaissances, ce qui entraînera des résultats commerciaux risqués.
Il existe de nombreuses définitions de la Data Quality. Les deux principales sont les suivantes :
- La Data est de haute qualité si elle est adaptée à l’objectif d’utilisation prévu.
- La Data est de haute qualité si elle représente correctement la construction du monde réel qu’elle décrit.
Paradoxalement, ces deux définitions peuvent se contredire. Si, par exemple, un enregistrement de données de base d’un client est adapté à l’émission d’une facture et à la réception d’un paiement, il peut être adapté à cette fin. Mais si l’enregistrement des données de base du client est en même temps incomplet ou incorrect pour assurer le service à la clientèle, parce que les données ne décrivent pas complètement ou incorrectement le qui, le quoi et le où de l’entité du monde réel ayant le rôle de client dans cette opération commerciale, nous avons dans ce cas-là un problème au niveau commercial.
En outre, les données de base doivent souvent être adaptées à des objectifs multiples. Vous pouvez y parvenir en assurant l’alignement avec le monde réel. D’un autre côté, il n’est peut-être pas rentable et proportionné de s’efforcer d’obtenir un alignement parfait avec le monde réel et ce, afin d’avoir des données adaptées l’utilisation dans le cadre de d’un objectif commercial. Ainsi, dans la pratique, il s’agit de trouver un équilibre entre ces deux définitions.

Une étude commandée par Experian Data Quality en 2013 a révélé que la principale raison de l’inexactitude des données était les erreurs humaines, avec 59 % des cas ayant été évalués provenaient de cette cause. Éviter ou éventuellement corriger les données de faible qualité causées par des erreurs humaines nécessite un double effort, tout en mettant la bonne combinaison de remèdes portant sur les personnes, les processus et la technologie.
Les autres raisons principales de l’inexactitude des données trouvées dans l’étude mentionnée sont le manque de communication entre les départements (31%) et une stratégie de données inadéquate (24%). La résolution de ces problèmes nécessite une implication passionnée de la direction au plus haut niveau.
L’Importance de la Data Quality :
En général, il n’est pas difficile de mettre tout le monde d’accord dans une entreprise, y compris la direction générale, sur le fait qu’une bonne qualité des données est bonne pour l’entreprise. À l’heure de la transformation numérique, l’intérêt de se concentrer sur la qualité des données est encore plus grand qu’auparavant.
Cependant, lorsqu’il s’agit des questions essentielles de savoir qui est responsable de la qualité des données, qui doit faire quelque chose à ce sujet et qui financera les activités nécessaires, les choses se compliquent.
La qualité des données ressemble à la santé humaine. Il est extrêmement difficile de vérifier avec précision comment un élément de notre régime alimentaire et de notre activité physique peut affecter notre santé. De même, il est extrêmement difficile de tester avec précision comment un élément de nos données peut affecter notre activité.
Néanmoins, de nombreuses expériences nous montrent qu’une mauvaise qualité des données n’est pas très saine pour les entreprises.