Site conçu par l’Adetem, avec le soutien du Ministère de l’Economie, de l’Industrie et de l’Emploi - Direction générale de la compétitivité, de l'industrie et des services (DGCIS)






Le blog c’est ici !

Constitution de la base de données

Votre entreprise et son environnement regorgent de données, mais les regrouper et les organiser n’est pas toujours facile.

L’essentiel est que dans une base de données relationnelle, les données se doivent d’être uniques, complètes et exactes.

L’unicité est nécessaire par exemple pour éviter d’adresser plusieurs courriers identiques au même prospect ou simplement pour pouvoir répondre à une question aussi simple que « combien avons-nous de clients ? », etc.

Mais assurer cette unicité peut s’avérer plus compliquée qu’il n’y parait. Prenons par exemple, un fichier constitué à partir de différentes sources.  Dans le fichier, on trouve :

- M. J-P Durand, 2 Avenue du Pont, 93360 Neuilly

- Monsieur Jean-Pierre Durant, 2bis Av.Dupont, 93360 Neuilly-Plaissance

Si pour un être humain, il est facile de se douter que c’est en fait la même personne, pour un système informatique ce n’est pas du tout évident !  Les techniques de déduplication seront donc plus ou moins sophistiquées.  Plus les données seront nombreuses et séparées, plus il sera facile de réaliser le travail de déduplication.  Par exemple, si votre formulaire de collecte prévoyait un seul champ nom & prénom au lieu de deux, des cas comme « Thierry Antoine » et « Antoine Thierry » peuvent s’avérer difficiles à trancher.

Certaines données sont intrinsèquement à caractère unique, ce qui facilite l’identification. Prenez par exemple un numéro de TVA, pas à 100% unique dans un groupe de sociétés, mais bonne clé pour identifier une entité juridique. Un email est bien moins « variable » qu’une adresse postale, mais un bon nombre d’internautes ont plusieurs adresses email, etc.

De plus, il existe des règles de gestions spécifiques à chaque action. Pour une action de prospection, vous pouvez décider d’éliminer les cas pour lesquels il y a un doute (ex : une seule lettre de différence) ou au contraire décider de ne rien faire en cas de doute, au risque de laisser certains doubles dans la base de données.

La complétude des données est vitale pour pouvoir communiquer correctement quand il s’agit de données exploitées pour la communication (ex : code sexe qui permet la personnalisation « Cher Monsieur / Chère Madame »). C’est aussi  le cas pour que les conclusions des analyses soient exactes (Ex : si seules 30% des dates de naissance sont remplies, peut-on conclure avec certitude l’âge moyen des clients ?). Si certaines données sont absentes, il sera parfois difficile, voir impossible, de réaliser une déduplication et assurer l’unicité des données dans la base. Comme doubles =  erreurs et surcoûts, le fait d’avoir des données complètes n’est jamais neutre.

L’exactitude des données peut également avoir un impact non négligeable sur les coûts de communication, cela en raison des retours postaux, mais aussi sur les conclusions des analyses qui pourraient amener à prendre de mauvaises décisions.

  1.    L’identification des sources de données existantes et nécessaires

  2.     La conception d’un modèle de base de données relationnelle correspondant à vos besoins

  3.     L’extraction des données sources et leur chargement dans la base de données cible

  4.     La  validation et mise à jour des données chargées   

Dans ce processus, ayez les idées larges lors de l’identification des sources possibles disponibles dans l’entreprise

  -  Les anciens devis non transformés ne sont-ils pas une source de prospects ?

  -  Les cartes de visites des personnes rencontrées lors des foires et salons ont-elles bien été saisies ou dorment-elles dans les tiroirs ?

  -  Existe-il des annuaires des entreprises du secteur visé ?

  -  Les données collectées par le formulaire de contact de votre site sont-elles bien entrées dans la base de données ?

  -  Les prospects ou clients qui vous ont envoyé une demande par email ont-il laissé une trace dans la base de données ?

  -  Etc, etc.

Lors du chargement dans la base de données, outre la déduplication, n’oubliez pas non plus de transformer les données qui n’auraient pas la même codification. Exemple un code sexe, codé dans un fichier 1=Masculin, 2=Féminin, 3=Inconu et ‘M’ / ‘F’ dans l’autre.

N’oubliez pas que la constitution d’une base de données de personnes (tant contacts professionnels que particuliers) doit faire l’objet d’une déclaration à la CNIL (Commission Nationale Informatique et Liberté)
Pour en savoir plus, consultez nos liens!

Mots clés :


Base de données
sources
unicité
déduplication
 
Mentions légales