Saison 2.2 - 1999 : La Bi 2ème génération : l'arrivée du Data Mining

 

Article précédent 

Alann profita de la première promenade avec son  grand père, direction la plage de Toulindac, pour revenir sur l’article du Monde Informatique de février 1998 concernant les orpailleurs.

- Dis-moi un peu ce que signifie cet article ! Je n’ai pas compris le rapport entre l’orpaillage et la Business Intelligence !

- Mais si, mais si, tu vas comprendre !

En fait d’orpaillage (mot utilisé par le journaliste du Monde Informatique, vocabulaire pour marquer l’esprit du lecteur) nous allons plutôt parler, à cette époque, de Data Mining.

Data Mining, traduction : exploration de données, forage de données, fouille de données, comme tu préfères.

Les projets BI ont permis de construire dans les entreprises des bases de données décisionnelles gigantesques avec un répertoire unique de données permettant de fournir une vision cohérente et actualisée des activités.

Prenons un exemple : les opérateurs de télécommunication.

A cette époque, le secteur des télécoms était en pleine ébullition, ouverture à la concurrence du marché européen de la téléphonie fixe et arrivée de la téléphonie mobile (SFR, Bouygues Télécom,, ..). Le sujet du moment pour les directions marketing de chacun de ces opérateurs était l’analyse du churn (départ pour la concurrence)  (Note d’Alann : Churn signifie “agiter vigoureusement” en anglais alors que “attrition” fait référence à l’usure. Le taux de churn évoque donc plutôt le mouvement et le turn-over, alors que l’attrition renvoie à une forme d’érosion.) des clients  particuliers, professionnels ou entreprises.

Pourquoi ?

Raison principale : le coût d’acquisition d’un client en téléphonique mobile dépassait deux cent euros.

Deuxième raison : la volatilité des clients, plus d’un million d’utilisateurs en moyenne changeaient d’opérateur chaque année. Il s’agissait de trouver rapidement un moyen de les fidéliser pour optimiser le modèle business.

Imagine une base de données contenant toutes les informations du client stockées au même endroit. Les données de niveau “client” : adresse, sexe, type d’habitat, données géomarketing et environnementales; les données de niveau “abonnement” : date de début de l’abonnement, date de fin de l’abonnement, motif de résiliation, options tarifaires (forfait, local); les données de niveau “facture” : date et montant de la facture, délai de règlement, durée totale des appels, nombre d’appels, nombre de correspondants différents, durée moyenne et fréquence d’appel par correspondant; et les données de niveau “communication” : numéro appelant, numéro appelé, date et heure de début et de fin de la communication, durée de la communication, ... Et tout ceci avec une dimension temps, les gisements de ces données permettaient de stocker l’historique complet du comportement de chaque client depuis l’ouverture de la ligne téléphonique pour celui-ci.

Laboratoire de données fantastique pour effectuer une analyse du churn permettant de comprendre le comportement des clients, de calculer le risque de les voir changer d’opérateur et d’anticiper les actions à prévoir pour éviter ce départ. Cette analyse sera possible grâce aux techniques de data mining. 

Et pour compléter mon propos, je vais te donner la définition du data mining extraite d’un excellent livre écrit par Stéphane Tuffery en 2010 (Data Mining et statistique décisionnelle Editions Technip). Je t’invite à te plonger dans ce livre de 700 pages pour te faire toucher du doigt la richesse et la complexité de cette discipline  :

Le data mining ou “fouille de données” est l’ensemble des méthodes et techniques destinées à l’exploration et l’analyse de (souvent grandes) bases de données informatiques, de façon automatique ou semi-automatique, en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l’essentiel de l’information utile tout en réduisant la quantité des données.

En bref, le data mining est l’art d’extraire des informations, voire des connaissances, à partir des données.

Le data mining est soit descriptif, soit prédictif : les techniques descriptives (ou exploratoires) visent à mettre en évidence des informations présentes mais enfouies sous le volume des données; les techniques prédictives (ou explicatives) visent à extrapoler de nouvelles informations à partir des informations présentes, ces nouvelles informations pouvant être qualitatives (classement ou scoring) ou quantitatives (prédiction).

Nous entrons dans le royaume de la statistique, et pas seulement la statistique descriptive, il s’agit de statistique qui touche l’analyse factorielle, la classification automatique, l’analyse discriminante et bien d’autres techniques. Je ne peux pas t’en dire plus car ce n’était pas mon domaine de compétences.

Tous les secteurs de l’économie vont être touchés par le data mining à tel point que nous allons manquer très vite de compétences sur le marché de l’emploi. Mon entrée dans l’Université de Bretagne Sud à Vannes me fera comprendre le défi à relever des instituts de formation pour combler cette lacune.

La banque de détail, la grande distribution, l’industrie automobile, la vente par correspondance, le secteur médical, l’industrie agroalimentaire, pour citer quelques secteurs, vont utiliser avec délectation le data mining à partir de cette période. Nous quittons les domaines traditionnels où se cantonnaient le data mining et la statistique : les études de laboratoire, les expériences cliniques, l’actuariat, l’analyse de risque. Le data mining sera le produit phare des directions marketing friantes d’analyses de comportement client à partir de leurs bases de données volumineuses, toujours plus nombreuses et toujours plus rapides. En 1995 France Telecom réalisait deux campagnes marketing de masse par an; en 2005, dix ans plus tard, SFR le concurrent direct, réalisait des dixaines de campagnes marketing ciblées par jour !!

Changement de pratiques, changement d’époque.

Et nous étions au coeur du système, emportés par cette déferlante !!

Alann avait enfin un début de réponse à sa question, il n’avait pas tout compris, surtout concernant le domaine de la statistique,  mais il avait bien senti l’importance de l’impact de ce fameux “orpaillage” en 1999. Papy l’avait convaincu de poursuivre sa quête grâce à son enthousiasme et à ses premières explications. Le livre mentionné lors de la discussion allait l’aider dans sa compréhension du sujet.

Article suivant 

Commentaires

Posts les plus consultés de ce blog

Saison 4.4 - Les Chroniques BI sont publiées !

Saison 4.3 - 2022 : Les 50 ans STID à Vannes

Saison 4.1 - 2015 : Embauche chez B&D