Saison 2.16 - 2022 : Le Data Mining pour la prochaine élection présidentielle ?

Article précédent 

Le Data Mining en 2017 et bientôt en 2022

LMP (du nom de ses créateurs, Arthur Muller, Guillaume Liegey et Vincent Pons, aujourd’hui renommée eXplain), start-up française, propose aux partis politiques d'utiliser le Big Data et le Data Mining pour gagner de nouveaux électeurs.

Emmanuel Macron s'est offert ses services pour la présidentielle de 2017.

Guillaume Liegey, Arthur Muller et Vincent Pons, cofondateurs de LMP, se sont rencontrés lors de leurs études à Harvard et au MIT. En 2008, ils participent bénévolement à la campagne de Barack Obama et comprennent l'importance du Big Data et du Data Mining appliqués au militantisme de terrain.

Pour augmenter ses chances lors d'une élection, il faut débusquer les indécis et les abstentionnistes afin de pouvoir leur envoyer les équipes de terrain, celles qui assurent le fameux porte-à-porte. «Fini l'ère des gourous de la com. Les campagnes sont de plus en plus scientifiques», affirme Guillaume Liegey, l'un des cofondateurs de LMP. Cette start-up optimise le démarchage électoral grâce au Big Data. En croisant les données de l'Insee (catégorie socioprofessionnelle des habitants, âge... ) et les résultats des derniers scrutins, son logiciel, 50 + 1, repère, à l'échelle des bureaux de vote, les secteurs où un candidat a le plus de chances de gagner des voix. Le programme utilise l'algorithme d'inférence écologique du statisticien américain Gary King*, qui agrège des données pour en déduire des comportements.

En 2008, Obama a été précurseur et a utilisé dans sa campagne présidentielle les Big Data avec deux objectifs : mieux connaitre l’historique du comportement des votants  et cibler ainsi plus efficacement les opérations électorales sur internet et sur le terrain. C’est l’apparition de deux approches nouvelles et complémentaires, que sont l’usage des réseaux sociaux et l’exploitation des Big Data. En croisant les informations comprenant l’âge, la typologie socio-professionnelle, le profil de consommateur, ou encore l’engagement civique des 240 millions d’Américains en âge de voter, la campagne d’Obama a pu déterminer les intentions de vote, les quartiers et zones géographiques où militer avec précision.

Le Data Mining au service des candidats

Le concept séduit : les trois fondateurs de LMP ont fait la campagne de François Hollande en 2012. En identifiant 20.000 bureaux où les résultats pouvaient basculer, ils lui auraient fait gagner 0,6 point.

Pour information, en 2002, l’écart de voix au premier tour entre Jean-Marie Le Pen et Lionel Jospin était de 195 000 voix, et, en 2007, l’écart de voix au deuxième tour entre Nicolas Sarkozy et Ségolène Royal était de 2,2 millions de voix. Chaque dixième de point compte pour être élu à la présidentielle comme pour toutes autres élections ! Le Data Mining est un formidable levier de succès pour les candidats. 

En 2010, LMP persuade le socialiste Jean-Paul Huchon de tester leur logiciel lors des régionales en Ile-de-France. «Nous avons pu ainsi passer de la théorie à la pratique et prouver que nos algorithmes fonctionnaient», raconte Guillaume Liegey. 

Pour l'élection de 2017, Emmanuel Macron s'est donc offert leurs services. Au  poste de ministre de l’Economie, il avait lancé durant l’été 2016 une Grande Marche (un questionnaire réalisé par LMP et analysé par Proxem) pour collecter des données sur plus de 100 000 français volontaires afin d’identifier les problèmes concrets et les préoccupations de certaines catégories socio-professionnelles. Le programme d’E. Macron était alors avant tout un algorithme, qu’il qualifiait plutôt de « diagnostic ».

 Le prix de la communication

Emmanuel Macron est le candidat qui a le plus investi financièrement pour sa campagne en 2017. Au total, sa campagne a englouti 16,8 millions d’euros, la communication arrivant en tête des postes de dépenses, comme chez les autres candidats. Rien que pour sa promo téléphonique (sms et appels), Emmanuel Macron a dépensé 396.443 euros. Mais la “com” ne serait rien sans de bons conseillers, aussi appelés spin doctor. Pour les conseils en communication, celui qui allait devenir le président de la République a déboursé 219.780 euros.

Nous sommes loin des 750 millions de dollars dépensés par Barack Obama contre les 350 millions de dollars dépensés par John McCain.

Les électeurs à conquérir

Il y a d’abord les non-inscrits. La proportion de personnes non-inscrites sur les listes électorales est plus faible en France qu’aux Etats-Unis, mais reste importante. En effet, alors qu’aux Etats-Unis elle était estimée en 2008 entre 25 et 30%, en France elle était évaluée en 2006 à 9% de l’électorat, soit environ 4 millions de personnes.

Evidemment, les 4 millions de non-inscrits français ne sont pas tous des électeurs potentiels. Les études permettant d’évaluer les raisons de non-inscription sur listes électorales montrent que si 29% des non-inscrits, soit 1,2 million de personnes, sont dans cette situation pour avoir oublié d'effectuer les démarches (24%) ou faute de les connaître (5%), la majorité ne l’est pas par manque de confiance dans les élus (24%), sentiment d’inutilité du vote (23%), ou désintérêt pour la politique (13%). Les moins de 35 ans sont nettement sur représentés parmi les non-inscrits (on estime à 17% le taux de non-inscription dans cette classe d’âge, contre 9% en moyenne). Il existe donc dans ce domaine des marges de manœuvres, réduites mais non négligeables, pour les candidats : 1,2 million de personnes pourrait être inscrit par l’intermédiaire de démarches volontaristes. Une contrainte néanmoins doit être prise en compte : les inscriptions doivent être enregistrées avant le 31 décembre, il n’est pas possible de s’inscrire jusqu’au jour de l’élection (contrairement aux Etats-Unis).

Il y a ensuite les abstentionnistes. Toutefois, l’élection présidentielle de 2002, lors de laquelle l’abstention a atteint au premier tour un score historique (28,4%, soit 11 millions d’électeurs), a montré qu’il ne fallait pas pour autant négliger de mobiliser les « électeurs acquis » pour aller voter. La participation tout aussi historique de 2007 (la plus élevée depuis 1974) a rappelé que des candidatures renouvelées, le sentiment que l’enjeu est important pour le pays et une campagne intense sont les meilleures garanties d’une participation électorale élevée. Malgré tout, on peut estimer autour de 5% le pourcentage d’électeurs sporadiques susceptibles d’être « rappelés à l’ordre électoral » par une campagne ciblée – soit 2 millions d’électeurs.

Au total (non-inscrits et abstentionnistes), il y a donc une réserve de voix « sporadiques » de l’ordre de 3 millions, à répartir à droite et à gauche.

Et sur le terrain des élections municipales de 2020 ?

Une dizaine de jeunes entreprises de la Civitech se partagent aujourd’hui le marché des municipales en France. Si à Paris, Anne Hidalgo a fait le choix de travailler avec Cap Collectif et eXplain, Benjamin Griveaux a préféré choisir Décidim et Quorum avant d’abandonner la course aux municipales. Mais quelle que soit la spécialité de ces différentes startups, toutes fonctionnent sur le même principe, en plusieurs phases.

Dans un premier temps, il s’agit de construire son programme. Pour cela, les équipes de campagnes font appel à des plateformes de démocratie participative qui permettent la prise de décisions collective autour des sujets d’intérêt général. Les réponses émanent notamment de citoyens qui n’auraient pas franchi le seuil d’une réunion publique.

Dans un second temps intervient la phase de l’organisation de la campagne. Si l’exploitation des data permet de localiser les réserves de voix, elle permet également de gérer les équipes de militants. Grâce à une application mobile, la collecte des données est facilitée, ce qui permet de structurer le travail et de remonter les informations du terrain plus rapidement.

L’usage des Big Data en France est possible, à condition que les données traitées ne soient pas des données de vie mais des données dites « hyperlocales ».

Si en France, la campagne reste aux mains des militants, l’Intelligence Artificielle pourrait dans quelques années changer la donne. Le centre de recherche d’IBM à Haïfa (Israël) pilote un programme sur le traitement du langage qui serait apte à produire des éléments d’argumentation et donc débattre avec des humains. Cet outil serait alors capable d’aider les équipes de campagnes à être bien plus efficaces or, comme le dirait Benjamin Franklin, « Time is money ».

Et l’élection présidentielle de 2022 ?

Le Data Mining et le Big Data pour les élections de 2022 me semble incontournables, quelques soient les candidats. Qui va en tirer avantage ?

Sources : MODERNISER LA VIE POLITIQUE : INNOVATIONS AMERICAINES, LEÇONS POUR LA FRANCE – Terra Nova Janvier 2009. 

Article de Maéva Chanut - IAE Poitiers 10 juin 2020. 

Blog personnel de Lyes Meghara - 3 novembre 2019

Gary King*, est un politologue et un statisticien américain. Il est notamment connu pour ses contributions méthodologiques à la science politique quantitative. Il est professeur de sciences politiques à l’université Harvard, il est notamment célèbre pour ses recherches sur l’inférence écologique.

Article suivant 

 

Commentaires

Posts les plus consultés de ce blog

Saison 4.4 - Les Chroniques BI sont publiées !

Saison 4.3 - 2022 : Les 50 ans STID à Vannes

Saison 4.1 - 2015 : Embauche chez B&D