Saison 2.15 - 2007 : Le Data Mining : innovation de la campagne d'Obama

 


Article précédent
 

Article largement inspiré d’un Rapport de la mission d’étude de Terra Nova
sur les techniques de campagne américaines :

Moderniser la vie politique
Innovations américaines, leçons pour la France  Janvier 2009

L’élection de Barack Obama à la présidence des Etats-Unis, le 4 novembre 2008, représente un formidable renouvellement de la démocratie américaine.

Le scrutin est remporté par Barack Obama, qui obtient 52,9 % des suffrages contre 45,7 % pour John McCain. Les résultats officiels, annoncés par le Congrès, donnent 365 grands électeurs à Barack Obama et 173 à John McCain.

Il s’agit aussi d’un renouvellement des pratiques : lors de sa campagne, Barack Obama s’est appuyé sur une série d’innovations majeures. Nous allons nous intéresser tout particulièrement à l’utilisation des bases de données et des techniques de modélisation issues du Data Mining.

Les bases de données – la rupture orwellienne

Barack Obama a réussi le rêve orwellien de tout candidat américain : ficher l’intégralité du pays. L’une des grandes innovations de la campagne présidentielle 2008 réside en effet dans la sophistication et la maîtrise croissante de multiples outils de connaissance des électeurs : base de données, sondages, modélisation des comportements électoraux.                  

En matière de données sur les électeurs, les républicains ont pendant longtemps détenu un avantage sur les démocrates. En effet, ils disposaient, depuis 15 ans, d’une base de données importante et unifiée au niveau national, appelée Voter Vault. Cette base a été constituée grâce à deux types de données : d’une part, celles recueillies par le démarchage électoral (pour 30% de l’ensemble des données) et, d’autre part, le « cross-referencing », c'est-à-dire le recoupage des données issues de bases de données commerciales (abonnements à des magazines, achats opérés par carte bleue, etc.), ou associatives (la National Rifle Association est, par exemple, un des principaux pourvoyeurs de données des républicains).

La consolidation systématique des fichiers de toutes origines (politiques, commerciales, électorales) a un nom : le micro-targeting. Il fournit des données individualisées et permet ainsi un ciblage individualisé.

En 2008, les membres de la campagne de Barack Obama ont ainsi pu bénéficier de données provenant de deux sources principales : celles recueillies directement au cours de la campagne et celles achetées à une entreprise spécialisée, Catalist.

L’équipe de campagne de Barack Obama a en effet créé des outils destinés à recueillir des données concernant les électeurs, qui reposent à la fois sur les techniques de démarchage électoral les plus traditionnelles et sur les nouvelles technologies. Le travail de terrain des volontaires (« canvassing »), qu’il ait eu lieu par porte-à-porte ou par téléphone, a en effet permis de recueillir de nombreuses données sur les électeurs. Lors de la première prise de contact entre un volontaire et un électeur, le volontaire interrogeait la personne approchée de façon à préciser son profil sociodémographique et électoral, ce qui lui permettait de lui attribuer une note de 1 à 10, communiquée à l’équipe de campagne et qui déterminait la stratégie adoptée par la suite pour le convaincre. Au sein des « neighborhood teams », des volontaires étaient ainsi spécialisés dans le recueil de données. En outre, les nouvelles technologies ont permis une amélioration considérable des données sur les électeurs, et plus particulièrement sur les sympathisants du candidat et les volontaires. Cela a constitué, notamment, l’un des apports fondamentaux du site MyBO. Ainsi, 2 millions de profils ont été créés sur le site, et des listes d’e-mails (comptant 14 millions d’adresses) ou de numéros de téléphone ont été constituées. Les équipes de campagne ont utilisé ces outils pour approfondir leur connaissance des sympathisants du candidat. A titre d’illustration, il a été envoyé à tous ceux qui avaient créé un profil sur le site MyBO un questionnaire de trois pages, demandant des informations aussi variées que les habitudes de vote ou de dons, la fréquentation d’une église, l’identification aux groupes ou thèmes de campagne, etc. L’avantage du recueil de données par les équipes de campagne elles-mêmes est qu’il est particulièrement précis et sûr, puisque la personne interrogée est consentante. 

Par ailleurs, l’équipe de campagne de Barack Obama a également acheté des données à une entreprise spécialisée, qui a permis à la fois d’enrichir les informations à sa disposition et de les centraliser. En effet, la nouveauté de cette campagne a été l’émergence, du côté démocrate, d’une entreprise de dimension fédérale ayant créé des banques de données destinées à être vendues aux candidats progressistes : Catalist, fondée en août 2005 par Harold Ickes, ancien conseiller de Bill Clinton, disposant d’un budget annuel de 7 à 9 millions de dollars par an et employant plus de 40 salariés permanents.

La base de Catalist contient aujourd’hui des données sur plus de 220 millions d’Américains : 140 millions qui sont inscrits sur listes électorales (sur 153 millions), et 80 millions qui, bien qu’électeurs potentiels, ne sont pas inscrits. A chacune de ces personnes sont associés des adresses, des numéros de téléphone et des données concernant le vote (préférence partisane, vote ou abstention lors de la dernière élection générale ou des primaires, etc.). La base contient jusqu’à 600 informations sur une seule personne. Cette banque de données a été constituée en suivant trois étapes:

·   la consultation des listes électorales (avec la difficulté qu’elles n’ont pas le même format et ne contiennent pas les mêmes informations dans les différents Etats),

le travail des employés de Catalist dans les Etats les plus importants pour obtenir des informations sur les électeurs,

·   et enfin le croisement de la base constituée par l’entreprise avec les bases commerciales (magazines, voitures, maisons, permis de chasse ou de pêche, appartenance à des associations, etc.) et le recensement.

L’un des avantages de Catalist est donc de centraliser l’ensemble de ces données, auparavant dispersées. Ensuite, ces données sont mises à disposition de candidats progressistes, moyennant rémunération. Catalist leur propose aussi d’héberger leurs propres données, qu’ils peuvent choisir ou non de mettre à disposition d’autres candidats progressistes. Pour l’élection présidentielle américaine 2008, Barack Obama a signé un contrat de 500 000 dollars avec Catalist pour avoir accès à cette base de données pendant un an. Aucun des autres candidats démocrates lors des primaires n’a mis ses données à la disposition du sénateur de l’Illinois               

Des données mieux traitées et analysées

Au-delà de l’enrichissement et de la centralisation des données, leur traitement et leur analyse ont été considérablement améliorés, de façon à permettre un ciblage fin des électeurs. Cette amélioration a été rendue possible par la modélisation du comportement des électeurs et par la recherche d’interactions entre les bases de données, la modélisation et les études d’opinion menées en appui des campagnes électorales.

Ces modèles partent de l’hypothèse que le comportement électoral d’un individu est largement déterminé par son mode de vie (ses habitudes de consommation ou ses loisirs) et son milieu socioprofessionnel. Les bases de données revêtent donc une grande utilité : en leur appliquant ces modèles, on peut calculer la probabilité qu’un électeur vote pour l’un des candidats. La base contenant les coordonnées de l’électeur, cela a permis à la campagne de concentrer ses efforts sur ceux dont la probabilité de voter Obama était à la fois suffisamment élevée pour espérer les conquérir, mais pas assez pour être assuré de leur soutien.

Les confrontations entre bases de données, modélisation et sondages d’opinion ont encore renforcé la connaissance par les équipes de campagne du comportement et des attentes des électeurs. En effet, les instituts de sondages ont utilisé les bases de données et les modèles de comportement électoral pour déterminer les groupes de population qu’il convenait d’étudier de manière plus approfondie. Ils se sont surtout concentrés sur l’analyse des attentes des électeurs, afin d’aider le candidat à rendre plus efficace la présentation de ses propositions, tant sur le message global du candidat que sur ses prises de position plus spécifiques. Concernant le message global du candidat, les sondeurs ont aidé à comprendre, par exemple, ce que signifiait le changement ou l’expérience et quels étaient les attributs permettant d’incarner ces dimensions. Ainsi, c’est sur la base d’études d’opinion que Barack Obama a déterminé les trois piliers constituant son message de changement : l’unification du pays autour d’un objectif commun, le rejet des intérêts particuliers et des lobbyistes, et l’honnêteté. Concernant les propositions plus spécifiques, les études ont essentiellement visé à valider leur pertinence et leur compréhension par l’opinion avant leur annonce, même si certaines d’entre elles ont également fait l’objet de sondages après avoir été rendues publiques. 

A titre d’exemple, les sondages ont joué un rôle important lors du débat sur le forage pétrolier offshore (« offshore drilling »). En réponse à la crise pétrolière, John McCain proposait de lever l’interdiction d’extraire du pétrole au large des côtes américaines. Alors que certains sondages indiquaient que la majorité des Américains y étaient favorables, Barack Obama, qui souhaitait défendre une position opposée à cette proposition de court-terme, a cherché à comprendre les leviers susceptibles de convaincre les Américains de la nécessité de changements plus structurels (baisse de la demande, promotion d’une économie verte). Une enquête approfondie lui a permis de trouver les arguments les plus pertinents pour imposer une autre position crédible dans ce débat. Au final, les sondages ont beaucoup été utilisés par les équipes de campagne. Mais leur efficacité n’aurait jamais été aussi grande si un professionnel de ce secteur, Joël Benenson, n’avait pas été intégré à la direction stratégique de la campagne, lui permettant ainsi de coordonner l’ensemble des travaux menés et de voir ses analyses prises en compte dans la détermination de la stratégie du candidat. 

Cette campagne est, à bien des égards, « révolutionnaire ». La campagne Obama peut être définie comme une campagne de mobilisation, générant un mouvement militant unique par son ampleur et sa ferveur, et permettant le retour aux urnes de 15 millions d’électeurs qui ne votaient pas ou plus. Elle est à l’origine d’une formidable revitalisation démocratique.

 


Commentaires

Posts les plus consultés de ce blog

Saison 4.4 - Les Chroniques BI sont publiées !

Saison 4.3 - 2022 : Les 50 ans STID à Vannes

Saison 4.1 - 2015 : Embauche chez B&D