Big Brother is watching you. Cette phrase célèbre, tirée du roman 1984 (écrit par George Orwell en 1949) pourrait presque être considérée comme prémonitoire, tant chaque geste de notre vie quotidienne est aujourd’hui capté, évalué, catégorisé et analysé.
La donnée est un pilier de notre système industriel. Elle permet de comprendre et de prédire, souvent avec une grande justesse, le comportement d’un individu, d’un groupe de personnes ou d’un pays tout entier. Si l’on perçoit assez vite l’avantage comparatif que peut tirer une entreprise d’une analyse systématique des données, on peut moins bien la comprendre dans la sphère des services publics.
Mais dis-moi Jamy, quel bénéfice tirerait un État ou une collectivité de pouvoir comprendre le comportement des individus ?
La première image qui vient en tête pour beaucoup d’entre nous est l’image d’une dérive autoritaire. À l’image du système de “crédit social” en Chine, on s’imagine nos états mettre en place des systèmes de contrôle et de répression systématique pour faire rentrer les rebelles dans le rang. Pour rappel, le “crédit social” chinois est un système automatisé de notation du bon comportement citoyen. Un bon citoyen se voit accorder des avantages comme l’accès au voyage alors qu’un mauvais citoyen peut être placé sur liste noire lui empêchant l’accès à un passeport ou à des crédits. Heureusement, cette vision semble assez incompatible avec nos cultures occidentales, et est pour l’instant empêchée par nos lois.
Néanmoins la peur subsiste, et il faut prendre en compte la peur de nos concitoyens. Il faut prendre le temps de leur expliquer que les données ne servent pas seulement à évaluer la qualité d’un produit commandé sur le web. Elles peuvent aussi servir à améliorer notre vie quotidienne.
Dans la sphère publique, les données sont de plus en plus utilisées et deviennent pratiquement incontournables, dans l’optique d’améliorer certains services. Pourtant, les citoyens sont de plus en plus vigilants et critiques à l’égard de la collecte de leurs données, quand bien même cela pourrait améliorer leur quotidien. Dès lors, il peut être intéressant de se pencher plus en détails sur ce que l’historien britannique Thompson aurait pu appeler “l’économie morale et numérique de la foule”.
Quels sont les types de données collectées ?
Avant de cuisiner, il est préférable de préparer ses ingrédients. Cette métaphore peut également s’appliquer dans le monde des données. Avant de parler de l’utilisation et des acteurs de la données citoyennes, il est important de comprendre quels sont les types de données collectées et exploitées par les institutions publiques, ou par leurs partenaires.
📊 Données quantitatives
D’abord, on retrouve la collecte et l’analyse de données quantitatives. Ce sont les données qu’on retrouve le plus souvent dans la sphère publique. Pourquoi ? Nous connaissons tous les instituts de sondages et les instituts de statistiques (type INSEE). Quand on y réfléchit, ces organismes sont les précurseurs du monde des données, car depuis des dizaines d’années, ils compilent et accumulent des données statistiques pour établir ou prédire des tendances de masse sur le long terme. Aujourd’hui de très nombreuses entreprises collectent des données quantitatives.
Par ailleurs, un certain nombre d’institutions publiques produisent des statistiques pour répondre à leurs obligations légales. La majorité des données viennent de la collecte des institutions publiques. Si on prend un exemple très parlant : le nombre de demandeurs d’emploi. Le nombre de demandeurs d’emploi est une donnée officielle produite par pôle emploi. Elle est permise par l’addition des données collectées par l’organisme auprès des demandeurs d’emploi de catégorie A, B et C. On comprend alors bien comme sont produites ses données.
🔍 Données qualitatives
Parallèlement aux données quantitatives, on voit de plus en plus se développer la collecte de données qualitatives. Au lieu d’avoir de simples statistiques, ces dernières permettent de comprendre la perception réelle des citoyens. C’est le type de données qui vaut le plus cher, car c’est la donnée la plus difficile à collecter. C’est également le type de donnée le plus polyvalent, car c’est souvent une expression libre, généralement moins orientée par le mode de questionnement que pour une simple question binaire.
L’idée de l’analyse de ses données est de faire ressortir les préoccupations des citoyens. Elle n’a donc pas pour vocation de permettre un certain contrôle, mais plutôt de pouvoir proposer aux décideurs de mettre en place des processus d’écoute citoyenne. La collecte de données devient alors un moyen de mettre les citoyens au cœur du processus de gouvernance et de décision collective. On est déjà bien loin du Big Brother tel qu’Orwell le décrivait…
Au-delà de ces deux types de données, on peut retrouver de nombreuses catégories de données qui sont collectées et exploitées dans un cadre public. Les données liées aux flux de voyageurs dans les transports aident notamment les collectivités à améliorer la mobilité, et l’offre de transports en commun.
Collecter des données, d’accord, mais dans quel but ?
Pourquoi collecter des données ? Chacun peut percevoir des intérêts différents à la collecte de données. Dans la sphère publique, il existe d’une part une obligation légale pour les institutions. La mission première de certaines institutions est souvent de centraliser des données. À ce titre, la démocratisation des ordinateurs et des stockages facilite grandement la mission de ces institutions. Pour reprendre l’exemple cité précédemment, Pôle Emploi a pour vocation de venir recenser les demandeurs d’emploi et de leur permettre un accès au système de couverture sociale (allocations chômage).
Dans la même logique, la collecte des données a également un rôle de simplification de la mission des services publics. Elle permet de centraliser les informations et de les rendre accessibles à n’importe quel agent. Prenons l’exemple du policier en contrôle routier. Aujourd’hui, un policier qui effectue des centaines de contrôles par semaine pourrait savoir très rapidement tout l’historique d’un conducteur et/ou d’un véhicule. Cela simplifie sa mission. Admettons qu’il tombe sur un véhicule volé, il peut réagir beaucoup plus vite grâce aux fichiers de centralisation des données.
Il ne faut pas oublier non plus que l’installation de bases de données dédiées aux services publics permet de rendre ces derniers plus accessibles. En effet, les bases de données permettent de simplifier les démarches des particuliers en attribuant et réattribuant automatiquement des informations à un citoyen. Ainsi,en France, , il est aujourd’hui possible de créer une entreprise depuis chez soi, en seulement quelques jours. C’est une amélioration significative : il y a encore quelques années, il fallait plusieurs semaines – voire plusieurs mois – et de nombreux aller-retours à la Chambre de Commerce et de l’Industrie.
Collecter des données pour renforcer la démocratie
Dans certaines démocraties, la logique va encore loin. La généralisation de l’usage des données peut même aller jusqu’à faire régir une partie du processus démocratique. La loi française prévoit notamment de permettre le vote par voie électronique à ses ressortissants : les machines de vote électronique se développent progressivement dans les communes françaises, et des options de vote à distance sont déjà mises en place pour les expatriés français. En croisant les identités des citoyens avec les bases de données, on se rend compte que celles-ci jouent donc un rôle de plus en plus important dans le jeu démocratique.
Re-donner la parole aux citoyens est souvent une démarche peu naturelle dans une sphère publique très cloisonnée et rigidifié par la responsabilité confiée par une l’élection. Néanmoins, le monde des données permet aujourd’hui de recréer l’agora athénienne dans des pays de plusieurs millions d’habitants. C’est toute la logique de la démocratie participative qui émerge depuis des années, et qui devient très à la mode depuis les débats sur la transparence de la vie publique. Les données citoyennes sont collectées, quantifiées, qualifiées et analysées pour proposer des panoramas ou des outils de veille sur le sentiment des citoyens. En définitive, la logique est ici la même que dans le secteur privé : chercher à améliorer la performance et la satisfaction des administrés. La différence notable entre l’univers public et privé est de ne pas chercher à créer de la fidélisation pour maximiser le profit, mais plutôt pour créer de la participation, et recréer un sentiment de citoyenneté qui s’est progressivement perdu avec le temps.
⚠️ De la nécessité d’être prudent
En leur qualité d’outil, les données peuvent également être instrumentalisées pour justifier une politique ou un discours. Elles possèdent une influence directe sur l’opinion publique, et il est nécessaire d’avoir un œil critique sur les interprétations qui en sont faites.
À qui faut-il confier cette mission ?
Après avoir déterminé à quoi une telle collecte de données pouvait servir, on peut aussi se demander si analyser les données est véritablement la mission des services publics. En effet, les organisations publiques ne sont peut-être pas les infrastructures les plus adaptées. Ce n’est pas la volonté qui manque, car les avantages de cette analyse sont nombreux. Le problème vient plutôt des compétences : les budgets des institutions publiques ne sont pas infinis. Le personnel étant le premier poste de dépense, ces dernières ne dédient pas toujours du personnel ou des services à ces questions de données. Attention, cela ne veut pas pour autant dire qu’aucune initiative publique n’est prise au niveau de la collecte et de l’analyse des données.
🏛️ Institutions publiques
En réalité, toutes les institutions ne se valent pas : le niveau d’implication dans la data dépend de l’organisation. Au niveau étatique, il est clair que l’enjeu de la donnée est compris depuis longtemps. Des institutions publiques existent depuis plusieurs dizaines d’années pour pouvoir les traiter. Par ailleurs, l’État et ses entités travaillent avec un certain nombre d’acteurs privés qui exploitent massivement les données. Nous pouvons prendre l’exemple très récent et d’actualité de la campagne de vaccination contre la COVID 19. Cette campagne est gérée au niveau global par l’État à travers le Ministère de la Santé, en partenariat avec l’entreprise de conseil McKinsey. McKinsey emploie des données de manière massive dans ses prévisions et dans l’organisation de la campagne vaccinale.
franceinfo
Au niveau local, la question de l’utilisation des données est beaucoup plus diffuse. Aujourd’hui, on constate sur l’ensemble du territoire français que les grandes collectivités commencent à s’intéresser à ses questions. L’enjeu est crucial : en y prêtant attention, ces institutions affichent une posture d’écoute, optimisent leurs services et possèdent des audits réguliers de l’état de leur territoire. Cependant, elles restent sous-dotées en savoir-faire malgré ces nouvelles initiatives, car ces questions sont souvent sous-traitées à des entreprises spécialisées. Même dans le cas où la sous-traitance est employée, de plus en plus de collectivités donnent un libre accès à leurs données, dans des logiques open-data.
🏢 Entreprises
Comme évoqué plus haut, les entreprises sont également des acteurs importants de ce marché. Sans elles, il est probable que la majorité des données citoyennes produites soient peu – ou pas – exploitées. Aujourd’hui, elles sont la cheville ouvrière de toutes les recherches et de toutes les avancées dans le monde des données publiques. Elles agissent de concert avec les services publics pour optimiser leurs activités, ou en tous cas pour leur fournir des informations capitales sur leurs activités. Dans le cas de l’entreprise Kisio Lab, on voit bien que la quantification des trafics et des flux est totalement impossible pour les services publics avec lesquels Kisio Lab travaille. L’entreprise fournit une prestation à forte valeur ajoutée, qui permet d’externaliser toute la dimension “retour client” (retours liés à l’usage des services publics par les citoyens). Cette forte valeur ajoutée s’explique par le fait que services publics sont traditionnellement dépourvus de compétences d’évaluation de l’efficacité de leur action.
🤝 Associations
Enfin, il ne faut pas oublier les associations qui jouent un rôle majeur dans la production et dans l’analyse de données. Elles s’inscrivent également dans toute la logique d’open-data et dans l’analyse des données. Elles sont en effet souvent les premières concernées puisqu’elles constituent des collectifs de citoyens engagés sur des thématiques. Les données permettent alors de donner un aperçu plus global de la situation et des forces en présence.
La question des données est de plus en plus centrale dans le développement des services publics. Elles sont collectées et exploitées sous de multiples formes, et permettent de prendre davantage en compte les sentiments des citoyens, et leurs avis dans les décisions qui concernent la collectivité. On est alors bien loin de l’usage qu’en ferait Big Brother ou du “crédit social” chinois. Une multitude d’acteurs œuvrent dans ce monde des données publiques : institutions, collectivités, entreprises et associations. Ensemble, elles ont les ressources pour proposer de meilleurs services publics et un meilleur bien commun pour demain.
De par les enjeux qui y sont liés, le monde des données reste malgré tout très encadré. En effet, le syndrome Big Brother oblige les institutions à garantir une transparence, une neutralité mais également un anonymat des données traitées. La CNIL est le chaperon français de tout ce monde des données. Elle veille à l’application des lois, et notamment des réglementations liées à la protection des données personnelles, comme le RGPD.
Pour en savoir sur le Règlement Général sur la Protection des Données, n’hésitez pas à lire notre article sur le sujet !
Par François Kergall
Cet article a été publié pour la première fois le 22 mars 2021 sur Hypertext, le blog de l’association Plug’n’Play. N’hésitez pas à y faire un tour pour trouver d’autres articles sur le numérique !
Sources
- Avec le « crédit social », la Chine classe les “bons” et les “mauvais” citoyens, France 24 (01/05/2019)
- E.P. Thompson, “The moral economy of the English crowd in the eighteenth century”, in Past& Present, 50, 1971
- Dossier sur les demandeurs d’emploi (Dares)
- Données numériques de masse, “données citoyennes” et confiance dans la statistique publique, rapport public, Evelyn Ruppert, Francisca Grommé, Funda Ustek‑Spilda et Baki Cakici (Insee)
- Plateforme Open Data Pôle Emploi
- Article L330-13 du code électoral (Légifrance)
- La CNIL, c’est quoi ? (site officiel de la CNIL)