Journal d'investigation en ligne et d'information‑hacking
par Rédaction

Marseille s'offre son Big Brother grâce à Engie Ineo

Et ce n'est pas triste

Ce n'est pas nouveau, cela a déjà échoué, souvent lamentablement. Mais la Ville de Marseille veut son système d'analyse de big data, pour faire notamment, du prédictif. Les ratés de PredPol n'ont pas refroidi la mairie qui compte mettre en route son "fusion center" cette année.

Centre de supervision de la ville de Marseille - Ville de Marseille

Annoncé au mois de novembre 2017 par la municipalité marseillaise et l'entreprise ayant obtenu le marché — Ineo Digital, filiale du groupe Engie (anciennement GDF Suez) — le « Big Data de la tranquillité publique » (sic) vise à booster l'efficacité de la police municipale grâce à un système de traitement de « l'ensemble des données disponibles sur le territoire ». Un document que s'est procuré la Quadrature du Net et que Reflets a pu consulter, livre des détails sur le programme de création de cet outil, déjà en cours et qui s'achèvera en 2020.

Le projet est composé de deux lots distincts. D'une part, la création de l'outil proprement dit, d'autre part des prestations d'accompagnement visant en réalité à affiner le cahier des charges initial, à recruter de nouveaux partenaires susceptibles de fournir des jeux de données au système et à « valoriser » ces derniers.

Le programme est structuré autour de différents axes thématiques, comme « l'analyse et l'anticipation des faits de délinquance et des troubles à la sécurité des administrés sur l'espace public », « des problématiques liées à l'occupation du domaine public », ou encore à celles « de fluidité de la circulation, de stationnement et de sécurité routière ». Les finalités sont donc plutôt larges, c'est en effet l'ensemble des principales missions de la police municipale qui est couvert. Pour chacun de ces axes, la municipalité donne des exemples de « fonctionnalités possibles » correspondant à des « cas d'usage ». Ces fonctionnalités auraient pu être mises en œuvre sous la forme d'applications, et donc de base de données, indépendantes. À l'inverse, la ville de Marseille a fait le choix de la centralisation en intégrant la totalité des sources de données dans une seule et même solution de stockage et de calcul : une grappe de six « Oracle Big Data Appliance », de gros serveurs de bases de données embarquant des solutions de d'intégration, de transformation et d'analyse de données.

Décloisonner

L'objectif est non seulement de « décloisonner » les sources d'information pour effectuer de l'analyse rétrospective, mais aussi « d'apprécier la situation actuelle » et « d'anticiper la situation future » par exemple pour orienter les « patrouilles de police sur le terrain ». La ville ne cache pas, dans le document, son ambition de faire dans le « prédictif ». Et pour ce faire, la municipalité envisage de râtisser des données non seulement dans les bases de ses propres services, mais également via des partenariats « institutionnels » ou « privés ». En effet, au moment où le document était rédigé, les données dont disposait la ville de Marseille étaient essentiellement issues des mains courantes ou verbalisations, de son système d'information géographique ou des alarmes émises par le Centre de Supervision Urbain, c'est à dire de la vidéo-surveillance. Pour traiter ces informations, un projet à près de 2 millions d'euros aurait donc été totalement surdimensionné, sinon inutile.

D'où l'idée de s'appuyer sur des « partenariats » pour obtenir des jeux de données venant de contributeurs tiers. Non sans préciser que la liste proposée dans le document n'a qu'une valeur « illustrative », elle permet néanmoins de se faire une idée de l'ambition : préfecture, police nationale, pompiers, régies de transport (RTM), Conseil Départemental, Assistance Publique des Hôpitaux de Marseille, Port autonome, opérateurs de téléphonie. En complément, le projet prévoit le siphonnage de sources « ouvertes » — comme les réseaux sociaux — ainsi que du « crowd-sourcing », autrement dit la participation volontaire des agents de la ville ou des citoyens eux-mêmes.

"Nous sommes allés chercher nos partenaires. Nous sommes allés voir le Préfet de Police, les institutions, les opérateurs télécoms – j’espère bien avoir des données de SFR, Orange ou autre – les transporteurs, nous les avons tous identifiés et tous rencontrés”, indiquait en février dernier à La Revue du Digital Caroline Pozmentier, adjointe au maire de Marseille, en charge de la sécurité publique, Vice Présidente de la région Paca. Dans le document la Mairie est un peu plus spécifique sur ce qu'elle attend des opérateurs privés extérieurs :

Les opérateurs de téléphonie (flux de population, ...)
Réseaux sociaux (événements, ressenti population, ...)

Le projet a été financé en partie par l'Europe, indiquait pour sa part Fabienne Marty, Direction de l'architecture et du management de la donnée de la ville de Marseille. Selon elle, la ville n'avait que «peu de compétences dans le domaine» du Big Data et «Oracle a proposé une plate-forme complètement intégrée». Ces déclarations ne sont pas neutres au regard des documents obtenus par LQDN...

D'autres projets sont apparemment menés, ou sérieusement envisagés, en parallèle et en complément du projet Big Data : l'accroissement des capacités qualitatives de la vidéo-surveillance qui devra permettre de « récupérer » des données « plus factuelles et en plus grand volume ». Celui de la « vidéo-intelligente » vise à détecter automatiquement, sans intervention humaine, des événements comme un « seuil de densité » de personnes dans un lieu donné, des « objets abandonnés ». Dans une interview, Caroline Pozmentier précisait que le système pourrait faire appel à des « réseaux neuronaux » qui permettraient au système d'acquérir « une certaine forme d’intelligence lui permettant de savoir ce qui est normal et anormal ». Rien de moins.

Anonymisation des données en mode "hopla !"

Ce type d'infrastructure pose évidemment des questions sur les données personnelles qui seront collectées et intégrées dans cette solution. Et bien entendu, en ce qui concerne la protection de la vie de la vie privée.

Mais pas de panique, tout cela sera anonymisé, assure la ville de Marseille. N'ayant que peu de compétences en matière de Big Data, on pourrait imaginer que la ville laisse le soin de cette très délicate opération à des spécialistes. Il en existe en France, notamment au sein de l'INRIA.

Mais non, la ville se chargera elle-même de l'anonymisation des données.

La ville sera en charge de l'anonymisation des données - © Reflets - Citation requise
La ville sera en charge de l'anonymisation des données - © Reflets - Citation requise

Or, l'anonymisation de données dans des jeux de gros volume est une opération délicate qui demande des connaissances pointues pour éviter des attaques visant à désanonymiser les jeux anonymisés. La littérature dans ce domaine est abondante.

Dans le cas précis, la ville de Marseille semble avoir un petit problème de méthodologie qui saute aux yeux.

Il faudrait prendre les choses dans l'ordre... - © Reflets - Citation requise
Il faudrait prendre les choses dans l'ordre... - © Reflets - Citation requise

La Ville de Marseille explique en étape 2 qu'elle anonymise les données. Mais en étape 3, elle précise qu'il faudra nettoyer et traiter ces données anonymisées pour «distinguer les données à caractère public, des données à caractère privé, ou les données personnelles et/ou sensibles».

Comment parvient-on à distinguer une donnée personnelle et/ou sensible dans un jeu anonymisé ? Mystère et boule de gomme.

Mais il y a mieux un peu plus loin dans le document :

Anonymisation "si besoin" - © Reflets - Citation requise
Anonymisation "si besoin" - © Reflets - Citation requise

Les données seront anonymisées «si besoin». C'est déjà beaucoup plus élastique et « agile »...

Demain est un autre jour, mais je le connais déjà

Lire l'avenir, cette vieille utopie, est désormais à portée de main avec le Big Data. En dépit des échecs variés, et des biais, notamment de PredPol, surdocumentés, la Mairie de Marseille compte bien prévoir l'avenir grâce à son cluster Oracle-Ineo:

Objectifs du marché - © Reflets - Citation requise
Objectifs du marché - © Reflets - Citation requise

Anticiper la situation future ou probable (demain) par le décloisonnement et le partage de l'information entre les acteurs. C'est beau comme une utopie.

La pythie - © Reflets - Citation requise
La pythie - © Reflets - Citation requise

On notera que le renseignement en source ouverte via les réseaux sociaux ne semble pas concerné par l'anonymisation. Reste à savoir qui appréciera, entre l'être humain et les algorithmes, ce qui dans un post sur un réseau social relève de l'atteinte à l'ordre public et à la sécurité des citoyens ou d'un langage parlé comme on en entend dans tous les bons cafés, au comptoir. «Faut tout faire péter, ça peut plus durer » : est-ce une menace terroriste ou un signe d'agacement de Gérard lorsqu'il est un peu aviné ?

Alors que l'on fête les 147 ans de la Commune de Paris, on peut raisonnablement se demander ce qu'aurait pensé la solution de « Big Data de la tranquillité publique » d'un tel événement ?

Ineo en homme à tout faire

La ville de Marseille, à part fournir l'infrastructure informatique et anonymiser à sa façon les données collectées, ne fera pas grand chose.

Architecture informatique - © Reflets - Citation requise
Architecture informatique - © Reflets - Citation requise

C'est le prestataire, en l'occurrence Ineo, qui décide et réalise toutes les tâches. En quelque sorte l'homme à tout faire du Big Brother marseillais.

Ineo sélectionne les données à intégrer dans l'infrastructure, c'est elle qui les collecte.

Collecte et nettoyage des données - © Reflets - Citation requise
Collecte et nettoyage des données - © Reflets - Citation requise

Pour autant, le principal fournisseur de données en phase initiale sera la Délégation générale à la sécurité (DGSEC) :

DGSEC - © Reflets - Citation requise
DGSEC - © Reflets - Citation requise

En ce qui concerne, les futures « partenaires », Ineo sera chargé de les recruter en vantant les mérites de la solution, de rédiger les contrats, on en passe.

Ineo, recruteurs de partenaires extérieurs - © Reflets - Citation requise
Ineo, recruteurs de partenaires extérieurs - © Reflets - Citation requise

Pour cela, il est en effet prévu dans le cahier des charges que l'équipe d'Ineo soit pourvue d'un juriste et d'un sociologue. C'est tellement plus simple quand on s'occupe de tout.

Ineo aura son juriste et son sociologue pour tout bien border - © Reflets - Citation requise
Ineo aura son juriste et son sociologue pour tout bien border - © Reflets - Citation requise

La solution miracle

Le cahier des charges recèle, enfin, une petite pépite qui en dit long sur les attentes de la ville. Celle-ci voit en fait sa solution de « Big Data de la tranquillité publique » comme une sorte de panacée permettant de faire ce que les élus marseillais auraient déjà dû faire depuis très longtemps.

En listant ce que l'outil devra permettre d'évaluer, on est en effet stupéfaits de découvrir que la ville n'a pas encore mesuré l'impact de son large dispositif de vidéo-surveillance, l'efficacité des actions de prévention ou de répression conduites sur les territoires sensibles, des opérations ciblées sur les nuisances sonores, la prévention des agressions des jeunes noctambules, des contrôles de vitesse, le niveau de sécurité sur le réseau de transport urbain. Pas plus qu'elle n'a, semble-t-il, eu l'occasion d'identifier les lieux ou la typologie des sites particulièrement accidentogènes ou sujets à des infractions caractéristiques répétées. Elle n'a pas non plus évalué la sécurité autour des crèches, musées, centres de loisirs ou lieux de cultes.

Doit-on en déduire qu'elle compte sur ce projet pour se mettre au boulot ?

Un outil d'évaluation pour palier l'inaction ?  - © Reflets - Citation requise
Un outil d'évaluation pour palier l'inaction ? - © Reflets - Citation requise

2 Commentaires
Une info, un document ? Contactez-nous de façon sécurisée