Journal d'investigation en ligne
Dossier
par Thomas Jusquiame

La vidéosurveillance algorithmique relance l'intérêt des caméras #4

Et pourtant, rien ne dit qu'elle sera plus efficace

Équipement particulièrement inefficace depuis sa première installation en 1991 pour résoudre les troubles à l’ordre public, la caméra retrouve depuis quelques années une seconde jeunesse grâce à l’apprentissage profond. Une innovation pleine de promesses sécuritaires, qui ouvre la voie à de nouvelles parts de marché, mais aussi à une nouvelle ère de la surveillance urbaine.

Des JO sous haute surveillance
Vous lisez un article réservé aux abonnés.

Il n’aura échappé à personne que la vidéosurveillance algorithmique (VSA) a officiellement été autorisée dans l’espace public le 19 mai 2023, lors de la promulgation de la Loi du 19 mai 2023 relative aux jeux Olympiques et Paralympiques de 2024. Une loi adoptée à toute vitesse — à peine cinq mois — lors d’une procédure accélérée, pour permettre aux entreprises privées de brancher leurs logiciels d’analyse comportementale derrière les caméras de vidéosurveillance.

Toujours selon les sources officielles , la VSA — appelée vidéoprotection intelligente par ses promoteurs — sera déployée (trouver les régions / sites) et aura pour objectif de détecter huit types situations.

  1. le non-respect du sens de circulation,
  2. le franchissement d’une zone interdite,
  3. la présence ou l’utilisation d’une arme,
  4. un départ de feu,
  5. un mouvement de foule,
  6. une personne au sol,
  7. une densité trop importante,
  8. un colis abandonné.

Copie d'écran d'un schéma figurant la VSA réalisé par la société Evitech
Copie d'écran d'un schéma figurant la VSA réalisé par la société Evitech

Avant de décrire les caractéristiques techniques de deux sociétés qui participent au programme d’expérimentation pour les JO 2024, voici quelques éléments de contexte pour mieux saisir les raisons de l’arrivée récente de la VSA en France dans l'espace public.

Tout part de la vidéosurveillance classique déployée pour la première fois à Levallois Perret en 1991, sous l’impulsion du maire le plus condamné du pays qui profita d’un vide juridique sur la captation d’images dans l’espace public. Rendue légal en 1995, la vidéosurveillance est arrosée de subventions publiques — notamment par le biais du Fonds interministériel de Prévention de la Délinquance (FIPD) — et prospère sur l’Hexagone. Un marché estimé à 1,7 milliards de chiffre d’affaires en 2021 qui a su s’appuyer sur une croyance progressivement incrustée dans les esprits et qui voudrait que les caméras déployées en ville réduisent la criminalité.

Mais les études scientifiques de terrain menées dans plusieurs pays démontrent que la vidéosurveillance n’a pas d‘effets significatifs pour endiguer les crimes violents, les délits liés à la drogue ou de troubles à l’ordre public. Le chercheur Guillaume Gormand a récemment mené une enquête de terrain dans la métropole grenobloise pour déterminer si la vidéosurveillance aidait à résoudre les enquêtes. Le résultat fut sans appel : sur 1.939 cas étudiés, 22 enquêtes élucidées ont bénéficié d’un indice ou d’une preuve issue de la vidéo, soit 1,1 % du panel...

On comprend mieux pourquoi le ministère de l’intérieur refuse de fournir des chiffres sur l’efficacité de ces couteux équipements de surveillance — le chercheur tango Le Goff estime qu’une caméra coute en moyenne 20.000 € pour l’installation et le maintien en conditions opérationnelles (1) —, et ce malgré les demandes répétées de la cour des comptes.

Les raisons de ce manque d’efficacité sont nombreux. Le manque de coordination entre les forces de sécurité (privées, régaliennes, municipales), la mauvaise qualité des images, des problèmes de maintenance, des caméras mal orientées, des conditions météorologiques défavorables, l’ombre des feuillages, les phares de voitures, etc. Mais le problème majeur tient au nombre pharaonique de flux vidéo comparé aux faibles effectifs d’agents censés les visionner.

Le chercheur Florent Castagnino a mené une étude (2) sur le travail d’opérateur de vidéoprotection (OVP) à la gare du Nord entre 2012 et 2017, et a démontré que les OVP ne pouvaient visionner que 4 % du réseaux de caméras disponibles — soit une quarantaine sur les 1.008 caméras installées à l’époque).

Et c’est précisément sur cet argument ; celui du manque d’yeux pour surveiller les flux vidéo, que l’industrie sécuritaire va surfer pour justifier l’arrivée d’algorithmes de traitement d’images sur le marché de la surveillance. Le président de l’Association nationale de la vidéoprotection (AN2V), Dominique Legrand, ne saurait être plus clair : « Si on prend un lieu comme la gare Part-Dieu à Lyon, avec un réseau de six cents caméras, vous ne pouvez pas avoir les yeux partout… Que fait-on de ces six cents flux ? Option 1, rien. Option 2, on utilise des mécanismes d’automatisation qui permettent par exemple d’afficher à l’écran dès qu’un individu court. »

"Bien plus encore"... Tout est dans la "promesse" - Post linkedin de la société XXII
"Bien plus encore"... Tout est dans la "promesse" - Post linkedin de la société XXII

Ces logiciels s’appuie sur la technologie de la vision par ordinateur (traitement d’image), branche de l’IA qui a récemment connu elle aussi de grandes avancées techniques grâce notamment à l’accès à de plus puissantes ressources de calcul pour traiter un (certain) volume d’informations très supérieurs aux capacités humaines.

Le mécanisme est le suivant : des ingénieurs alimentent le programme avec des images d’objets sélectionnés (une voiture, un vélo, un humain, un scooter, etc.), pris sous toutes leurs coutures et dans diverses situations pour coller au plus proche de la réalité.

En complément, et pour minimiser les faux positifs, un technicien « assiste » l’algorithme en lui indiquant sur l’image le moment où l’objet apparaît. De savants calculs permettent ensuite de déterminer à la fois la direction que prend l’objet, mais aussi sa vitesse.

Une fois ce jeu de données consolidé, le logiciel est déployé sur un serveur local (ou un boitier en Edge proche de la caméra), il est ensuite relié au video management system (logiciel qui permet de piloter les murs d’images, les archives d’enregistrements et de visionner les alertes remontées), puis au flux (RTSP) de la caméra.

Quand l’objet passera dans son champ de vision, il pourra appliquer trois actions : le détecter, le classer, le traquer.

Qu’il s’agisse de grands groupes, de start up, français ou étrangers, ils sont nombreux à vouloir offrir à leurs clients la possibilité de surveiller les comportements humains : IBM, Thales, XXII, Briefcam, Chapvision, Wintics, Datakalab, Evitech, Two I, Neuroo, Ohnys, Pryntec, Cyclope.IA, Idemia, VXcore, Orange, Videdics, Foxstream, Axis, Aquilae, HIKvision, Karroad, Vizzia, Cisco, Neuroanalys, Edicia...

Autant d’offres qui visent en priorité à équiper les lieux truffés de caméras tels les aéroports, gares, sites touristiques, ports, usines, stades, bureaux, parkings, entrepôts, mais aussi et surtout les villes, avec leurs centres de supervision urbains (CSU) (3).

Deux de ces sociétés de VSA ont eu le privilège d’être intégrées au programme général de sécurité des grands évènements et des Jeux Olympiques 2024. Quelles sont leurs fonctionnalités, à quelles cibles s’adressent-elles et quels sont leurs cas d’usages concret ? C’est ce que nous découvrirons dans le prochain épisode.


(1) Tanguy Le Goff, Vidéosurveillance et espaces publics, Iaurif, 2008.

(2) Thèse de Florent Castagnino : « Les chemins de faire de la surveillance : une sociologie des dispositifs de sécurité et de sûreté ferroviaires en France », 2017 — ParisTech

(3) Les CSU centralisent les flux vidéo des caméras municipales manipulées par des opérateurs qui scrutent en temps réel des dizaines d’écrans à la recherche d’un flagrant délit. En plus de la vidéoverbalisation, ces centres permettent aussi de guider sur le terrain les patrouilles ou les interventions ciblées de la police.

5 Commentaires
Une info, un document ? Contactez-nous de façon sécurisée