Journal d'investigation en ligne et d'information‑hacking
par Rédaction

Reflets et l’OSINT, une vieille histoire

Et une nouvelle étape !

Créé par des journalistes et des experts en sécurité informatique, Reflets ne risquait pas de passer à côté de tous les outils d’OSINT qui permettent de récolter des informations sur des personnes ou des entreprises en utilisant des sources « ouvertes ». Nous avons beaucoup investi ce domaine et nous passons aujourd’hui une nouvelle étape. Vous pouvez nous y aider.

L'investigation journalistique ne peut plus faire l'impasse sur le numérique qui devient un allié de premier plan. - Image Midjourney - CC

Nous vous avons beaucoup parlé au fil du temps des outils que nous développions ou que nous utilisions pour nous aider à enquêter dans un monde de plus en plus numérique. Mais aussi un monde où les « traces » laissées par les individus, les entreprises et les institutions sont désormais si vastes qu’il n’est plus nécessaire d’être un État pour pouvoir y accéder. C’est le paradoxe du numérique : tout le monde l’utilise désormais pour absolument tout, des achats aux loisirs en passant par les interactions avec les services publics. Plus rien n’échappe au tracking et Google en sait plus sur vous que votre maman ou vous-même.

Mais le géant du marketing n’est plus seul sur la grande place de marché de la donnée personnelle. Des milliers de petits acteurs négocient nos petits secrets et souvent sans aucune sécurité. Bilan des courses ? Tout est accessible, soit en sources ouvertes, soit en payant, soit parce que toutes les entreprises qui font commerce de données personnelles finissent par se faire pirater. Et les données sont publiées sur Internet. Dans ce Far West, nous sommes des observateurs avisés et nous utilisons tout cela.

Aujourd’hui, nous passons une nouvelle étape dans le développement de nos outils et nous avons besoin de votre aide. On vous raconte tout ça…

Où en sommes-nous ?

Il y a deux ans nous mettions en route un serveur sur lequel nous avions installé Aleph, le logiciel développé par l’OCCRP, un consortium journalistique d’investigation. Ce logiciel permet d’indexer des masses très importantes de données.

Elles sont alors « moulinées » par des algorithmes qui vont créer des « entités » (de type nom, prénom, téléphone, mail » et repérer des relations entre ces entités. Par exemple, Aleph fournira un chemin d’exploration des données en partant d’un relevé d’identité bancaire (RIB) au travers des données qui contiennent cette « entité ». Notre Aleph a désormais indexé près de 100 lots de données. Il s’agit de documents habituels dans une rédaction : des documents récoltés au fil de nos investigations, des dossiers d’instruction, des archives d’autres journaux sur les dossiers que nous suivons. Mais aussi des documents récoltés sur Internet. De « leaks » issus de piratages. Nos données ne sont évidemment accessibles qu’à nos journalistes dans le cadre de leurs enquêtes.

Aleph de Reflets (vue partielle) - Copie d'écran
Aleph de Reflets (vue partielle) - Copie d'écran

En parallèle, nous avions obtenu une aide du Fonds pour une presse libre (FPL) afin notamment de pouvoir relier un autre outil d’OSINT, Maltego, à notre Aleph. Maltego permet de poser sur un tableau blanc une série d’entités et de les relier entre elles pour mieux visualiser un dossier complexe. Cet outil permet également de rechercher des informations en sources ouvertes en partant de chaque entité présente sur le tableau blanc. Des requêtes spécifiques peuvent être faites sur chacune d’elles, c’est ce que l’on appelle des « Transforms ». Nous avons donc développé nos propres « Transforms ». L’un d’eux permet d’aller interroger notre Aleph et de rapatrier les informations disponibles dans le tableau blanc pour chaque « entité ». D’autres permettent d’aller interroger Pappers.fr et d’enrichir nos « entités » de type « personne » ou « entreprise » dans Maltego.

Transform Maltego créé par les équipes de Reflets pour accéder aux données de Pappers, utilisé dans le cadre de l'enquête sur la tour Font del Rey - © Reflets
Transform Maltego créé par les équipes de Reflets pour accéder aux données de Pappers, utilisé dans le cadre de l'enquête sur la tour Font del Rey - © Reflets

Par ailleurs, nous utilisons une longue série d’outils informatiques pour récolter de l’information.

Des enquêtes peu classiques

Par exemple, lorsque nous avons voulu faire une liste des caméras de surveillance (y compris les interphones) accessibles à distance en Ukraine, nous avons utilisé un scanner particulier pour passer au crible toutes les adresses IP présentes dans le pays à la recherche de caméras. Une fois isolées celles dont le flux était accessible (2.500 à peu près), nous avons mis en place deux serveurs auto-hébergés qui nous ont permis, via un logiciel libre spécifique, d'accéder en temps réel à des flux vidéo d'intérêt public, de partager ces flux avec les journalistes impliqués et ainsi d'avoir accès, en temps réel, à des informations inédites. Cette enquête très « numérique » a donné lieu à plusieurs articles repris partout dans le monde.

Autre sujet, les dénégations appuyées et permanentes de Matthieu Creux, le patron de Forward, anciennement Avisa Partners, quant à l’utilisation de faux comptes pour modifier des pages Wikipedia par son entreprise. Nous avons enquêté et grâce à des outils d’OSINT, nous avons pu relier un pseudo qui modifiait les pages de Wikipedia au téléphone portable de Matthieu Creux. Pour cette enquête nous avons travaillé sir l’identifiant Google du numéro de portable de Matthieu Creux et l’avons rapproché du mail utilisé pour créer le pseudo. C’est un exemple parfait de la masse d’informations que nous laissons derrière nous lors de notre utilisation d’Internet et de la collecte qui en est faite par des entreprises pas très respectueuses de notre vie privée.

Pour Avisa Partners, toujours, nous avions utilisé Maltego pour rendre visible la galaxie de catholiques traditionalistes et d’extrême-droite au cœur de laquelle Forward/Avisa Partners évolue. Dans la même optique, nous avions cartographié les acteurs d’une opération de marchands de sommeil à Montpellier pour nos enquêtes sur la tour Font del Rey.

Plus récemment, avec des outils plus confidentiels, nous avons ausculté les traces numériques laissées par les patrons de l’Agence nationale de la sécurité des systèmes d’information (ANSSI) et des membres du gouvernement. Nous voulions observer si leurs usages correspondaient à leurs professions de foi en matière de souveraineté numérique. Ils font l’inverse…

Enfin, bien entendu, nous avons pu mettre à profit notre infrastructure pour traiter les DrahiLeaks. Il s’agit d’un lot de plus de 450.000 documents comprenant entre une et plus de 1.000 pages chacun, dans des formats de fichiers de tous types. Notre plateforme nous a permis de faire ressortir les pépites de ces fichiers diffusés sur Internet par des pirates d’un groupe de ransomware. Plus de 30 enquêtes ont été publiées. Une grande partie en partenariat avec StreetPress et Blast au sein d’un consortium monté par Reflets.

Altice au pays des pirates : le dossier des DrahiLeaks - © Reflets
Altice au pays des pirates : le dossier des DrahiLeaks - © Reflets

Dans la série d’outils très puissants en matière de recherche d’informations sur les particuliers et les entreprises que nous utilisons, citons également Elephantastic

ET maintenant ?

Nous avons utilisé toute la place disponible sur notre serveur qui était un « démonstrateur ». En effet, nous voulions démontrer, à nous-mêmes mais aussi à d’autres rédactions, que ces technologies avaient un intérêt journalistique fort.

C’est fait. Mais ce serveur est au bout de ses capacités. Les neuf téraoctets disponibles (soit 250 films ou 500 heures de vidéo en haute définition, ou encore, 6,5 millions de pages de documents, ou à peu près 1.300 armoires pleines de papiers mais en beaucoup plus petit) sont utilisés alors que d’autres lots de documents continuent d’affluer en attente d’indexation. Nous avons donc investi dans un serveur bien plus puissant. Nous disposerons de plus de 70 téraoctets. Nous pourrons ainsi ouvrir cet outil à d’autres journaux qui souhaiteraient profiter de sa puissance.

Au-delà de la « recherche d’informations en sources ouvertes », ou OSINT, qui est un buzzword de l’époque, il faut bien comprendre où réside la puissance de la pratique. Ce n’est pas un outil ou un autre qui donne des résultats « magiques ». Ce qui est intéressant pour des journalistes, c’est la corrélation. Avoir des centaines de lots de données, disparates, permet, avec les bons outils, de faire de la corrélation et de faire apparaître des liens invisibles jusque-là. Le choix des lots de données et le bon outil (Aleph), installé sur la bonne machine (que nous venons d’acquérir), administrée par les bonnes personnes (pour préparer les données, les indexer et gérer la machine), sont essentiels. Nous avons acquis un véritable savoir-faire dans ce domaine qui nous est très utile et que nous pourrions partager avec d’autres rédactions si elles décidaient de prendre le virage qui est désormais nécessaire pour donner les moyens d’aujourd’hui aux journalistes d’investigation.

Vous pouvez contribuer à ce tournant dans notre approche des outils d’aide à l’enquête en contribuant à la cagnotte que nous avons mise en place sur J’aime L’info. Vos dons sont déductibles à hauteur de 66%. Si vous faites un don de 100 euros, il vous coûte en réalité 34 euros.

Collecte sur J'aime L'info - Copie d'écran
Collecte sur J'aime L'info - Copie d'écran

0 Commentaires
Une info, un document ? Contactez-nous de façon sécurisée