Trucage de « sondage » sur France 3 : la presse découvre l’Astroturfing

(update en bas de page) Mis en lumière par notre confrère Al-Kanz, le trucage d’un sondage mis en ligne par France3 suite à l’affaire Baby Loup lève le voile sur une pratique très courante :
Abonnez-vous ou connectez-vous pour lire le reste de cet article
Twitter Facebook Google Plus email

Auteur: Fabrice Epelboin

Ancien directeur de publication de ReadWriteWeb France, cofondateur de plein de trucs, e-guerillero fi Tounes, spécialiste intergalactique de l’infowar, réincaranation de Nostradamus tous les 26 du mois par temps agité à très agité.

59 thoughts on “Trucage de « sondage » sur France 3 : la presse découvre l’Astroturfing”

  1. Magique cet article.
    Fabrice ;) merci.
    La phrase en conclusion est tellement vrai. A ce niveau de connaissance les coïncidences ça n’existe plus, ça devient des faits et des preuves.

        1. Ha, tu parle du hacking du sondage ? Non, c’est pas le hacking du siècle, mais ce n’est pas un script kiddy, et c’est suffisant pour donner des sueurs froides à la plupart des média en ligne (qui ceci dit se font flooder leurs sondages par l’UMP depuis des lustres)

          1. C’est balaise le truc de recaptcha et pas à la portée de tout le monde.
            Maintenant s’il on a envie de faire du sensationnel, il faut peut etre voir si l’intention des jounalistes n’etait pas fautive.

          2. Certes, mais administrer un réseau de botnet constitué de faux compte twitter avec un IA, c’est aussi assez balèze… et pourtant…

            Quand on voit que le budget – en 2010 – pour un logiciel de persona management était de deux millions de dollars, on peut mise sur bien plus de nos jours pour la mise au point de tels logiciels, dont certains que nous avons pu observer sont assez stupéfiants.

            Il y a beaucoup de documentation sur ces technos – certaines issues de leaks, mais beaucoup publiés sous la forme de travaux universitaires, et c’est parfois franchement étonnant. Pour l’instant, les usages les plus avancés sont politiques (l’astroturfing de la campagne présidentielle Coréenne est vraiment très impressionnant), mais il y a fort à parier que ces technos débarquent sous peu dans l’univers du marketing, pour l’instant cantonné à l’achat de faux fans…

          3. En meme temps, si de l’astroturfing fait la promotion de quelque chose de trop improbable, il suffit de se replonger dans le conte des habits neuf de l’empereur pour deviner ce qu’il risque de se passer.
            En fait, les gens n’aiment pas être isolés le plus souvent. Quand ils ont l’impression de ne plus être seul, ca devient plus facile. Ca veut dire en gros l’ouvrir pour dénoncer ce qui n’est pas si evident que ça (quitte à jouer les avocats du diable parfois).

          4. Oui, tout à fait, c’est là que la techno seule ne suffit pas, il faut comprendre ce que l’on cherche à faire d’un point de vue socio-politique (ou marketing), comprendre les limites propres au social, les potentialités nouvelles qu’offre les dynamiques sociale propres au web, les dérives propres aux comportement des foules en ligne et les façon d’instrumentaliser tout ça…

            Ceci dit, au début du XXe, quand les « relations publiques » se sont mise en place, on en était à peu près au même stade… et ça a fait un sacré chemin depuis…

  2. Et allez « ca n’arretera pas les hacker » et bla et bla. intelligence artificielle et bla bla. Arretons le fantasme. Un hacker hacke ce qui est hackable. et « l’intelligence » artificielle c’est une probabiltié de faire une action web rien de plus.

    1. Alors, pour ce qui est du « ça n’arrêtera pas les hackers », je vous renvoi vers le lien plus haut
      http://resources.infosecinstitute.com/introduction-to-automated-captcha-solving/

      Ainsi qu’à la réponse (l’update) du hacker suite aux mesure prises par France 3 et la preuve qu’il a donnée (second sondage truqué) qu’en effet, cela ne l’a pas arrêté.

      Pour ce qui est de l’utilisation d’une intelligence artificielle dans un système simulant des adversaires dotés de sens tactique, je vous suggère une bonne partie de Call Of Duty :-)

    2. Sinon, juste dans l’hypothèse – allez savoir – où vous ne seriez pas qu’un affreux troll mais également un informaticien septique (ce qui est tout à fait louable) :

      http://fr.scribd.com/doc/158047491/Towards-Believable-Crowd-Simulation-in-Interactive-Real-Time-Applications

      The evolution of interactive real-time applications in the last two decades primarily resulted in technical improvements of graphics, physics and audio. These achievements allow the creation of stunning virtual worlds or games, pedestrian and evacuation simulations or virtual heritage simulations. Although these aspects are without doubt important, their impact on viewers is often overestimated.The key for immersive experiences in virtual environments are their characters. These characters come to life via storytelling, artifcial intelligence and appropriate interaction possibilities.

      Si le sujet vous interesse vraiment, on a plein d’autres trucs en stock dans le même genre…

    3. Il y a ça aussi question intelligence artificielle, mais pas en terme d’intelligence stratégique, là on est au niveau de chaque avatar au sein d’un environnement simulant le social :

      http://fr.scribd.com/doc/182583192/Good-Moods-Outlook-Affect-and-Mood-in-Dynemotion-and-the-Mind-Module

      The Dynemotion People Engine (DPE) is a system developed by Online Alchemy, Inc. for creating agent-based AIs embodied in a virtual world context.

    4. Il est vrai le terme d’intelligence artificiel est un peu surfait (c’est juste un traitement de l’image), mais ça ne change rien au probleme et Fabrice n’a pas tort sur le principe, selon moi.

        1. « This work describes human-like learning in Dynemotion agents. These agents perceive their world through the combined lenses of multi-layered emotionbased  » ca ?

          Hmm, tu sais un etre humain réel est censé etre coherent entre sa pensée et ses sentiments. Ce qui veut dire que selon moi, meme si l’on ne cesse de repeter que les emotions nous rendent supérieur et que maintenant on cherche à reproduire les emotions, pour moi une vrai IA c’est un truc capable de pondre ses propres algorithme de traitement de l’information, parce qu’a la base, selon moi en tout cas, nous ne faisons nous meme pas plus.

          1. Ben ça dépend de ce que tu cherche à simuler, en fait. Si c’est un comportement un poil bébète de twittos de base, en combinant des technos comme Dynemotion et Chatbot, ça le fait plutôt bien. Si tu veux simuler une interaction riche avec un être humain éduqué, là, oui, ça cloche…

            Combine du Dynemotion+Chatbot avec une approche globale du réseau de bots géré par une ‘IA’ du même genre que celle qui gère des ennemis dans une FPS, et tu peux avoir un truc assez convainquant, que tu aura le plus grand mal à distinguer d’un comportement grégaire classique sur le net, et qui sera largement suffisant – q’il existe une base suffisante – pour provoquer un réel mouvement de foule (ce que j’appelle du ‘bootstraping social’)

  3. J’avais jamais fait gaffe avant du coup j’ai fait un petit check sur le premier sondage web qui m’est tombé sous la main. Et la porte est complètement ouverte sur BFM TV, ni contrôle de cookie ni d’IP.
    http://www.bfmtv.com/politique/sondage/

    C’est simple comme bonjour, vous ouvrer le network dans les outils de de dev de chrome, vous cliquez sur la réponse de votre choixà la question. Il y a une requête qui part, vous faite un ‘copy as curl’ en cliquant le droit sur la requête et vous vous amusez avec ensuite… (si besoin, supprimez le cookie de la requête)

    Rien d’illégal la dedans !
    (corrigez si je me trompe..)

    1. En effet, les sondages de BFM semblent assez facile à truquer, c’est à priori comme cela qu’ont été truqués les premiers sondages de France 3 (avant que celui qui a fait cela passe à des méthode bien plus élaborées – cf l’update de cet article). Rien d’illégal à priori.

  4. Astroturfing

    sans blague, la news qui date de vingt ans (depuis le début des sondages sur le réseau)

    « Il nous a fait parvenir des explications techniques relatives à son dernier exploit …
    en passant par une série de proxies Russes, Ukrainiens et Européens »

    Ah ouai, bah les adminsys, pour leurs sondages, ne devraient autoriser que les plages IP des FAI français (affaire réglée.)

    ftp://ftp.ripe.net/pub/stats/ripencc/membership/alloclist.txt

    « ainsi qu’en utilisant un malware présent sur de très nombreuses machines »

    bah là, on ne peut rien faire contre le PEBKAC

    Think Correctly

    1. Astroturfing sans blague, la news qui date de vingt ans (depuis le début des sondages sur le réseau)

      Vingt ans ? L’Astroturfing, ça date de bien avant les réseaux :D

      Un peu de Culture, peut être ? Dans « Julius Caesar », de William Shakespeare (vous connaissez ?), Cassius fait parvenir à Brutus différents courriers écrits comme s’ils émanaient de multiples auteurs afin de lui donner l’impression de la population ne soutien par Caesar et l’inciter à rejoindre la conspiration destinée à l’assassiner. C’est la trace la plus ancienne d’Astroturfing que j’ai trouvé. Si vous avez plus ancien, je suis preneur.

      Ah ouai, bah les adminsys, pour leurs sondages, ne devraient autoriser que les plages IP des FAI français (affaire réglée).

      Quelle idée de génie. Vous devriez également suggérer à France Télévision d’économiser sur ces couteux faisceaux satellite qui leur permettent d’atteindre toute la francophonie…

      Allo ? Non mais Allo quoi ? Bercy appelle, ils ont besoin de vous pour faire un peu de cost-cutting dans l’administration publique. Réduction des dépenses de l’Etat ? Affaire réglée.

      bah là, on ne peut rien faire contre le PEBKAC

      En effet. Vous en offrez ici une démonstration brillante, pour le coup.

  5. Les avancées de la recherche en info sur les systèmes multi-agents (passionnants pour quiconque s’intéresse à la programmation au passage) montrent qu’il est déjà possible de simuler avec une grande précision des sociétés entières composées d’AI toutes indépendantes et autonomes.

    Un bon nombre de modèles prédicatifs et d’outils d’aide à la décision de pointe sont déjà basées sur ces principes. On est là dans le cas typique où la technologie devient aussi intéressante qu’effrayante.

      1. J’allais te demander !

        Je m’inscris de suite !

        J’ai fait « l’inventaire » de ton compte scribd et slideshare et quelle générosité dans le partage, j’en ai pour des mois hé hé.

        Et je n’avais jamais pensé à cette utilisation sociale (potentielle) de botnets, d’ailleurs il faudrait faire un papier sur les botnets de smartphone ^^.

        J’ai connu un gars qui avait créé un scanner simple – il avait 45k de bots (pour flood, scan, ce que tu veux) – pour iphone pour la « faille » du login après root, dirais-je ; il s’indexait sur les IPS des universités US pour en pénétrer le maximum et contrôlait le tout avec un script maison.

        A ce moment, il est « simple » de truquer n’importe quoi par envoi de SMS (ou autres joyeusetés bien sûr).

        As-tu déjà eu des échos d’affaires dans le genre ?

          1. Pardonne-moi, je n’ai pas plus d’informations dessus, mais si « lui » seul, avec son groupe, peut le faire, je n’ose imaginer des organes étatiques ou nos amis des agences de COM.

            Facile de « hack » des iPhone qui viennent d’être root lorsque certains identifiants restent par défaut.

            Mais c’est niveau script kiddie, there must be more !

            Désolé de ne pas pouvoir plus t’aider à ce niveau.

            Je suis peut être un peu trop parano, mais je suis au bon endroit hé hé :)

          2. Les Etats, c’est clair, ils sont au top, par contre, les agences de com’, pas du tout. Le monde des agences est très particulier, les techniciens y sont méprisés, et relégué au bas de l’échelle du prestige dans la hiérarchie interne (ainsi qu’en ce qui concerne les grilles de salaires).

            Cette attitude leur a fait prendre un retard colossal dans le numérique, pour ainsi dire irrattrapable, qui fait que les agences, en terme de e-astroturfing en sont encore à l’achat de faux fans. L’intelligence artificielle est pour eux synonyme de sciences fiction, et 99% des employés d’une agence de com’ seraient sur le cul s’il découvraient qu’au sein de leur FPS préféré se cache un moteur d’IA.

          3. Il est vrai que j’ai pu m’emporter pour les agences de COM, que de souvenirs à l’époque sur reflets, c’était magnifique :)

            Les états par contre je leur fais « confiance » !

            Et quant à l’intelligence artificielle, je suis de tout coeur avec toi, quiconque connaissant un peu la programmation sait ce qu’il est possible de faire à notre époque avec des langages spécifiques tels que : LISP, PROLOG (d’immondes souvenirs pour moi là par contre ^^)

            C’est dire avec les QBITS (quantique) et les futurs langages à venir ou existant déjà.

            J’ai trouvé quelques liens, je ne sais pas par contre s’ils sont très pertinents.

            Je pense que c’est clairement le futur, le hack de smartphone et comme tu le sais le futur c’est maintenant :)

            Quelques liens :

            http://blogs.msdn.com/b/tzink/archive/2012/07/03/spam-from-an-android-botnet.aspx

            http://www.bbc.co.uk/news/technology-21026667

            http://www.darkreading.com/vulnerability/researcher-to-release-smartphone-botnet/229100330

            Je n’ose imaginer maintenant :)

          4. Juste au passage; concernant le hacking de smartphone par les états, je dirai que c’est même du passé depuis le temps qu’il bossent dessus…
            Et pour résumer simplement ce qu’ils sont capables de faire : tout. Et plus encore.

            Sur ce, je retourne lire mes articles en retard ;)

  6. Bonjour

    L’utilisation du sondage, et ce, quelque soit le sujet de celui-ci, n’est que la perversion de l’instrument : enquête sociologique et donc comme toute malversation, sert des intérêts. (lapalissade) Qu’ils soient truqués en « cours de route » comme à leur origine, n’en renforce que leur invalidité.

    La dénonciation de ce phénomène, ( qui n’est que la prolongation de techniques publicitaires ), est donc à diffuser le plus largement possible, donc merci pour ces explications, même si elles ne sont pas toujours, facilement, accessible au néophyte. (vocabulaire, acronymes, références … )

    N’ayant donc strictement aucune connaissance technique …

    Je me contenterais de vous poser, la question suivante ; ( qui, évidemment, en amène d’autres )

    Quid du vote électronique ? ( Élections – référendums, etc.)
    ( soumis normalement à de plus « profonds » contrôles ? )

    Et ferais, la remarque suivante : lorsque je délègue à un autre et par glissement à une quelconque technique /technologie, une partie de mes actes, au moins ceux, conscients et décisionnaires, je me situe alors dans une large plage de comportements possibles, entre celui : de l’utilisateur de gadget/jouet, le plus superficiel, à l’invalide usant d’une prothèse ( qui peut-être parfois vitale ).

    Ainsi, mon usage ou non, génère et/ou entretien, une structure dans laquelle, quelque soit mon degré de participation, ( ne rien faire est un acte ) je me retrouve impliqué. Ce sera donc, mon degré de conscience et ma volonté de mettre, ou ne pas mettre, et de quelle manière, en œuvre cette technique /technologie qui fera que par simple addition et jeu de pouvoir/contre pouvoir, la société l’adoptera et en fera un usage plus ou moins coercitif. Enfin, il me semble …

    Cordialement
    Eric Hénunc

    1. Quid du vote électronique ?

      Casse gueule, très casse gueule…

      Voici en vrac quelques liens :
      http://www.lepoint.fr/politique/primaire-ump-le-vote-sur-internet-ennemi-de-la-democratie-28-05-2013-1672820_20.php
      http://www.numerama.com/magazine/22477-presidentielles-enquete-sur-l-incroyable-opacite-du-vote-electronique.html
      http://www.numerama.com/magazine/22666-le-parti-pirate-prive-du-droit-de-controler-le-scrutin-pour-700-000-electeurs.html
      et une tentative de faire taire les mécontents…
      http://www.numerama.com/magazine/25271-numerama-doit-avoir-plus-de-mesure-dans-la-critique-du-vote-electronique.html

      soumis normalement à de plus « profonds » contrôles ?

      Ben pas vraiment, impossible d’auditer le code source pour le logiciel de vote eletronique utilisé lors des dernières élections parlementaire en France… Même avec un code source ouvert, beaucoup restent très septiques et méfiants. Il existe cependant des approches différentes (assesseurs de pair à pair, notamment dans Liquid Democracy, mais ce n’est pas compatible avec le vote tel qu’il est pratiqué dans la Ve République.

      Liquid Democracy, qui par ailleurs devrait éclairer (un peu) vos interrogations :
      http://en.wikipedia.org/wiki/Delegative_democracy
      http://www.communitywiki.org/cw/LiquidDemocracy

      1. Il n’y a que la methodes venezuelienne qui semble un minimum tenir la route en produisant une confirmation papier, le vote électronique émet un récépissé mis à son tour dans une urne, les deux devant, au final, correspondre en nombre de votants…

  7. «Si la première méthode est couramment pratiquée en France, notamment par les partis d’extrême droite et d’extrême gauche (mais aussi, en son temps, par l’organisation mise en place par Ségolène Royal lors de sa candidature à la présidence de la République),»

    J’ai pas compris, ségolène royal et l’ump, ils sont d’extrême gauche?

    C’est définitivement maladif chez toi.
    Plus pavlovien tu meurt, quitte a raconter de constamment de la merde et se contredire en une phrase.

    Bon sinon, déjà que les sondages a la base, ca n’a aucune valeur (ya que les elections pour ca et encore c’est très relatif vu le systeme global) si ce n’est d’orienté l’opinion.
    Alors les sondages web… XPTDR quoi§§

  8. C’est réellement un coup de génie !
    Je désespère chaque fois que je vois les résultats des sondages sur M6 ou BFM. Je me dis très souvent « Les gens sont-ils réellement si bêtes ? » mais aussi parfois « C’est très étrange comme résultat ».

    La partie qui a été dite dans le 14h42 (http://www.arretsurimages.net/emissions/2013-12-03/Sondages-en-ligne-Facebook-blogs-manipulation-mode-d-emploi-id6343) et que j’ai trouvé vraiment pertinente, c’est lorsqu’il a été dit qu’il était « dangereux » de faire des sondages sur des thèmes sociétés où le débat ne peut pas se régler en un sondage. Des sondages, en ligne, du genre « Pensez-vous que François Hollande est un mauvais président ? » ou « Constatez-vous une hausse du racisme en France ? », c’est aussi assez dangereux. On ne peut rien vérifier de ces résultats. Parfois même, ils atteignent des nombres faramineux de votes en à peine un jour (notamment sur des questions comme ça). Par contre, quand c’est une question « Vos vacances se sont-elles bien passées ? », là, il y a étrangement beaucoup moins de votants. Bref, il y a un gros problème avec les sondages en ligne et même en traquant les ip, etc…, on ne pourra jamais être sûr de l’identité unique des votants (1 vote = 1 personne physique comme en vrai pour les votes électoraux).
    Je pense qu’on devrait réellement les interdire car ils contribuent/permettent vraiment et facilement de manipuler le peuple non-averti.

    Honnêtement, je suis prêt à proposer mon serveur pour aider à « pourrir » les sondages car il est temps que cette hypocrisie cesse. J’aurais aimé trouver le script pour aider mais malheureusement, vous ne l’avez pas mis en ligne. Mais je sais que vous savez comment me contacter si besoin ;)

    En tout cas, bravo à vous et merci d’avoir remis en lumière ce problème =)

  9. Pas besoin de parler de « hacking » à chaque fois, sur BFM par exemple, il suffit de désactiver les cookies de son navigateur (dans les options), et vous pourrez voter autant que vous voudrez… Avec la console de votre navigateur, vous pouvez faire une boucle d’autant que vous voudrez, et vous fausserez des sondages à votre sauce, et vous pourrez vous prendre pour anonymous…
    Tout ca pour dire que parfois, et souvent, un « piratage » ne nécessite souvent pas une grosse infrastructure compliquée

  10. Je ne connaissais pas l’Astrosurfing ! concept intéressant…

    Sinon, pour en revenir au débat de fond de l’article, comme dit plus haut dans les commentaires, il est souvent pas bien compliqué de « tricher » sur un sondage en ligne.

    Tout le problème vient souvent du fait qu’il faut arriver à démasquer ces votes « en trop », pour ne pas les prendre en compte et fausser les résultats d’une enquête. Ou alors, traiter le problème à la source, et trouver une solution technique qui permette d’empêcher ce genre de pratique… dans tous les cas, on sait qu’il y a bien souvent un écart entre ce que les gens disent, et ce qu’ils font…

    Bien à vous,

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *