SIRI : Apple se lance t-il dans le fichage biométrique de masse ?

Un utilisateur vient de transmettre sur une liste de diffusion une capture d’écran qui donne franchement à réfléchir. Il s’agit d’une capture prise sur un iPhone 4S, elle concerne SIRI la « grosse » innovation de la dernière version du téléphone « kifétou » d’Apple. Cette capture mentionne on ne peut plus clairement que Siri transmet beaucoup de choses à Apple. A savoir : vos contacts (!), votre position géographique (on s’en étonne même plus) et votre VOIX. QUe diantre Apple peut il bien faire d’échantillons vocaux de tous les utilisateurs de ses téléphones ? L’explication, assez fumeuse qu’Apple donne sur cet affichage est que ceci serait nécessaire « au traitement de vos requêtes » …Permettez nous d’en douter. Apple ne serait-il pas tout simplement en train de préparer des dispositifs de reconnaissance biométrique pour son iPhone 5 ? Ou se lance t-il ouvertement dans un fichage biométrique de l’intégralité de ses utilisateurs ?

Voici le SpyPhone 4s
Twitter Facebook Google Plus email


46 thoughts on “SIRI : Apple se lance t-il dans le fichage biométrique de masse ?”

  1. Google en fait tout autant, vu que Ice Cream Sandwich a comme nouvelle fonctionnalité le déverrouillage du mobile via la reconnaissance faciale.

    Et vu que c’est lié au compte Google(récupérable automatiquement en changeant de téléphone).

    1. Tiens j’ai pensé pareil, la réunion de la reconnaissance faciale, de la voix, et d’une « boîte noire » sur tous les appareils se connectant à Internet (la proposition d’un député européen selon PcINpact).

      Plus besoin d’enquêtes, on a le monde entier sur un plateau.

    1. Les téléphones portables sont depuis toujours équipé de puce spécialisé dans l’analyse de la voix.
      Sachant que les utilisateurs d’iphone sont les premiers utilisateur d’opera mobile, car le navigateurs le plus rapide sur plateforme à forte latence, on peut légitimement penser que siri serait plus réactif sans transmettre notre voix à big brother.

    2. Ce n’est pas si coûteux que cela à faire. Disons que le transfert de l’échantillon de voix (vers le serveur), l’analyse, l’action, le retour de l’action sous forme de paquet réseau ou autre, pour déclencher une action est sans doute plus longue que de le faire en local sur des chips plutôt rapides.

  2. Deux explications techniques potentielles:
    – soit la reconnaissance vocale proprement dite est effectuée sur les serveurs d’Apple et non sur le téléphone. C’est ce que fait Google sur ses Android.
    – soit Apple utilise les fragments vocaux pour améliorer ses algorithmes. En reconnaissance vocale, il n’y a pas de miracle : plus il y a de données disponibles pour l’entraînement, plus la reconnaissance sera précise. Et le meilleur moyen d’obtenir ces données, c’est de les récupérer à la source, chez l’utilisateur. A nouveau, c’est ce que fait déjà Google.

    On peut ajouter une 3e réponse, plus portée « domination mondiale », mais très honnêtement, c’est la moins plausible.

  3. Siri ne fonctionne pas en local : il a besoin d’une connexion aux serveurs d’Apple pour fonctionner. Ce sont les serveurs distants qui analysent la voix, interprètent la question et fournissent la réponse. Donc, forcément, pour que ça marche, il faut aussi transmettre la voix ! Apple se couvre en le précisant, c’est assez normal. Mais il n’y a rien de louche là dessus. Essayez de faire fonctionner Siri en mode « avion » (sans connexion du tout)…

  4. D’habitude vos articles sont un peu plus rigoureux sur le plan technique; là c’est un peu léger, jeune homme.

    Comme pour le système de recherche vocale de Google sur Android, l’analyse audio nécessite une certaine puissance de calcul qui est nettement supérieure à ce que peuvent proposer les smartphones actuels. La solution mise en place est donc d’effectuer l’analyse sur des serveurs distants (dans des datacenters par exemple), le smartphone n’étant qu’un client destiné à l’émission de l’échantillon audio et la réception/affichage du résultat de l’analyse.

    La même explication est valable pour les contacts et la position géographique (si vous dites « trouve moi un coiffeur », il vaut mieux que la recherche se fasse dans le coin où vous êtes).

    Bref, même si l’on peut jouer au paranoiaque (« Apple a accès à tout ce que tu dis à ton téléphone !!§§§ ») il y a une très bonne raison technique à cet état de choses.
    Libre à chacun ensuite de décider d’utiliser cette fonctionnalité ou pas, selon la confiance qu’il accorde à Apple et le poids qu’il attribue à son confort contre celui qu’il donne à ces informations.

    En attendant merci de ne pas monter des théories tirées par les cheveux de fichiers biométriques d’Apple. :]

    1. Pouvez vous m’apporter un seul élément dans les conditions d’utilisation de ce service qui implique qu’apple s’interdit de faire une utilisation ultérieur autre que le simple traitement des empruntes vocales de ses utilisateurs ? Vous faites à ce point confiance à Apple vous ? Moi pas.

      1. Je crains moins ce genre d’usage de la part d’Apple que de Facebook ou Google, d’après les habitudes constatées de ces entreprises. (À titre d’exemple Apple permet de désactiver les cookies de suivi de iAd, et ne donne pas accès aux données de ses clients aux vendeurs de l’App Store – pour le moment). Mais bon une entreprise privée c’est des actionnaires sans âmes au service de la recherche du profit, donc tout est possible.

      2. Comme je l’ai déjà dit, libre à chacun ensuite de faire confiance ou pas à Apple sur l’utilisation qui sera faite des données transmises.

        Je pointais du doigt le fait qu’il y avait au moins une excellente raison pour que de telles informations soient transmises, et que c’était d’ailleurs celle donnée par Apple : ces données sont nécessaires au traitement des requêtes.

        Contrairement à ce que tu dis dans l’article, ce n’est absolument pas une « explication fumeuse », c’est la vérité et c’est l’explication la plus simple et la plus logique. Ce qui n’empêche pas qu’il puisse éventuellement y en avoir d’autres plus tordues (mais ce serait prendre de gros risques pour pas grand chose de la part d’Apple imo).

          1. Etrange de se poser la question de l’éthique de telle ou telle boite comparée à l’autre…une boite privée reste une boite privée qui, si elle est non-intrusive durant des années, peut le devenir du jour au lendemain (sur demande de l’Etat ou parce que ses dirigeants ont changé, que les actionnaires poussent, etc…). La seule « boite » qu’on puisse potentiellement contrôler, c’est l’Etat lui-même, pour peu qu’on lui demande des comptes. Le reste, c’est tirer des plans sur la comète et sans garantie. Que ce soient les « chouettes gars » issus de la beat generation d’Apple ou les « méchants » costard-cravate d’IBM ou Microsoft…Maintenant renvoyer ses données à quiconque, moi je dis : non. Que ce soit pour plus de confort (un gadget à la gomme dont je me suis passé 40 ans, tu m’excuses, je rigole) ou par paresse…

      3. Exactement. Il faut arrêter cette vision binaire du avec ou contre moi dans le seul fait. Rien ne permet d’assurer que Apple n’utilise pas ces échantillons pour une toute autre utilité.

        Sur le plan techno-économique, il se peut sans aucune vision paranoïaque que ce type d’application ne sert q’au service R&D (recherche et développement) pour des applications ou produits futurs.

        Après on en revient au big brother et a Lilltle brother. Soit tout est programmé, (attention t’es un parano), soit l’évolution techno-darwiniste suit son cours, et le l’utilisateur lambda n’est que le pion qui dit -dans la majorité des cas- « amen » à tout.

        Après faut pas s’étonner. Y a 10 ans, si nous aurions parlé de la geo-localisation on aurait parlé de complot mondial à la terminator, ou Demolition Man.

        Tout suit son cours. Tu veux du service qui te « facilite » la vie, et bien ai connaissance de autres réalités.

        « A force d’être dans un paradigme on ne voit plus les autres. »

  5. Comme le dit -, l’analyse se fait sur les serveurs d’Apple, donc pour les requêtes « envoie un SMS à Bibi », ça aide grandement que Bibi soit connu comme hit possible.

    Par exemple, l’appli Google Translate, qui fait de la traduction de conversation orale, fait à peine 3Mo. Vous imaginez bien que la BD et la puissance de calcul nécessaire ne se trouvent pas sur le téléphone.

  6. Je peux tout à fait saisir le doute qui s’immisce vu que l’on parle de diffusion d’emprunte biométrique, mais de là à crier au fichage généralisé par une boite privée d’entrée de jeux, je suis moins convaincu. Surtout que Siri est aisément désactivable.

    Surtout que bon, que Google nous fiche pour en tirer des informations de profilage publicitaire je comprend (la logique du moins), de même pour le monstre de Zuckerberg. Mais je ne vois pas trop ce que Apple aurait à retirer de prend le risque de monter une telle base de données illégale… Quels intérêts, bénéfices ? Car c’est bien ces derniers qui obnubilent ces sociétés.

    Reste que je suis d’accord sur le fond, un petit « Terms of service » serait pas déplaisant.

    1. « le risque de monter une telle base de données illégale » : le gros souci c’est qu’il me semble qu’Apple répondant au droit américain est dans une position ou rien nous indique qu’il s’agirait d’une base de données illégale. Le fait d’accepter le Term of Service implique donc que tes données persos sont soumises au droit US en la matière, bien plus coulant que le notre.

      1. objection votre honneur, le fait d’avoir accepté les CGU n’est pas opposable en cas d’illégalité des dites CGU …
        par contre comme le zébulon et son lefevre ont oeuvré pour empécher tout projet de class action d’aboutir, ce sera pas de la tarte …

        A moins que l’Etat se décide un jour a faire le boulot qui est le sien

  7. En outre, Siri présente une vulnérabilité majeure selon Naked Security, et laisse l’accès libre s’il est activé à n’importe qui. Voir ur le site. http://nakedsecurity.sophos.com/2011/10/19/siri-iphone-4s-unlocked/

    Even if an iPhone 4S is locked with a passcode, a complete stranger can come up to your smartphone, press the button and give Siri a spoken command.
    http://nakedsecurity.sophos.com/2011/10/19/siri-iphone-4s-unlocked/

    1. Tant que les info de reconnaissance restent sur le téléphone et ne sont pas envoyé chez apple/google/facebook/microsoft/le fbi/les RG/les marsiens/je sais pas qui encore ça ne pose pas tellement de problèmes, c’est même plutôt une avancée.

      Le problème n’est pas technologie, mais le contrôle que l’on a dessus et la liberté que l’on a de s’en servir (ou pas) selon les usages qui nous conviennent.

  8. Mais vous le faites exprès? Pour que les serveurs analysent la voix, c’est mieux… Qu’elle soit envoyée au serveur vous ne croyez pas? Et pour la phrase « Appelle jean-Jacques », c’est mieux que le nom de Jean-Jacques ait été envoyé sur le serveur ici, non? Ainsi de suite. Rien de surprenant jusque là.

    Si vous voulez vous insurger, faites-le pour le cloud centralisé en général (google, facebook, apple, etc). Pas contre quelques détails évidents qui peuvent décrédibiliser. C’est évident que des données comme ça soient envoyées aux serveurs, sinon pas de fonctionnalité.

    Là ou c’est anormal, c’est qu’on a pas de contrôle sur ces données.
    La vraie question n’est pas « mais pourquoi ces données sont envoyées », mais « que fait-on de mes données une fois envoyées », et « Que faire pour ne pas pouvoir techniquement utiliser ces données ». Je suis fortement impliqué dans la communauté open source autour de ces solutions (Unhosted, SlapOS, etc), contactez-moi au besoin.

    1. « Si vous voulez vous insurger, faites-le pour le cloud centralisé en général (google, facebook, apple, etc) »
      bah de toute façon, qu’on fasse de l’apple bashing ou pas, les adeptes du culte sont pas outillé pour piger …

      Nan la vraie question c’est « à quoi ça sert de dire « appeler andré » pour téléphoner au 06******** … parce que un jour ou l’autre, il faudra aussi prévoir le cas de ces zigs qui non content de pas se souvenir du numéro ne se souvienne pas non plus du nom …

      et en avant vers des choses encore plus crades , controlées par des serveurs éthiques , forcément éthiques …

      Chuis content, avec un peu de chance, je serais clamsé avant …

    2. Tout a fait. Le problème est que nombreuses sont les personnes n’ayant -comme elles le disent- RIEN A CACHER! …

      Au final, et avec le temps, on en vient à cela: http://www.ecrans.fr/Facebook-la-memoire-cachee,13424.html

      Un autre problème c’est en effet les chartes et les termes d’adhésion des clients et internautes, chartes qu’on lit très rarement nous faisant accepter tout et n’importe quoi.

      Sans bien sur parler du droit outre atlantique différent de celui de notre vieille France concernant la vie privée.

  9. Bon je vous donne l’explication : SIRI est effectivement un systeme qui se base sur une reconnaissance vocale coté serveur, pour la bonne et simple raison que le systeme va « apprendre » à reconnaitre de mieux en mieux les questions tout en apportant des réponses de plus en plus pertinente.. Il faut savoir que ça fonctionne en langage « naturel », c’est à dire qu’il comprend des phrases completes et non juste des mots clefs. Par conséquence, ce que chacun apporte au systeme va profiter à toute la communauté, et cette base de donnée ne peut bien evidemment pas etre stockée (et mise à jour) localement sur votre telephone..

    A choisir, je prefere confier ma voix à Apple plutot que ma vie à Google (+ ?!?)..

  10. Vous pensez vraiment que si Apple prétend faire ce que vous dites, ils auraient attendu de le faire avec Siri ? Je vous rappelle que l’iPhone est avant tout un « téléphone », donc techniquement ils pourraient faire la même chose avec toutes vos communications téléphoniques !!!!

  11. Vous êtes un peu con non ? Siri ne traite pas grand chose en local sur le téléphone, donc oui la requête vocale est transmise aux serveurs d’Apple pour pouvoir y être traiter. En outre les serveurs doivent utiliser ces échantillons pour « apprendre » et se perfectionner.

  12. Bonsoir,
    Il me semble que les articles sont plus techniques d’habitude.

    0 – Prendre connaissance du fait
    1 – Le vérifier
    2 – Dans le cas ou la vérification est bonne, rédiger puis publier.

    Dans notre cas, utiliser un iphone sur un réseau wifi, lancer un arpspoof et sortir wireshark confirme que siri n’envoie pas notre voix pour analyse. (si vous essayé, vous vous rendrez compte que siri est l’un des rares services d’apple qui soit chiffré (contrairement à la météo ou la bourse).

    Je ne discute pas du fait qu’un traitement soit bien effectué sur les serveurs d’apple, il s’agit du match avec la/les bases de connaissances. siri envoie la « traduction » de notre voix au format texte.

    Après, il n’est pas impossible qu’à coté de ça, des échantillons de voix soit envoyés sur les serveurs d’apple mais je n’ai vu aucune trace de ce genre de fonctionalité sur le binaire de siri.

  13. Juste pour désactiver des paranos qui peuvent surgir dans la tête de lecteurs mal renseignés, la reconnaissance vocale n’est pas une empreinte digitale ou faciale.
    I.e. contrairement à ce qu’on peut voir dans des séries américaines, on peut pas formellement identifier une personne à une voix. Quelque soit les calculateurs, sur un extrait de voix, ils seront pas plus capable qu’un humain de différencier Gérald Dahan de Manuel Valls, y a tout un tas de cours sur le sujet sur le site du college de france si ça vous intéresse.
    Après on peut faire de l’écoute téléphonique de ce qu’on chuchote à Siri, « -Siri, j’ai besoin d’un magasin de bricolage pour fabriquer des explosifs », mais c’est pas super crédible.
    Enfin en reprenant ce qui a été dis, oui la collecte d’info personnel c’est maaal; mais bon, ici, je vois mal ce qu’il y a de flippant, éclairez moi.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *