Le Point : robots, veuillez cacher ces articles que je ne saurais voir…

Ah… Le Point, un vrai journal qui sait redresser les torts lorsqu’il le faut. Par exemple, sa dernière couverture est parlante : il y a en France des « enfants gâtés » qui bénéficient de salaires mirifiques, de revenus indus, qui échappent à l’impôt. Salauds… Heureusement, Le Point, et son directeur de la rédaction, Frantz-Olivier Giesbert sont là pour pointer du doigt tous ces « enfants gâtés » qui ont tant de choses à se reprocher. Dans la foulée du Nouvel Observateur qui a un fichier robots.txt très personnel et de Challenges dont le fichier robots.txt dépasse l’entendement, Reflets est allé voir celui du valeureux Point. Vous allez voir, ça vaut aussi son pesant de cacahouètes.

Si le début du fichier semble classique, la suite est plus discutable.

A leur arrivée sur le site du Point, tous les moteurs de recherche reçoivent pour instruction de ne pas archiver des fichiers de type zip ou xls (pourquoi pas .doc, .xlsx, mystère…) et se voient interdire l’entrée dans certains répertoires comme « /user/classeur/. Jusque là, tout le monde comprend à peu près.

En revanche, lorsque Le Point demande aux robots des moteurs de recherche et autres indexeurs fous de ne pas référencer un article parlant de « faussaires » et de « naïfs », on a comme une envie d’aller regarder de quoi il s’agit.

Tout simplement d’un article qui évoque des personnes ayant, si l’on en croit l’auteur de l’article, profité de la crédulité de certains pour leur vendre des croutes au prix de tableaux de maîtres.

Étonnamment, Le Point ne veut pas que ce papier ressorte dans les requêtes sur des mots clefs qu’il contient. Et il explique d’ailleurs aux moteurs de recherche qu’un droit de réponse publié à propos de cet article, ne doit pas être indexé non plus.

Ce qui est très intéressant, c’est que la presse qui vient sur le Net s’accommode assez bien de certaines possibilités offertes par le Web.

Si vous lisez l’article sur les faussaires et les naïfs, vous notez qu’il n’est nulle part fait mention de ce droit de réponse. Et quand vous lisez le droit de réponse, vous notez qu’il n’est nulle part fait mention du nom de l’auteur de ce droit de réponse.

L’article n’est pas signé (sur le Web), l’était-il sur la version papier ?

Mon petit doigt me dit que l’article en version papier devait être signé (on va y revenir), mais je peux me tromper. Et tout cas, cette histoire a visiblement été un peu plus loin qu’un simple droit de réponse puisque Le Point a été condamné (Tribunal de grande instance de Paris, 17ème chambre civile, 24 janvier 2007)…

Plus drôle encore (oui, c’est possible), en inscrivant ces URLs à ne pas indexer, dans le robots.txt de son site, Le Point provoque une indexation de cet article :

Et comme il y a une série d’URLs à ne pas indexer, il n’est pas inutile d’aller regarder les autres. Par exemple celle-ci. Où l’on apprend que Le Point ne veut pas que l’on sache qu’il a été condamné pour la publication de cet article. Mais surtout, on apprend dans cette « Publication judiciaire » (ordonnée donc par décision de justice) que l’article papier… était signé de Vincent Merlot. Un nom qui disparaît dans la version en ligne. Pour ce qui est des autres URLs interdites, la raison est moins évidente et il appartient au Point de l’expliquer si bon lui semble.

 

 

Twitter Facebook Google Plus email

Auteur: Antoine Champagne - kitetoa

Dinosaure du Net, journaliste à ses heures. A commis deux trois trucs (Kitetoa.com, Aporismes.com et Reflets.info).


39 thoughts on “Le Point : robots, veuillez cacher ces articles que je ne saurais voir…”

  1. Ah ces Reflets, si rétifs ! :)

    Une chtite estocade est portée, ces media??? sont leur tendon d’achille.

    Dis donc Kitetoa, tu les as à la bonne à donner le txt sous forme pic, rapport aux efforts demandés aux lecteurs -;)

    Pas pris le temps de tout explorer, mais en tout cas
    lepoint.fr/auto-addict/actualites/l-etat-et-les-banques-preparent-un-sauvetage-de-la-filiale-credit-de-psa-presse-17-10-2012-1517751_683.php
    eh bien ya plus – je crois que j’ai bien recopié url.

    Fully disallowed quoi.

    Fog, en ricain, ça veut dire brouillard non?

    Respects.

    1. « Dis donc Kitetoa, tu les as à la bonne à donner le txt sous forme pic »
      « je crois que j’ai bien recopié url »
      Note que tu aurais pu simplement consulter directement le robots.txt plutôt que de recopier le texte de l’image, plus simple de faire un ctrl-c / ctrl-v du coup non ? ;)

      1. Combien d’internautes savent comprendre et faire ça?

        Reflets doit il être à ce point ciblé?

        Des « moins à l’aise » mais aux combats convergents (Ogm, climat, démocratie, etc…) ne méritent ils pas plus d’égards?

        De ces égards Reflets en sortirait il grandi?

        Etc…
        :)

        1. « Combien d’internautes savent comprendre et faire ça? »
          Il me semble que la question est judicieuse, vu qu’a priori, c’est la raison de nombreux problèmes dans notre société !
          (on peux surement généraliser à de nombreux domaines d’ailleurs)

          Je ne répondrais pas au reste, n’étant réellement pas sur d’en comprendre toute la substance.

          1. Tu préconises l’éducation générale à l’exploration des robots.txt, entre autre?

            Ca fait beaucoup de volume à traiter, et je me demande si ce n’est pas une faiblesse de penser les choses à faire selon cet axe là.

          2. Non, je sous entendais que d’une manière générale les gens n’ont aucune curiosité, et ne s’intéressent pas à grand chose, c’est valable à peu près pour n’importe-quel domaine,
            et l’exemple du « robots.txt » illustre bien la chose.

            Après certes ca ne rends pas quelqu’un stupide de ne pas savoir spécifiquement ce qu’est ce fichier, mais à force de rester stupide, on devient con. (no offense intended)

          3. Que répondre Chk…

            Ce que je peux te dire, c’est que j’ai été très souvent marqué par la quantité de choses auxquelles s’intéressaient bien des « stupides » et des « cons », pourvu qu’on les regarde tels qu’ils sont et non pas tels qu’on voudrait qu’ils soient.

            Ca ramène à plein de choses tout ça. Aux enfants et à l’éducation notamment, ou au « journalisme » pourquoi pas.

            On ne peut pas demander à 65 millions de français de s’exciter sur des robots.txt ou des linux ou que sais je.
            Par contre ceux qui s’y intéressent peuvent en extraire des infos chocs et « vulgarisées » par exemple.

            Sans parler du fait que le root, c’est pas là où on trouve les meilleurs infos chocs potentiellement utiles, n’est ce pas? :)

          4. Add on Chk, pour lever une « ambiguité » possible.

            Je ne suis pas informaticien, et à vrai dire mettre les mains dans le technique m’a toujours un peu épuisé ; en plus, j’ai lâché cette affaire, je me suis orienté vers des trucs plus concepts et « grand public ».
            Des robots.txt, j’en ai écris ou demandé d’écrire il y a pas mal d’années de ça. Et des Ubuntu oui je sais c’est mal, des css, des html, des trucs et d’autres, j’en ai trafiqué ou « géré » quelques uns.

            Tu vois le truc?
            Très grand respect pour informatique, pour les hackers à pc&réseaux, mais pas que.

            La masse des gens elle n’a pas à être obligée aux recherches et décodages des robots.txt et à l’intall d’un linux avec lignes de commandes step by step amha.
            Par contre elle devrait savoir que ça existe, que c’est important, les grandes lignes quoi. Après, c’est DIY mais comme elles veulent ou pas.

            Tiens, le valeureux Etienne C et son site de ouf :) Exemple type du mec pas briefé sur les robots.txt mais qui a quand même DIY et pas qu’un peu dans le domaine qui l’intéressait LUI.

          5. Je comprends ton point de vue,
            mais si on synthétise, en fait ce que tu préconises, ce n’est ni plus ni moins que du nivellement par le bas.

            Alors certes je suis programmeur, donc on pourrait dire que j’ai un avis biaisé, ca m’empêche pas d’ouvrir un bouquin sur la soudure si j’ai de la plomberie à faire si tu vois ce que je veux dire, et miracle ! à force de faire comme ca on apprends plein de trucs !

          6. Moi, le nivellement, que ce soit par le haut ou par le bas, j’aime pas comme concept.

            Je suis un montagnard, les pics, les vallées, les pics, les vallées, les forêts, les pics, les crevasses, les séracs, les vallées, tout ça ;)

  2. Comme c’est la fête aux robots, bonne fête aussi aux disallow de l’Express:

    Disallow: /informations/enquete-sur-une-manip_593887.html
    Disallow: /actualite/societe/justice/le-pdg-de-skyrock-sur-le-banc-des-accuses_585356.html
    Disallow: /informations/ps-la-manip-du-porno_654880.html

    Aux suivants ^_^

    1. :)
      J’ai un faible pour Barbier, à cause de son écharpe marron sans doute, peut être à cause d’une vieille histoire liée à ces vilains voyous que sont ces A aussi. Il mérite un traitement « espécial » amha.

        1. Moi aussi.
          J’ai beaucoup de respect pour Halimi.
          Mais tout autour d’Halimi il y a foule qui fonctionne avec des dd-readonlymemory gravés dans du bois quasi centenaire, et pire qui en sont fiers comme un bar tabac.

          1. Tu es gonflé Kholl :)

            Halimi c’est MondeDiplo, je ne vais pas te faire un dessin « idéologique et conceptuel » avec quelques noms au hasard qui clignotent juste pour appâter le chaland, quand même.

      1. Des orientations sexuelles à masquer?
        Des amis à épargner?
        Mais dans ce cas un « delete » serait plus efficace (surtout qu’ils ne sont pas tout jeune ces articles). Ouep, pas clair…

        Je ne doute pas une seconde que Reflets soit allez vérifier tous les robots.txt de la presse Fr pour notre plus grand plaisir ;)

        Merci, bravo.

      1. Non mais cela prouve bien que la connexion neuronale merde à un endroit!
        C’est un truc du genre:

        **** Intermède Musical- Au lancement du site ****
        -Directeur: On à besoin d’être référencé sur les moteurs de recherche pour pouvoir être visible sur la toile! Des suggestions?
        -Financier: Ben on se fait référencer sur Google(90% en France)
        -Directeur: Ok bonne idée!

        **** Intermède Musical- Quelques Années Après****
        – Directeur:Bon les mecs il faut gagner plus de pognon sans toucher à notre business-model! Des idées?
        – Financier: Vous savez, je pensais à un truc…
        – Directeur: Allez y!
        – Financier: Vous savez que google indexe gratuitement nos contenus?
        – Directeur: Oui
        – Financier: Et colle des pubs dans les résultats pour gagner du pognon?
        – Directeur: Un peu comme nous dans nos articles?
        – Financier: Exactement!Et maintenant c’est la que c’est beau: Et si on les faisait raquer pour cela
        – Directeur: Mais c’est une idée complètement con! Google indexe les contenus et fait en sorte que les clients puissent accéder à notre site que ce soit via Google ou Google News! Nous amène des lecteurs et donc du pognon!
        – Financier: Vous en faites pas. La majorité des gens comprennent pas comment ça marche. ON trouvera bien des arguments fallacieux pour faire passer cela.
        – Directeur: Sans dec? On risque Quelque chose?
        – Financier: Hormis le fait de passer pour des cons?
        – Joe-le-rigolo: Ça à la presse FR on à l’habitude!
        – Financier: Ben Google pourrait nous faire un gros doigt et supprimer notre site des résultats de recherche. On disparaitrait du Web FR, on perdrait du trafic et donc beaucoup de pognon
        – Directeur: A ouais… Quand même. Du coup si cela arrive il faudra faire marche arrière pour supprimer cette idée conne au départ. Et on passerais à nouveau pour des cons!
        – Financier: On est en France! Une loi qui est votée puis révoquée quelques temps plus tard parce-que au final elle ne servait que les intérêts de certains les gens ont l’habitude. Cela ne va pas plus les défriser que cela!
        – Directeur: Bon allez feu. Va falloir faire larmoyer l’opinion comme la quoi la presse est exsangue sur la paille parce que google indexe nos contenus et nous renvoie des clients! Putain j’arrive pas à croire que je puisse dire une telle connerie! Mais bon si c’est pour engranger quelques millions sans se bouger le derche ça ira! Messieurs cette réunion est terminée. RDV pour la prochaine ou nous réfléchirons sur comment justifier la mobilisation de l’appareil législatif pour servir des intérêts privés, tout en sachant très bien qu’il faudra re-mobiliser tout le monde pour faire annuler cette loi que nous même avons demandé.

        La suite arrivera bien assez tôt

  3. Ce qui serait épatant, ce serait d’exposer leur tartufferie dans leur propre journaux.
    Comme vous le démontrez, ils savent parfaitement faire en sorte que des pages ne sortent pas sur Google (après tout, ils ont une équipe un peu compétente pour gérer leur site…) et donc, pratiquent ainsi l’auto censure.
    Mais, comme le fait remarquer Marc Rees dans cet article chez PCInpact ( http://bit.ly/SrmhUL ), Google faillirait à sa tache d’intérêt publique, voir se poserait en censeur, en refusant d’indexer les sites de presse, selon le SPQN.
    Merci Internet de nous permettre de relever ces conneries, parceque c’est pas dans le Monde (ou ailleurs) qu’on va en parler…

      1. Oui, mais la pub leur permet de fonctionner en assurant leur financement (ne pas mordre la main qui vous nourrit?) .
        Google n’est ni nécessaire, ni suffisant. Il n’est plus qu’un alibi pour une subvention (déguisée) de plus.
        Ah, et si l’Etat subventionne, faut pas le mordre lui non plus. Autant fermer les journaux…

        1. Cela revient à dire que le « journalisme » n’existe plus.
          On a affaire maintenant à des organes « marketing » qui « placent » des « produits » et façonnent (ou essaient) l’opinion. De temps en temps, on glisse une paraphrase d’AFP ou Reuters pour faire croire qu’on bosse vraiment.

          Quoi d’étonnant alors que les journaux soient moins lus que les prospectus de grande surface ?

          1. Regarde a qui appartiennent les grands quotidiens, radios, chaines de télé….
            que ce soit en france, en europe, aux usa (ou s’est encore plus flagrant je trouve)…
            et quels sont leurs intérêts…

            Nous CAYBON on a BHL…. on est sauvé

  4. @Kitetoa & kholl, regarder par exemple du coté de XXI, aucune pub, jamais, et indépendance rédactionnelle complète.

    Comment ? Avec une gestion du prix du numéro quasi sans faille (la perfection, comment dire ?) et une base maximale d’abonnés plutôt que de vente indirectes (un maxima de retours direct donc).

    A noter qu’en prime, ils pratiquent le principe de l’achat sur présentation sinon du contenu au moins du projet de. Avec cependant du contenu type « dossier cross édition » pour bien « creuser » un sujet (a la façon de la radio Suisse (RTS) qui arrive a très bien géré ce type d’émissions, quasi inconnue par chez nous (?).

    Intéressant article, merci Reflet !
    (Le web 2.0 et l’humain, une histoire de limites cognitives a l’heure des thérapies quantiques ?)

  5. Ohlala, il y a des cliniques ou je ne mettrais jamais les pieds… J’aime internet et ses professionnels experts et tellement bons conseillers, tenter d’effacer les mémoires des robots mais en garder la trace dans le même temps ça c’est chapeau!

    Bravo reflets, j’en ris encore.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *