Journal d'investigation en ligne et d'information‑hacking
par Antoine Champagne - kitetoa

ALERTE : Libération pillé par Google !!! #Oupas

Le comique de répétition, ça marche toujours assez bien. Et le coup de "Google pille la presse", c'est un classique. Reflets avait déjà abordé ce sujet plusieurs fois. La presse, voudrait à la fois que Google la référence au mieux, lui envoie des millions de visiteurs clics et n'utilise pas ses articles pour faire venir des visiteurs sur les sites des journaux et autres radios ou télévisions. Cornélien.

Le comique de répétition, ça marche toujours assez bien. Et le coup de "Google pille la presse", c'est un classique. Reflets avait déjà abordé ce sujet plusieurs fois. La presse, voudrait à la fois que Google la référence au mieux, lui envoie des millions de visiteurs clics et n'utilise pas ses articles pour faire venir des visiteurs sur les sites des journaux et autres radios ou télévisions. Cornélien. Il faut bien des résumés des papiers pour donner envie aux lecteurs d'aller les lire sur les sites de la presse... Cette fois, c'est un journaliste de Libé qui semble avoir expliqué dans une conférence que son journal était régulièrement pillé par Google (cf. illustration ci-dessus). Vraiment ?

Ré-expliquons donc aux journalistes de Libé que si le site du journal se fait "piller" par Google, c'est simplement parce que leur rédaction en chef, ou leur direction générale (ou les deux) le veulent bien. Et même, Libé en redemande. Le site de Libération facilite les choses à Google en lui fournissant un "Sitemap", c'est à dire un fichier détaillé (XML) contenant toutes les adresses (URL) qui vont bien. Ce sitemap est même fourni pour Google News, l'agrégateur d'infos de Google.

Jean Quatremer, qui semble avoir fait cette déclaration (nous n'étions pas à cette conférence), serait bien inspiré de regarder en détail le fichier "robots.txt" exposé ci-dessus.

Il permet aux petits robots de Google qui viennent indexer les sites de savoir s'ils ont le droit de le faire ou pas. En l’occurrence, Libé accepte d'être indexé par Google et favorise l'inclusion de ses pages dans Google News en fournissant son sitemap aux robots de Google.

C'est d'autant plus délibéré que, comme la plupart de la presse, Libé, qui sait très bien utiliser le fichier robots.txt, refuse l'indexation de ses contenus par certains "opérateurs" comme Youmag ou Melwater (qui fait principalement profession de la vente de revues de presse).

Peut-on raisonnablement dénoncer un pillage de la presse par Google tout en lui demandant expressément d'utiliser ses contenus pour gagner quelques clics, mais aussi en encaissant 649.000 euros de la part du Fonds Google pour la Presse ?

Ce n'est pas une question pour le prochain bac philo, c'est une question pour Jean Quatremer et pour Libération.

0 Commentaires
Une info, un document ? Contactez-nous de façon sécurisée