L'organisation à but non-lucratif The Internet Archive a mis en place des liens directs vers les livres cités sur les pages Wikipédia. L'initiative n'est pas encore valable pour toutes les pages, mais ce n'est que le début.
L’encyclopédie Wikipédia est l’une des plus grandes ressources culturelles du web. Mais parfois, quelques informations fournies sur les pages sont difficiles à vérifier à cause de sources inaccessibles. C’est le cas surtout pour les ouvrages. Une initiative de The Internet Archive, annoncée le 29 octobre 2019, va progressivement changer notre usage de Wikipédia : sur certaines pages, il est désormais possible de prévisualiser les pages de livres dont sont originaires les citations.
Cette initiative est cohérente avec la mission que s’est fixée l’organisation à but non lucratif The Internet Archive. Vous connaissez peut-être la fameuse Wayback Machine, qui offre la possibilité de visiter les anciennes versions d’un même site web. En dehors de cette fonctionnalité phare, Archive.org est une gigantesque bibliothèque virtuelle. Elle référence plus de 7 millions de fichiers musicaux, 5 millions de films et 22 millions de livres.
Retrouver la source bibliographique d’une citation Wikipédia, dans la bonne édition, peut être un vrai parcours du combattant.
Puisque Wikipédia est une encyclopédie, il est bien normal que de nombreuses citations proviennent de livres. Mais quand il s’agit d’utiliser ces informations, les étudiants, les chercheurs, ou même les journalistes, ont besoin d’accéder à la véritable source. Il est mal vu de citer Wikipédia puisque ce n’est qu’un intermédiaire, où une erreur pourrait donc se glisser — malgré un processus de vérification collaboratif assez strict. Or, jusqu’à maintenant, le processus de vérification impliquait un travail de recherche pour retrouver soi-même une copie physique ou numérisée de l’ouvrage. Dégoter la bonne édition d’un livre, ou certaines œuvres rares et anciennes, peut parfois s’avérer être un parcours du combattant.
Cette difficulté pourrait bientôt ne plus être qu’un lointain souvenir. En se basant sur son énorme stock, The Internet Archive vient d’ouvrir une nouvelle ère dans notre utilisation de Wikipédia. « The Internet Archive a transformé 130 000 références à des livres dans Wikipédia en liens directs vers 50 000 livres numérisés par Internet Archive ». Pour l’instant, cette démarche ne concerne que les éditions anglaises, grecques et arabes, mais « nous ne faisons que commencer », précise le communiqué.
Concrètement, le module où la source bibliographique comporte un lien qui vous redirige directement vers un extrait de l’ouvrage — et la bonne édition, celle qui est vraiment citée dans la page. Par exemple, sur la page anglaise de Martin Luther King, l’ouvrage To Redeem the Soul of America sert de référence à partir de sa page 299. En cliquant sur le lien en bas de page, vous êtes automatiquement redirigés vers cette page. Vous ne pourrez voir que la page concernée et quelques autres après : pour le livre complet, il faut l’emprunter.
Communiqué de Wikipédia
« Ce qui a été écrit dans les livres à travers les siècles est essentiel pour informer la nouvelle génération éduquée au numérique », indique un bibliothécaire de The Internet Archive, dans le communiqué. L’objectif est de créer une sorte de « maillage de livres » dans la structure même du web. « Nous pouvons accomplir un accès universel à tout le savoir », ajoute le directeur de la Wayback Machine Mark Graham. Cette démarche coûte à The Internet Archive environ 20 dollars pour chaque livre numérisé, raison pour laquelle l’organisation en profite pour remettre en avant son appel à dons.
L'organisme à but non lucratif veut toujours « combattre l'extinction numérique » et améliore régulièrement sa Wayback Machine en ce sens.
Une des principales nouveautés est la possibilité de comparer facilement deux versions d'une même URL avec une mise en surbrillance des changements. Un onglet « Changes » est disponible en dessous de l'URL. En plus de comparer les pages, il donne un indicateur sur la quantité de changements effectués.
La fonctionnalité Save Page Now propose désormais de sauvegarder au passage l'ensemble des liens internes et externes. Vous pouvez également enregistrer les pages dans une liste publique.
Signalons aussi Collections, une nouvelle manière de « savoir pourquoi une URL donnée a été archivée dans la Wayback Machine », la possibilité d'afficher toutes les sauvegardes d'une URL sur une seule journée (qui peut parfois se compter par centaines ou milliers). Tous les détails sont donnés dans ce billet de blog.
Accéder à la Wayback Machine
En 2015, les ministres européens ont autorisé Europol à mettre en place le European Union Internet Referral Unit (EU IRU), une entité ayant pour objectif d’endiguer le nombre et l’impact des contenus terroristes, extrémistes ainsi que ceux qui sont utilisés dans le cadre de l’immigration illégale pour le trafic de migrants sur Internet. Le EU IRU tirerait parti des « relations de confiance qui existent entre les autorités de police [et] le secteur privé » et fournirait « aux États membres un appui opérationnel sur la manière de réaliser plus efficacement la détection et la suppression d’un volume croissant de contenus terroristes sur Internet et sur les médias sociaux ». À l’échelle des pays membres, le EU IRU peut être appuyé par une unité locale : c’est le cas en France avec l’IRU française ou en Belgique avec l’IRU belge.
L’Internet Archive - un organisme à but non lucratif basé à San Francisco qui est chargé de l’archivage du Web et de la création/gestion d’une bibliothèque numérique constituée de clichés instantanés de pages Web, logiciels, livres et divers contenus multimédias - a récemment reçu une série de courriels qui émaneraient de l’Internet Referral Unit (IRU) Française. Ces notifications identifieraient à tort des centaines d’URL (environ 550) hébergées sur archive.org, le site Web de l’organisation, comme de la « propagande terroriste ». La plupart concerneraient uniquement des éléments conservés et publiés directement par l’Internet Archive, d’autres seraient liés au contenu mis en ligne par des utilisateurs.
Une de ces URL au moins — elle renvoyait vers un article qui traite du Coran — aurait été identifiée comme du contenu terroriste dans un avis de retrait indépendant envoyé par l’Office central de lutte contre la criminalité liée aux technologies de l’information et de la communication (ou OCLCTIC) à l’Internet Archive. Signalons au passage que l’OCLCTIC est une branche de la direction centrale de la Police judiciaire française qu’on appelle aussi la Sous-direction de la lutte contre la cybercriminalité (SDLC).
Rappelant que le Parlement européen devrait se prononcer sur une législation exigeant que les sites hébergeant des contenus générés par les utilisateurs bloquent ou suppriment les contenus rapportés comme terroristes dans un délai d’une heure, l’Internet Archive estime que cette situation illustre les limites d’un projet de loi qui « nuirait au libre partage de l’information et à la liberté d’expression que l’Union européenne s’engage à protéger ». D’après l’Internet Archive, cette « exigence d’une heure signifie essentiellement que nous devrions supprimer automatiquement les URL signalées et faire de notre mieux pour les réviser après coup ».
« Ce serait déjà assez grave si les URL erronées dans ces exemples visaient un ensemble d’éléments relativement obscurs sur notre site, mais les listes de l’IRU française incluent certaines des pages les plus visitées sur archive.org et des documents qui ont évidemment une grande valeur éducative et scientifique », a confié l’Internet Archive à ce propos.
Précisons enfin que l’association AccessNow qui milite pour la protection des droits fondamentaux sur Internet estime que l’EU IRU agit « en dehors de l’état de droit sur plusieurs plans », car la justice étatique doit primer face aux illégalités. AccessNow assure en outre que « reléguer le traitement des contenus illicites à un tiers, et lui laisser la discrétion de l’analyse et de la poursuite, n’est pas juste paresseux, mais extrêmement dangereux ».
Bien que les courriels de l’IRU française aient été envoyés avec une adresse « @europol.europa.eu », le UE IRU aurait confié qu’il ne participait pas aux critères d’évaluation du contenu terroriste des IRU. Devrait-on en déduire que l’IRU française n’est en réalité qu’un trompe-l’œil démocratique ?