Internet Archive, la bibliothèque numérique utopique au service de la mémoire collective du web - Minizap Nord-Isère
Multimédia

Internet Archive, la bibliothèque numérique utopique au service de la mémoire collective du web

Né il y a près de 30 ans d'une vision audacieuse, Internet Archive s'est imposé comme la plus grande bibliothèque numérique du monde. Avec ses 70 pétaoctets de données, cette organisation à but non lucratif préserve livres, films, musiques, et surtout, l'histoire mouvante du web. Sa célèbre Wayback Machine permet de voyager dans le temps numérique, offrant un accès inédit à 700 milliards de pages web archivées. Présentation.

Dans les profondeurs du cyberespace, une forteresse numérique se dresse, gardienne infatigable de la mémoire collective du web. Internet Archive, qui va bientôt fêter ses 30 ans, est bien plus qu'une simple bibliothèque en ligne. C'est un ambitieux projet qui s'est donné pour mission de préserver l'héritage digital de l'humanité, des premières pages web aux derniers tweets, en passant par des millions de livres, films et enregistrements audio.

Une bibliothèque numérique aux ambitions universelles

L'Internet Archive est né d'une vision audacieuse : offrir un accès universel à la connaissance. Ses fondateurs, Brewster Kahle et Bruce Gilliat, anciens créateurs du moteur de recherche Alexa, ont lancé ce projet en 1996, à l'aube de l'ère Internet. Leur ambition était de créer une bibliothèque numérique capable de préserver la mémoire fluctuante du web. Kahle, souvent comparé à un bibliothécaire d'Alexandrie des temps modernes, expliquait alors : « Pour l'avenir, nous pouvons avoir des écrits non pas de cent millions de personnes, mais d'un milliard de personnes, préservés pour toujours. » Cette mission s'inscrit dans la lignée des utopistes de la connaissance ouverte, un idéal cher aux pionniers d'Internet. L'organisation, basée à San Francisco, opère comme une bibliothèque numérique à but non lucratif, financée par des dons et des subventions. La collection d'Internet Archive est un véritable trésor numérique d'une ampleur vertigineuse. Avec plus de 70 pétaoctets de données, elle englobe une diversité stupéfiante de contenus. On y trouve plusieurs millions de livres numérisés, des millions d'enregistrements audio allant de la poésie aux émissions de radio, et une vaste collection de vidéos comprenant des films d'archives, des journaux télévisés et même des matchs sportifs historiques. Les chiffres donnent le vertige : 2 millions de films et vidéos, des centaines de milliers de logiciels et des millions d'images. Parmi ces joyaux, on peut citer les cours manuscrits de Louis Althusser à l'École Normale Supérieure en 1968 ou encore une collection de films de Georges Méliès. Mais l'outil phare d'Internet Archive reste sans conteste la Wayback Machine, lancée en 2001. Cette innovation permet de voyager dans le temps du web, offrant la possibilité de visualiser l'évolution des sites internet au fil des années. Avec plus de 700 milliards de pages web archivées, elle a capturé par exemple 18 000 versions du site de France Inter entre 2004 et 2021.

Défis et controverses d'un projet titanesque

Malgré son succès, Internet Archive fait face à des défis colossaux, tant sur le plan technique que juridique. La préservation à long terme de volumes de données aussi massifs pose des problèmes techniques et financiers considérables. L'organisation doit constamment adapter ses infrastructures pour stocker et rendre accessibles des pétaoctets d'informations, tout en luttant contre l'obsolescence technologique. Sur le front juridique, Internet Archive se trouve au cœur d'une bataille sur les droits d'auteur. En 2020, quatre grands éditeurs américains - Hachette, HarperCollins, Wiley et Penguin Random House - ont intenté un procès à la plateforme, l'accusant de violer le copyright avec son système de prêt de livres numériques. Ce litige soulève des questions cruciales sur l'équilibre entre l'accès à la connaissance et la protection de la propriété intellectuelle à l'ère numérique. Par ailleurs, la valeur probante des archives web fait l'objet d'un débat juridique. Si certaines cours, comme le Tribunal de grande instance de Paris en 2015, ont reconnu la validité des preuves issues d'Internet Archive, d'autres restent réticentes. Cette évolution jurisprudentielle témoigne de l'importance croissante des archives numériques dans notre société, tout en soulignant la nécessité d'adapter le droit à ces nouvelles réalités.

Photos liées à l'article
© CC0
Multimédia

Le roi World of Warcraft s'offre du répit avec The War Within

Deux décennies après sa sortie initiale, World of Warcraft tente de se réinventer avec son extension The War Within. Si l'accessibilité est au coeur des préoccupations de Blizzard, le résultat est bon sans provoquer un enthousiasm...
Lire la suite
Le roi World of Warcraft s'offre du répit avec The War Within
Multimédia

Buds3 Pro : une immersion sonore sans compromis

Samsung bouscule les codes des intra-auriculaires avec ses nouveaux Galaxy Buds3 Pro. Ces écouteurs true wireless haut de gamme promettent une expérience audio immersive, une réduction de bruit active performante et une intégratio...
Lire la suite
Buds3 Pro : une immersion sonore sans compromis
Multimédia

Avec les modèles o1, les IA d'OpenAI passent leur doctorat en physique, chimie, ...

OpenAI bouleverse le monde de l'intelligence artificielle avec sa nouvelle série de modèles o1. Ces IA, conçues pour " réfléchir " avant d'agir, promettent des avancées majeures dans la résolution de problèmes complexes. Une révol...
Lire la suite
Avec les modèles o1, les IA d'OpenAI passent leur doctorat en physique, chimie, biologie et programmation