Andréa FONTANILLE M3CAP – 21102727
« Une histoire politique de l'archivage du Web » Gildas ILLIEN, Bulletin des Bibliothèques de France, 2011, t. 56 n°2.
Contextualisation L'article, « Une histoire politique de l'archivage du web », est publié dans le Bulletin des Bibliothèques de France, revue consacrée aux bibliothèques et aux services de documentation. Gildas Illien, l'auteur, écrit régulièrement dans ce journal scientifique, ce qui ce comprend puisqu'il est conservateur en chef au service du Dépôt légal numérique de la BnF. Cependant, c'est en sa qualité de responsable technique et trésorier du Consortium International pour la Préservation d'Internet – IIPC – qu'il rédige cet article, à l'occasion de la publication d'un dossier : « politique(s) et bibliothèques ». Il explique l'histoire de l' IIPC et son fonctionnement comme exemple d'un archivage politique du web. La création d'une telle institution montre les difficultés techniques et sociologiques que l'on rencontre lorsqu'on veut archiver un nouveau média et les choix qu'amènent la préservation et la diffusion d'une ressource. Cette démarche n'est ni innée ni évidente.
Résumé Qu'est ce que IIPC aujourd'hui ? IIPC est une organisation internationale visant à l'archivage du web. Elle est composée de techniciens de l'informatique qui développent des logiciels et des normes ; d'archivistes qui gèrent la gestion des fonds ; et de bibliothécaires qui les mettent en avant. Le consortium regroupe plus d'une quarantaine d'institution à travers le monde mais reste une organisation virtuelle : ses membres se rencontrent peu physiquement (une à deux fois par an). Malgré l'éloignement physique, la structure reste très organisée administrativement. Le comité de pilotage qui gère ces quelques rencontres et vote les décisions budgétaires, est composé de trois élus : un président, un responsable de communication et un responsable des programmes. Les groupes de travail sont composés de membres d'institutions et de nationalités diverses. L'IICP met en place un forum pour le partage des connaissances sur l'archivage d'internet ; il développe des logiciels et des normes pour la collecte, la préservation et l'accès au contenu du web ; il organise des conférences, publications ou autres pour sensibiliser sur la question de préservation des contenus d'internet. 1
Le consortium se donne plusieurs missions. Tout d'abord sa mission fondamentale est de collecter, identifier et préserver le contenu d'internet tout en en assurant l'accessibilité. Il tend aussi à avoir une collection internationale tout en respectant les législations nationales. Pour cela, il plaide en faveur des lois facilitant le partage d'archives. Historique de cette organisation La genèse de cette organisation remonte à la fin des années 90 où des individus isolés ont la volonté d'archiver le web, de garder une trace de l'histoire. Ces pionniers de toutes nationalités ont su voir l'importance qu'allait prendre ce nouveau média dans nos vies alors que les institutions légales d'archivage fuyaient ce support qui les dépassait. C'est seulement des années plus tard qu'une prise de conscience internationale est possible. La première problématique est qu'il est impossible de concevoir internet comme un média national puisque les sites n'ont pas de frontière (ex : Youtube). Mais une archive mondiale ne convient pas aux législations nationales (ex : le droit d'auteur, en France). Il s'en dégage un compromis : chaque institution archivera de son côté en concertation étroite avec les autres afin de pouvoir éventuellement les réunir un jour grâce à des conventions et des modalités d'archivage communes. C'est la création de IICP. Le premier objectif est de mettre en place des outils communs et efficaces afin d'archiver le web, en ayant les mêmes formats, les mêmes normes, les mêmes standarts etc... Suite à un appel d'offre infructueux, c'est un logiciel libre de droit qui sera choisi pour ce faire. Il est décidé que le web sera conservé comme il est construit, en réseau. Gildas Illien conçoit l'histoire du consortium en trois temps. Tout d'abord « l'ère des ingénieurs » entre 2003 et 2006 qui est une phase d'innovation technologique, où le groupe composé d'ingénieurs en informatique œuvre à la création et à l'amélioration de robots chercheurs et de logiciels de conservation. Le second temps cherche à sensibiliser les institutions à travers le monde de l'importance de la conservation du contenu du web. Le consortium veut devenir une communauté audible en s'agrandissant. Ainsi, il se politise et prend une stature internationale ; son nombre d'adhérents triple en deux ans. Les institutions occidentales de conservation numérique se mobilisent et tissent des liens durables avec l'IICP. La préservation et l'accessibilité des données sont mises à l'honneur : on stabilise le modèle et l'organisation passe d'un statut de collectage à celui de maintenance des contenus du web. L'IICP perd en performance informatique. La troisième phase – marquée par la signature, en 2010, d'un nouvel accord sur le pilotage du consortium – vise à l'interopérabilité des collections nationales. Cette volonté s'exprime par la réalisation de projets communs tels que l'archivage collaboratif en grandeur réelle des sites sur les JO de Londres. Mais l'histoire du web s'accélère et il est difficile de suivre, si bien que l'IICP fait appel à des aides extérieures tournées vers la recherche et le développement pour améliorer sa qualité d'archivage. On recense aujourd'hui les premiers cas de disparitions critiques de pages web. Cependant, ces archives ont aujourd'hui un public et on commence à les considérer comme une collection, ce qui était la problématique initiale de l'IICP.
2
Des membres aux nationalités et qualités variées, une organisation à double tranchant Une obligation d'être multiple Le web est un média qui se partage sans soucis de frontières (outre la censure), il est impossible de concevoir une organisation nationale qui archive uniquement les sites de son pays : ex : comment fait-on pour les vidéos françaises sur Youtube qui est un site américain? C'est pourquoi l'IICP met en avant l'universalité de son organisme. Au niveau du travail, l'organisation est divisée en plusieurs groupes dont chacun est dirigé par deux membres d'institutions différentes, ce qui permet d'avoir plusieurs approches techniques et sensibles sur un même sujet. De plus, IICP est composé à la fois de techniciens de l'informatique et d'intellectuels de l'archivage qui, à l'image d'internet, couplent leurs compétences pour créer le support et les contenus. Difficultés d'une organisation mondiale La multitude de nationalités au sein de l'IICP, bien qu'elle fasse sa force, est difficile à gérer. Les rencontres ne sont qu'annuelles pour que tout le monde puisse être disponible. De plus, la communication peut être difficile dans un groupe de travail à cause de la barrière de la langue. Outre ces problèmes, que l'on peut qualifier de pragmatiques, viennent s'ajouter des difficultés sociologiques à la mondialisation totale de l'IICP. En effet, plusieurs pays émergents ne voient pas dans l'archivage du contenu de l'internet une priorité et ne s'allient pas à cette cause. L'archivage est politique Comme le montre Gildas Illien dans son article, l'archivage du web (ou de tout autre document) est lié de près à des choix politiques. En effet, l'utilisation de logiciel libre, la volonté de créer un organisme international ou encore la réalisation de projets communs sont le résultat de choix intrinsèques à l'IICP. Ces choix impliquent par définition des possibilités mises de côté, ce qui à l'échelle d'un organe aussi important que le web donne un grand nombre de données perdues. Quand l'immatériel devient matériel Le but de l'IICP est de concevoir une forme de collection sur des thèmes que l'utilisateur peut consulter à son gré. Le paradoxe de ces données immatérielles est qu'il faut les ranger dans des espaces concrets. Il faut se rendre compte de la matérialité de ces ressources pour comprendre la nécessité de reconnaissance de l'archivage du web auprès des institutions et l’importance d’un décret de dépôt légal du web. L'utilisation de logiciels libres donne l'impression qu'ils sont gratuits, pourtant leur conception a un coût. Les robots de recherche doivent sans cesse être mis à jour car ils sont très vite dépassés (ex : en 1 an, on est passé de 48h de vidéos enregistrées par minute sur Youtube à 72h)1. Ces logiciels demandent du temps et non de l'argent d'où l'importance de la communauté d'utilisateurs actifs à l'IICP qui facilite ainsi le développement du programme par une mutualisation des charges. 1
3
Cet article met en avant l'histoire de l'IICP comme exemple fondateur de ce qu'est une politique d'archivage du web. Il montre par les différentes phases de créations et les difficultés rencontrées, les forces et les faiblesses d'une organisation internationale. Si Gildas Illien présente IICP avec beaucoup d'affection, il reste clairvoyant sur l'avenir du consortium. On ne connait pas l'avenir du web, il faut donc que IICP reste souple dans son organisation et si l'archivage du web vient à se banaliser et à s’institutionnaliser, elle n'aura plus lieu d'être.
Commentaire Gildas Illien écrit de façon à être compris de tous : son texte n'est pas seulement un article scientifique mais aussi un outil de sensibilisation à sa cause (ce qui est une des missions de l'IICP). Je pensais avant de lire cet article qu'il était inutile de conserver une entité tel que le web puisqu'elle était conçue sur un réseau et non sur un bien matériel. Je n'avais en effet pas conscience que l'existence des pages dépendait de l'existence du serveur (cf. page 404, not found). Cependant, je ne crois pas, pour plusieurs raisons, que l'archivage dans des institutions soit la méthode la plus pertinente pour un format tel que le web. Tout d'abord, comme le reconnaît Gildas Illien leurs outils ne sont pas suffisamment compétents pour filtrer le web. De plus, créer des thématiques d'archivages ne peut pas être représentatif du web. Je pense qu'il n'est pas bon de prendre modèle sur le dépôt légal et de l'appliquer au web. Ce dernier a un développement bien trop rapide pour être conservé comme on le fait actuellement. Peut être faut-il concevoir un archivage du web conçu par tous les utilisateurs qui alimenteraient le réseau international et concevoir une mémoire mondiale du Web ?
4