Commentaires Résumé
2025/1 Matérialité des archives

Quand l’art se mêle d’archivage à long terme : une autre vision des supports de données

Commentaires Résumé

A l’ère du numérique, la matérialité des archives disparaît derrière les problèmes de pérennité. L’archiviste, si souvent confronté aux supports et formats de données devenus illisibles, se retrouve à privilégier la conservation du contenu plutôt que du contenant. Pourtant c’est bien le support qui l’occupe le plus, avec la planification des migrations et les tests réguliers de lisibilité. Dans ce contexte qui se veut tout numérique, mais qui bute sur les lois de la physique, certaines technologies commercialisées ou en cours de développement proposent une autre voie vers une migration unique sur des supports historiques de conservation.

Quo Vadis ?

2025, voilà des décennies que les archivistes travaillent sur la pérennisation des données et l’archivage à long terme des documents clés de toute organisation. La première version de la norme ISO 14721 qui établit les bonnes pratiques d’archivage électronique est née au début des années 2000 sur la base d’un rapport du comité consultatif pour les systèmes de données spatiales : c’est le fameux modèle de référence pour un système ouvert d’archivage d’information (OAIS). Ce standard qui inspire de nombreux systèmes commercialisés vient de voir paraître sa troisième édition en mars1.

Sur le terrain, c’est une autre histoire, les archivistes travaillent encore majoritairement avec des systèmes non conformes et essaient de canaliser et évaluer les contenus le plus amont possible. Mais lorsqu’en 2024, l’International Data Corporation (IDC) estime dans son rapport prospectif que près de 400 zettaoctets (4x1021 octets) seront produits d’ici à 2028, la masse est immense, même en considérant que seuls 5 à 10 % de ces informations seront conservées sur le long terme. Si en plus, on estime que la durée de vie moyenne d’un disque dur se limite à 5 ans et celui d’une bande magnétique à 30 ans, il y a de quoi avoir le vertige lorsqu’on décompte le nombre de migrations à prévoir pour conserver ses données au-delà d’un siècle.

Dans ce paysage de zéro et de un, des entreprises tentent de tirer leur épingle du jeu en s’intéressant à une problématique clé de la planification de la pérennisation : maintenir la lisibilité dans le temps et réduire le coût total de possession (Total Cost of Ownership) lié au coût cumulé des migrations de supports et de logiciels ainsi que les coûts énergétiques de stockage de données. Partons à leur rencontre.

Piql : une histoire comme au cinéma

La société norvégienne fondée en 2002 tentait de faciliter la transition numérique des cinémas grâce à la production de films digitaux enregistrés sur des bandes de film 35 mm. Le produit s’appelait Cinévator® et constituait avant tout un support de stockage permettant de lire les formats digitaux sur d’anciens équipements. Quelques années plus tard, grâce à un projet soutenu par l’Union européenne, la société a fait évoluer son système sur l’ensemble de la chaîne de traitement : de la numérisation des contenus à leur préservation à long terme, en conformité avec l’approche OAIS.

Aujourd’hui, la société se positionne sur trois types de marchés :

  • L’optimisation des conditions de stockage grâce à un stockage hors-ligne et peu gourmand en énergie,
  • La continuité opérationnelle avec la préservation des archives vitales dans des environnements peu exposés aux risques de cybercriminalité et d’attaques par radiation,
  • L’archivage à long terme.

Comment fonctionne la technologie ?

L’approche de Piql se fonde tout d’abord sur un support qui peut stocker plusieurs types d’informations. Le film photosensible en polyester peut comprendre aussi bien des données numériques stockées sous forme de codes QR que des images miniaturisées. De la même manière que sur un brin d’ADN, l’information est parcellisée et disponible en de multiples redondances, ce qui donne un rendement moyen de 120 Giga-octets de données pour une bobine de film d’environ 900 mètres linéaires. La lecture des bobines est possible sur n’importe quel lecteur dont la caméra est suffisamment puissante (résolution minimale de 8K). Le film contient en effet le code source pour les reconstituer. La technique d’écriture est en revanche propriétaire. En termes de coûts, l’écriture d’un film tourne autour de 2'800 francs et l’acquisition d’un lecteur environ 70'000 francs suisses.

Illustration 1. Exemple de lecteur à bandes Piql

Clientèle

Le produit a été adopté par diverses institutions patrimoniales, notamment en Europe centrale, en Amérique latine et au Moyen-Orient. Les National Library And Archive des Emirats Arabes Unis en sont d’ailleurs de fervents utilisateurs et présentait le produit durant le Congrès International des Archives qui s’était dé roulé à Abu Dhabi en 2023. Plus proche de nous, le produit est commercialisé en Suisse par Archivsuisse, qui compte des clients publics et privés, dont la Fondation pour la cathédrale de Berne et la Bibliothèque de la Bourgeoisie de Berne. Les études de cas pour les deux institutions peuvent être consultées sur le site web de Piql2. La société organise par ailleurs régulièrement des versements de copies de conservation dans l’« Arctic World Archive » créée sur l’île de Svalbard dans le Spitzberg3.

Cerabyte : de la performance artistique à l’archivage

Le céramiste autrichien Martin Kunze lance en 2012 un projet intitulé « Memory of Manking (MOM) »4. Il s’agit de consigner sur des tablettes en céramique des textes ou des images qui reflètent notre temps. Celles-ci sont stockées dans la plus ancienne mine de sel en activité près de Hallstatt en Autriche. Avec l’omniprésence des données numériques, l’artiste s’allie avec l'Université technique de Vienne pour développer une solution qui puisse être utilisée par les centres de données. C'est ainsi qu'en 2022, Christian et Alex Pflaum créent Cerabyte en Allemagne. 2023 voit la naissance de la filiale américaine, et en 2024, un centre de développement est ouvert à Boulder, dans le Colorado.

Comment fonctionne la technologie ?

De la même manière que Piql, Cerabyte travaille sur un support physique non électronique. Les données sont gravées sous forme de matrices dans une fine couche de céramique sur des feuilles de verre fines et flexibles à l'aide d'un poinçon de laser femtoseconde. Comme pour Piql, la redondance des données est un aspect important et le système dispose d'un mécanisme de correction d'erreurs afin de pouvoir lire les données même en cas de dommage. Une vidéo explicative permet de découvrir la technologie et l’ambition de la société.

Prochaines étapes de développement

L’équipe prévoit de réaliser un premier projet pilote avec le CERN en Suisse d'ici à la fin de l'année 2025 avec un téraoctet de données. La technologie étant encore très couteuse avant son industrialisation, l’équipe est ouverte à toutes collaborations pluripartites pour récolter le maximum d’expériences sur tous types de formats. À long terme, Cerabyte a le potentiel d'offrir les capacités de stockage qui seront nécessaires dans les prochaines décennies et qui ne peuvent être couvertes par les supports traditionnels. Des méthodes issues de l'industrie actuelle des semi-conducteurs permettront également d'atteindre des taux d'écriture et de lecture allant de 1 Go/s à 1 To/s. La vitesse initiale est de 100 Mo/s.

Illustration 2: Estimation Cerabyte de densification de gravure de données selon les techniques

Si l’outil de lecture/écriture change d’échelle, il est évident que cette technologie pourrait révolutionner le monde du stockage des données5

Contrepied à l’infonuagique et l’ultraconnexion

La présentation des technologies Piql et Cerabyte permet de s’interroger sur l’avenir de l’archivage à long terme à travers la matérialité de ses supports. En réaction totale aux pratiques infonuagiques ou aux fermes de bandes magnétiques, des entités réfléchissent à des moyens de conservation qui se détachent de l’accès en ligne constant, éradiquant des risques comme la cybercriminalité, et répondant à l’urgence climatique grâce à une empreinte carbone réduite grâce à un stockage hors ligne et peu exigeant. Les deux tableaux ci-après récapitulent les principales caractéristiques de ces solutions.

Tableau 1. Les solutions étudiées face à l’environnement
Tableau 2. Les solutions étudiées face aux enjeux d’archivage

Malgré tout, ces solutions demeurent des niches, les organisations potentiellement clientes devant être libres d’opérer d’autres choix technologiques que ceux dans lesquelles elles sont engagées. Elles ne doivent pas faire preuve de frilosité et la question de la facilité d’accès demeure un obstacle. Pour rappel, quatre heures sont nécessaires pour dérouler un film entièrement dans le cas de Piql. Dans le cas Cerabyte, un robot doit chercher la cassette stockée, puis la lire, comme cela fonctionne actuellement pour les armoires de stockage de cassettes. Une chose est certaine néanmoins, ces nouveaux entrants dans le domaine de la conservation apportent un point de vue différent sur la question de la durabilité des supports. Ils permettent d’ouvrir la discussion et forcent les archivistes à se poser la question des priorités entre l’urgence de l’accès imposé par la société et un choix plus sobre, moins risqué et plus pérenne.

Bühlmann Herzog Elisabeth

Elisabeth Bühlmann Herzog

Diplôme d’Etudes Supérieures Spécialisées en Histoire et Archivistique à l’Université Lavoisier à Angers en France en 1997, certificat en management de projet à l’Université de Genève en 2005, certificat de pratiques muséales, ICOM Suisse, en 2010.

Elisabeth a fait carrière dans la gouvernance de l’information et la gestion de projets dans des institutions internationales, dans différents domaines : la physique nucléaire, le déminage humanitaire, la biotechnologie, le sport et les biens de consommation. En 2014, elle rejoint une startup américaine pour assurer l’expansion d’un logiciel de gestion et mise en œuvre de délais de conservation, qui a été racheté en 2018. En 2019, elle crée sa société de consultance Alp’Info. En parallèle, elle possède des charges d’enseignement à la Haute école de gestion de Genève et à l’Ecole professionnelle de commerce de Lausanne. En 2021, elle a co-créé une formation en ligne pour la création du référentiel Arcateg™.

Elle fait partie du comité de rédaction d’arbido depuis janvier 2024.

Ses thèmes de prédilection sont les archives techniques ou de la recherche, les supports d’archives inhabituels et l’intelligence artificielle. Elle s’intéresse aussi à la durabilité et aux territoires de montagne et pratique le cor des Alpes.

Résumé

Grâce à la présentation des technologies Piql et Cerabyte, l’auteur présente des supports de conservation de niche qui se développent en parallèle de la technologie ADN et visent à remplacer les méthodes de sauvegarde habituelles, telles que le centre de données des bibliothèques de bandes magnétiques, sur site ou en infonuagique. Que ce soit grâce au film polyester ou à la feuille de céramique, le coût total de possession (Total Cost of Ownership) est drastiquement réduit grâce au renoncement au stockage en ligne et sur support électronique. Le revers de la médaille est évidemment la vitesse d’accès aux données. L’exercice a néanmoins l’avantage de questionner sur la relation aux données et sa nécessaire constante disponibilité.

Mit der Präsentation der Piql- und Cerabyte-Technologie stellt die Autorin Nischenaufbewahrungsmedien vor, die sich parallel zur DNA-Technologie entwickeln und die darauf abzielen, die üblichen Sicherungsmethoden wie das Datenzentrum von Magnetbandbibliotheken zu ersetzen, sei es vor Ort oder durch Cloud Computing. Ob mit Polyesterfolie oder Keramikfolie, die Gesamtbetriebskosten (Total Cost of Ownership) werden durch den Verzicht auf online- und elektronische Speicherung drastisch gesenkt. Die Kehrseite der Medaille ist natürlich die reduzierte Geschwindigkeit des Datenzugriffs. Der Versuch trägt jedoch dazu bei, die Beziehung zu den Daten sowie ihre notwendige ständige Verfügbarkeit zu hinterfragen.