Archivistique à l'ère de l'IA: Opportunités, défis et besoin d'utilisation responsable
L'archivistique est une discipline qui s'occupe de la gestion, de la préservation et de l'accès aux archives, c'est-à-dire aux documents produits ou reçus par une organisation ou une personne physique dans le cadre de ses activités. À l'ère de l'intelligence artificielle (IA), l'archivistique est confrontée à de nouveaux défis et de nouvelles opportunités.
Des opportunités d'automatisation
D'une part, l'IA peut être utilisée pour faciliter la gestion des archives. Elle peut aider à trier, classer et indexer les documents de manière automatique, en utilisant des techniques de traitement automatique du langage naturel (TALN) et d'apprentissage automatique. Elle peut également être utilisée pour détecter et corriger les erreurs dans les descriptions des archives, pour établir des liens entre des documents dispersés dans différents fonds et pour faciliter la recherche et la récupération des documents.
D'autre part, l'IA pose également des défis pour l'archivistique. Tout d'abord, les algorithmes d'IA peuvent être biaisés, car ils sont entraînés sur des données historiques qui reflètent les préjugés et les discriminations de la société. Par conséquent, les archives produites par des systèmes d'IA peuvent perpétuer ces biais. De plus, l'IA peut rendre plus difficile la détermination de l'authenticité et de l'intégrité des documents, car elle peut être utilisée pour créer des documents falsifiés.
Des opportunités d'automatisation
D'une part, l'IA peut être utilisée pour faciliter la gestion des archives. Elle peut aider à trier, classer et indexer les documents de manière automatique, en utilisant des techniques de traitement automatique du langage naturel (TALN) et d'apprentissage automatique. Elle peut également être utilisée pour détecter et corriger les erreurs dans les descriptions des archives, pour établir des liens entre des documents dispersés dans différents fonds et pour faciliter la recherche et la récupération des documents.
D'autre part, l'IA pose également des défis pour l'archivistique. Tout d'abord, les algorithmes d'IA peuvent être biaisés, car ils sont entraînés sur des données historiques qui reflètent les préjugés et les discriminations de la société. Par conséquent, les archives produites par des systèmes d'IA peuvent perpétuer ces biais. De plus, l'IA peut rendre plus difficile la détermination de l'authenticité et de l'intégrité des documents, car elle peut être utilisée pour créer des documents falsifiés.
Une journée professionnelle très riche
Dans ce cadre, la journée professionnelle de l’AAS était particulièrement riche d’idées et de discussions. Sous forme de symposium, des intervenants des sphères académiques, professionnelles et associatives de Suisse, d’Europe et de l’Amérique du Nord ont été conviés afin de célébrer les cent ans de l’AAS et enrichir ces discussions. L’AAS est une association désormais centenaire qui a choisi de se tourner vers l’avenir en considérant des divers enjeux et des mutations professionnelles, techniques et technologies. La matinée de la journée professionnelle a donné la parole aux initiateurs et aux chercheurs du projet de recherche International InterPARES Trust AI (2022-2026). Ce dernier s’appuie sur un réseau riche de plus de 500 chercheur-e-s et professionnel-le-s dans le monde et sur les trois phases précédentes du projet InterPARES Trust qui ont été initiées et dirigées par Prof. Luciana Duranti (lire l'article sur le concept de document numérique dans le cadre du projet InterPARES).
InterPARES AI vise à déterminer les avantages et les risques de l'utilisation des technologies d'IA sur les dossiers et les archives; à identifier et développer des technologies d'IA spécifiques qui peuvent répondre aux défis critiques des dossiers et des archives; à veiller à ce que les concepts et principes archivistiques informent le développement d'une IA responsable; et à valider les résultats par des études de cas et des démonstrations. Ce projet a été initié par Luciana Duranti et Muhammad Abdul-Mageed, respectivement, les porteurs de la chaire de recherche en archivistique et de la chaire de recherche en traitement automatique du langage naturel et apprentissage automatique, basés à l’Université de la Colombie britannique au Canada.
Concepts et pratiques archivistiques dans le cadre de l'IA
Le symposium a commencé par l’intervention de Corinne Rogers, coordinatrice du projet. Après une mise en contexte terminologique et scientifique des concepts importants du projet, elle a souligné les principaux enjeux critiques des caractéristiques et des impératives d’une archive numérique authentique. Elle a également rappelé la nécessité pour les archivistes de façonner activement le développement des technologies d'IA afin de s'assurer qu'elles s'alignent sur les principes et les valeurs archivistiques. Les archivistes sont appelés donc à investir dans une formation continue soutenue et un développement professionnel pour suivre le rythme de l'évolution rapide du paysage technologique.
Vincent Hoot a pour sa part rapporté l’expérience des Archives nationales des Pays-Bas en matière d’automatisation des pratiques archivistiques en présentant le concept d’archivage par conception (Archiving by Design). Il s’agit d’une méthode pour assurer l'accessibilité durable des documents dès le moment de la création ou de la capture. Les principes fondamentaux de l'accessibilité durable incluent Trouvable, Disponible, Lisible, Interprétable, Fiable et Durable/à l'épreuve du temps. Archiving by Design est une façon de penser qui nécessite un changement de mentalité d'une organisation et des personnes qui la composent, et les archivistes doivent développer les lignes directrices et les mesures nécessaires pour soutenir ce développement. Les archivistes peuvent participer à des projets pour définir les exigences et les développer ou les obtenir, et ils devraient être en mesure de fonctionner en tant que consultants, en fournissant des conseils clairs et pratiques basés sur des normes et des lignes directrices. Enfin, Vincent Hoot propose une méthodologie d'analyse de l'archivage par conception pour les organisations qui ne font pas partie des Archives nationales.
Préoccupations éthiques
Un autre thème clé du symposium était les considérations éthiques entourant l'utilisation de l'IA dans les archives. Les panélistes ont discuté des risques et des avantages potentiels de l'utilisation des technologies d'IA dans le travail d'archivage, y compris les questions liées à la confidentialité, aux préjugés et à la transparence. Ils ont également souligné la nécessité pour les archivistes d'être proactifs pour répondre à ces préoccupations éthiques et d'élaborer des politiques et des lignes directrices qui garantissent l'utilisation responsable de l'IA dans les archives.
Avec l'avènement de l'intelligence artificielle (IA), l'archivistique est confrontée à de nouveaux enjeux éthiques. L'IA peut être utilisée pour faciliter la gestion des archives, notamment en automatisant certaines tâches répétitives, en identifiant des informations pertinentes dans des documents, ou en aidant à la classification des archives. Cela peut permettre de gagner du temps et de l'efficacité dans le traitement des archives.
Cependant, l'utilisation de l'IA dans l'archivistique soulève également des préoccupations éthiques importantes. Tout d'abord, l'IA peut entraîner des biais dans la classification et la sélection des documents, si elle est mal conçue ou si elle est basée sur des données qui sont elles-mêmes biaisées. Par exemple, l'IA pourrait être utilisée pour sélectionner des documents pour la numérisation ou la conservation, mais si elle est basée sur des critères discriminatoires, elle pourrait reproduire des inégalités et des préjugés. De plus, l'utilisation de l'IA dans l'archivistique pose des questions de confidentialité et de protection des données personnelles. Les données stockées dans les archives peuvent contenir des informations sensibles sur des personnes ou des organisations, et leur utilisation par des algorithmes d'IA peut mettre en danger la vie privée de ces personnes.
Compte tenu de l’opacité de son fonctionnement exacte, l'IA peut rendre difficile la vérification et la validation des décisions prises par les systèmes d'archivage automatisés. Les décisions prises par l'IA peuvent être difficiles à comprendre ou à justifier, ce qui peut rendre difficile l'identification et la correction des erreurs. Dans l'ensemble, l'utilisation de l'IA dans l'archivistique doit être guidée par des principes éthiques solides, en veillant à ce que les avantages de l'automatisation soient équilibrés avec la protection des droits des individus et des organisations.
Réflexion sur les valeurs professionnelles
Dans le même ordre d’idée, Carol Couture a partagé ses réflexions sur comment faire face aux enjeux et mutations technologiques, structurels, disciplinaires. Sa présentation s’est focalisée sur les valeurs personnelles et professionnelles de l'archiviste contemporain. La présentation s’est organisée en trois parties. Dans la première partie, l'auteur examine un modèle théorique des valeurs personnelles pour mieux comprendre le concept de valeurs. La deuxième partie définit les valeurs professionnelles proprement dites. Enfin, la troisième partie identifie certaines valeurs professionnelles qui peuvent guider l'archiviste dans sa pratique. L'auteur explique que l'ensemble et l'ordre de ces valeurs peuvent évoluer au fil du temps.
Dans la première partie, l'auteur cite Shalom H. Schwartz, un psychologue social américain qui a développé une théorie des valeurs universelles, et identifie dix valeurs fondamentales qui transcendent les valeurs professionnelles d'un secteur d'activité. Ces valeurs sont l'autonomie, la stimulation, l'hédonisme, la réussite, le pouvoir, la sécurité, la conformité, la tradition, la bienveillance et l'universalisme. L'auteur note que ces valeurs peuvent aider à identifier les valeurs professionnelles de l'archiviste. Ceci permet d’aider les archivistes contemporains à mieux comprendre les valeurs personnelles et professionnelles qui peuvent guider leur pratique. L'auteur souligne que les valeurs professionnelles sont susceptibles d'évoluer et qu'il est important de continuer à réfléchir sur ces valeurs pour les adapter aux changements dans la pratique professionnelle.
Dans l'ensemble, le symposium a donné lieu à une discussion stimulante et informative sur les défis et les opportunités auxquels la profession archivistique est confrontée à l'ère de l'IA. Il a mis en évidence la nécessité pour les archivistes d'être proactifs dans l'élaboration du développement de nouvelles technologies et de s'assurer qu'elles s'alignent sur les valeurs et les principes archivistiques.
Évaluation de la maturité de gouvernance informationnelle
Du point de vue institutionnel, les organisations seront amenées également à faire le point sur le niveau d’avancement de leurs pratiques vers une meilleure connaissances de leurs propres réalités documentaires et leurs diverses caractéristiques et particularités de celles-ci. Ce qui permet de faciliter l’identification du niveau de capabilité et de préparation à intégrer des solutions et des outils utilisant les technologies de l’IA. L’évaluation de la maturité de gouvernance informationnelle de manière générale ou d’une fonction en particulier (classification, description, évaluation, diffusion, préservation, etc.) avec ces dimensions variées seraient très utile à cet égard. Un projet récent initié en 2023, en Suisse à la Haute école de gestion de Genève au sein du projet InterPARES Trust AI (AA02, Makhlouf Shabou) s’est intéressé à l'évaluation de la maturité des processus et des outils d'évaluation archivistique nous permettra d'identifier les considérations (barrières et facteurs facilitateurs) stratégiques, archivistiques, technologiques, éthiques, écologiques, juridiques, et notamment culturelles pour appliquer efficacement les outils d'IA pour les processus d'évaluation. Cette étude développera un modèle pour évaluer l'état de préparation de l'évaluation pour l'IA et répondra aux questions suivantes:
- Dans quelle mesure les décisions d'évaluation actuelles sont-elles défendables?
- Dans quelle mesure les pratiques d'évaluation sont-elles stables, cohérentes et reproductibles?
- Quelles sont les conditions préalables à l'intégration de l'IA à une pratique d'évaluation donnée?
- Comment les données, les enregistrements et les archives sont-ils préparés pour être évalués automatiquement et/ou «intelligemment»?
- Quelles sont les actions complémentaires pour faire évoluer les processus et les méthodes de l’évaluation pour l’usage optimisé de solution IA?
L'importance de la recherche scientifique
La recherche scientifique à la fois appliquée et interdisciplinaire demeure une excellente stratégie qui aiderait l’archiviste à mieux se positionner face aux enjeux majeurs de l’IA.
La recherche scientifique en archivistique continue à explorer activement le potentiel de l'IA pour améliorer les méthodes de gestion de l'information et accélérer leur application. Les chercheur-e-s de différents horizons étudient comment l'IA peut aider à traiter de grands volumes de données, à automatiser certaines tâches, à améliorer la recherche et la récupération d'informations, à renforcer la sécurité et la confidentialité des données, et à prévoir les besoins futurs en matière de stockage et de gestion de l'information.
Cependant, il y a aussi des préoccupations éthiques à considérer, notamment la confidentialité et la protection des données personnelles, la transparence de l'IA, l'équité dans l'utilisation de l'IA, et la nécessité de garantir que les décisions prises par l'IA sont justes et fiables. Les chercheur-e-s doivent travailler en étroite collaboration avec les archivistes et les professionnels de l'information pour trouver un équilibre entre les avantages potentiels de l'IA et les risques éthiques et juridiques qui peuvent en découler.
Abstract
- Français
- English
- Deutsch
L'archivistique est une discipline qui s'occupe de la gestion, de la préservation et de l'accès aux archives, c'est-à-dire aux documents produits ou reçus par une organisation ou une personne physique dans le cadre de ses activités. À l'ère de l'intelligence artificielle (IA), l'archivistique est confrontée à de nouveaux défis et de nouvelles opportunités.
Archival science is a discipline that deals with the management, preservation, and access to archives, i.e., documents produced or received by an organization or a person in the course of their activities. In the era of artificial intelligence (AI), archival science faces new challenges and opportunities.
Die Archivwissenschaft ist eine Disziplin, die sich mit der Verwaltung, der Erhaltung und dem Zugang zu Archiven befasst, d. h. zu Unterlagen, die von einer Organisation oder einer natürlichen Person im Rahmen ihrer Aktivitäten erstellt oder empfangen wurden. Im Zeitalter der Künstlichen Intelligenz (KI) steht die Archivwissenschaft vor neuen Herausforderungen und Chancen.