Commentaires Résumé
2018/2 Automatisation: opportunité ou menace?

Archives et Wikidata

Commentaires Résumé

Le travail d’archiviste en Suisse a été en grande partie jusqu’ici un labeur solitaire et artisanal. Est-il destiné à le rester? Face aux défis que pose la maîtrise actuelle de l’information, on peut en douter. Cet article envisage le rôle que pourrait jouer la plateforme Wikidata, et, par ce biais, la technologie des données ouvertes liées, pour renouveler le travail des archivistes. Cet article se veut exploratoire. Il vise à stimuler la réflexion et le débat.

«Je rêve d’un âge nouveau de la curiosité. On en a les moyens techniques; le désir est là; les choses à savoir sont infinies; les gens qui peuvent s’employer à ce travail existent. De quoi souffre-t-on? Du trop peu: de canaux étroits, quasi monopolistiques, insuffisants.»1 Le philosophe masqué

Le manque de visibilité et d’accessibilité en ligne des descriptions des archives est un fait, mais on dira peut-être un jour à ce propos «et Wikidata est arrivé».

Comme on peut déjà le dire pour Wikipédia à propos du savoir encyclopédique, tous les ingrédients semblent en effet rassemblés pour que Wikidata, lancé en 2012, devienne le nœud absolument central de notre accès à l’information. On pourrait y voir comme une réponse tardive aux songes du philosophe masqué.

L’intérêt de la plateforme Wikidata vis-à-vis des documents regroupés au sein du portail Wikimedia Commons ayant déjà été évoqué dans arbido (3/2017), nous allons pour notre part en examiner son grand intérêt pour la description d’archives en général2.

Cet article s’insère dans un contexte foisonnant d’expérimentations, en Suisse comme ailleurs, autour des données ouvertes liées (Linked Open Data ou LOD en anglais), qui semblent offrir des perspectives nouvelles et enthousiasmantes pour nos métiers, comme en atteste, parmi d’autres, le tout récent et important document auxiliaire publié par eCH3 à ce sujet.

Son propos pourrait être résumé ainsi: les méthodes de description sont tributaires des technologies et des outils techniques pour les mettre en œuvre. Or la technologie des données ouvertes liées semble ouvrir un nouveau chapitre en cela. Dès lors, quels outils techniques choisir? Notre article propose d’utiliser massivement le portail mutualisé Wikidata pour toutes les données issues des archives pour lesquelles ce n’est pas illégal.

Mais qu’est-ce que Wikidata? Elle se définit comme «une base de données libre, collaborative, multilingue, et secondaire qui collecte des données structurées pour alimenter [...] les autres projets du mouvement Wikimédia et pour n'importe qui sur la planète»4.

Ce qu’il faut en savoir:

  • cette base de données collaborative en ligne répond aux standards des données ouvertes liées;
  • elle dispose de critères de recevabilité des informations plus large que Wikipédia. Toute information du moment où sa source est indiquée est recevable dans Wikidata5;
  • son contenu vise à alimenter dynamiquement d’autres portails (Wikipédia, Dbpedia, etc.);
  • son interface principale (wikidata.org) n’est pas une interface de consultation mais de saisie.

Wikidata répond aux principes des données ouvertes liées. Elle est donc un outil très actuel. À la pointe de la technologie contemporaine. Mais ce n’est pas seulement cela, car c’est aussi un projet récent de la Wikimedia Fondation et, en ce sens, le résultat de l’expérience accumulée par celle-ci dans le développement d’outils en ligne d’usage gratuit, collaboratifs, multilingues et utilisant des données aux formats et licences ouverts. En ce sens, si Wikidata est un outil de gestion et publication de données ouvertes liées parmi d’autres, son grand intérêt réside dans sa disponibilité en ligne, sa gratuité, son outillage collaboratif évolué et son code ouvert.

Wikidata et co-construction

Ce que Wikidata peut irrémédiablement changer, c’est la mutualisation des efforts des archivistes vis-à-vis de la description. Jusqu’à présent, ce que les archivistes avaient espéré et tenté, c’était de pouvoir échanger et interroger leurs données respectives. Chacun restait derrière ses portes closes, mais entrouvrait la fenêtre de son guichet de consultation de données. Le projet envisageable avec Wikidata est inverse: toutes et tous travaillent de façon collaborative sur les mêmes données. Les données partagées et ouvertes. Toutes et tous travaillent ensemble à bâtir une base de connaissance commune. On rejoint ici complètement Beat Estermann, qui propose dans une vision plus large que le projet que Wikidata devienne «a central hub for data integration, data enhancement, and data management in the heritage domain»6.

Selon notre hypothèse, toutes les données qui peuvent légalement l’être, devraient être transférées sur Wikidata. Et quand nous disons transférées, cela ne veut pas dire établir un lien d’homologie entre des entités, par exemple entre notices d’autorité comme cela peut être le cas au travers du projet Metagrid7, mais bien que l’entité référencée soit celle de Wikidata.

Nous y voyons une cascade de conséquences positives:

  • cela pousserait les institutions à enrichir les données dans Wikidata et améliorerait exponentiellement la qualité de celles-ci et l’intérêt de cette plateforme pour la recherche;
  • cela déplacerait une grande partie de la recherche d’informations vers les différents modes d’accès aux données contenues dans Wikidata, qui offre déjà des moyens de recherche très puissants (par exemple via le langage de requête SPARQL) et inédits dans le domaine des archives8;
  • cela inciterait les institutions à investir dans des outils de visualisation des résultats de requêtes issues de l’interrogation de Wikidata.

Ces résultats sont perçus comme positifs, car cela mutualiserait les efforts autour d’une base de connaissance commune (et des moyens d’y accéder) au lieu de les disperser dans la multiplication des initiatives institutionnelles individuelles pour des résultats mitigés. Cela serait aussi un moyen simple de suivre cette recommandation qui semble tomber sous le sens: «Public Money? Public Code!»9.

Wikidata et RiC

Enfin, utiliser massivement Wikidata signifie aussi pour les institutions qui conservent des archives s’approprier facilement et rapidement les recommandations de base contenues dans le dernier projet en date de norme de description archivistique intitulé Records in Contexts (RiC) (voir arbido 3/2017), qui propose justement de fusionner les normes de description existantes en utilisant tout le potentiel des données ouvertes liées.

Conclusion

Le 19e siècle a vu l’école s’émanciper de sa tutelle religieuse; est-il venu le temps que les archives se libèrent de l’autorité des archivistes? Nous serions tentés de plaider en ce sens. Cela répond à un principe de réalité, les archivistes ne peuvent plus prétendre réaliser seuls la sauvegarde des informations essentielles et par ailleurs, nous souhaiterions qu’ils cessent d’en être les cerbères.

Si le monde est la co-construction de nos actions, de quel monde voulons-nous en tant qu’archivistes être bâtisseurs? Le mouvement Wikimedia a choisi: il s’est doté d’une feuille de route «Wikimedia 2030»10, grâce à laquelle il veut bâtir une infrastructure essentielle au service du savoir libre et référencé.

En serons-nous partie prenante? Tout porte à croire que les archivistes ont un réel rôle à y jouer. Mais pour y arriver, ils doivent libérer leurs données et se libérer de leur autorité sur elles. Nous avons tenté de proposer des pistes pour que les archivistes participent à ouvrir des temporalités émergentes et des futurs inédits11.

Alors intéressé-e-s? Poursuivons la réflexion ensemble12!

Avatar

Baptiste De Coulon

Baptiste de Coulon, né en 1978, a débuté son activité d’archiviste indépendant dans le Canton de Neuchâtel en 2007. Très rapidement, il défend l’idée de mutualiser les forces et les ressources dans le domaine en créant un poste d’archiviste intercommunal. Fondateur du Service intercommunal d’archivage (SIAr), il a été archiviste et conseiller en gestion de l’information chez Docuteam Sàrl de 2010 à 2017. Il travaille depuis à nouveau comme indépendant au sein du lieu imaginaire.

Commentaires

*Pflichtfeld
  • Anne Chardonnens


    Quelques réactions à cet enthousiasmant article sur cet projet audacieux (et prometteur) qu’est Wikidata !

    1/ « Toute information du moment où sa source est indiquée est recevable dans Wikidata », il me semble que cela se fait tout de même au cas par cas dans bien des situations et je ne suis pas sûre que toutes les données archivistiques y trouveraient leur place. Par exemple les données intéressant principalement les généalogistes devraient-elles s’y trouver ? Comment dessiner cette frontière entre ce qui est 'notable' et ce qui ne l'est pas ?

    2/ Wikidata est intéressante en matière de mutualisation, mais également dans la façon dont elle permet d’appréhender les données. Ainsi, les données relatives à des archives se retrouvent soudainement prises dans une grande fresque où tout se mélange, tout se côtoie et l’utilisateur effectuant une requête SPARQL sur des individus nés à Bâle est susceptible de retrouver pêle-mêle dans ses résultats des producteurs d’archives, des photographes, des personnalités politiques, des écrivains, etc. De même, on peut soudainement très facilement visualiser sur une carte d’où viennent les producteurs d’archives de tel dépôt… Changement de perspective !

    3/ Par rapport à la co-création et à la réutilisation de ce qui aurait déjà été encodé par d'autres, cela semble particulièrement pertinent dans le cas de bibliothèques et musées travaillant sur des mêmes oeuvres ou mêmes créateurs, qu'en serait-il pour les archives ? Est-ce que cela arrive souvent ? Pour un certain type d'archives en particulier ? Ou faudrait-il déjà commencer dans un premier temps par les producteurs, comme le suggère Julien Benedetti dans son commentaire ?

    4/ Ce genre d'efforts de mise en relations de données archivistiques a déjà été réalisé dans le cadre d'autres initiatives, comme SNAC (Social Networks and Archival Context) : http://snaccooperative.org/
    Il y a peut-être des enseignements à en tirer.

    5/ Par rapport à l'initiative Records in Context, ils souhaitent créer de toute pièce une ontologie adaptée au domaine archivistique plutôt que construire sur ce qui existe déjà : dans quelle mesure cette ontologie serait-elle compatible avec le modèle de données Wikidata ?

    6/ Enfin, comme déjà évoqué sur Twitter, je pense que plusieurs institutions auraient des rétiences légitimes à l'idée de faire de Wikidata le lieu de partage, gestion et édition de leurs données. La possibilité d'utiliser librement le logiciel Wikibase pour créer une réplique de Wikidata adapté à ses besoins (possibilité de créer de nouvelles propriétés sans devoir attendre l'assentiment de la communauté Wikidata, etc.) mérite d'être étudiée également ! Même si, bien entendu, cela renforcerait ce risque de dispersion et de "multiplication des initiatives institutionnelles individuelles pour des résultats mitigés."

  • Baptiste De Coulon

    Merci de votre commentaire. Totalement d'accord sur la mise en commun des notices d'autorité. Il est grand temps que nous renoncions à faire du travail à double. Il nous reste bien assez de défis à relever par ailleurs!

  • Julien Benedetti

    Merci pour cet article rafraichissant. Il ouvre de belle perspective pour les archivistes. La réflexion sur le partage avec d'autres acteurs (professionnels ou amateurs) doit nous bousculer dans nos certitudes, sinon nous risquons ne n'apparaître que comme des agents de blocages dans l'accès aux savoirs et au patrimoine.

    Concernant plus précisément les productions dans wikidata les archivistes pourraient sans doute apporter leur production de ficher producteur ISAAR-CPF. Ceci pourrait constituer une belle base de notice d'autorité de nos administrations nationales, et de leur changement dans le temps.

Résumé

Les défis posés par la production contemporaine de l’information imposent aux archivistes de repenser largement leurs pratiques. Or l’apparition récente de nouvelles technologies, comme les données ouvertes liées, et de nouveaux outils pour les utiliser pourraient apporter une partie des réponses. Reste que pour bénéficier pleinement de tous leurs potentiels, les archivistes devront apprendre à partager leur autorité sur les informations archivées. Dans ce cadre, cet article prend pour objet la base de données en ligne Wikidata et explore l’intérêt que les archivistes pourraient trouver à l’utiliser.

Die Herausforderungen, die die heutige Produktion an Informationen stellen, zwingt die Archivare dazu, ihre Vorgehensweisen zu überdenken. Allein schon das jüngste Aufkommen neuer Technologien, wie die Linked Open Data, und die für ihre Nutzung benötigten Werkzeuge, können einen Teil der Antworten liefern. Um von diesen Potenzialen voll profitieren zu können, müssen Archivare lernen, ihre Archivdaten zu teilen. Dieser Artikel befasst sich mit der Online-Datenbank Wikidata und untersucht, wie ihre Nutzung für Archivare von Interesse sein kann.