Commentaires Résumé
2017/3 Métadonnées – Données de qualité

Les «data» à l'honneur: extraits du magazine Archimag

Commentaires Résumé

La thématique des «data» et des métadonnées est à l’honneur depuis quelques années dans les revues professionnelles en information documentaire. Quelques extraits du magazine Archimag mettent en lumière les rôles des professionnels en information documentaire dans la gestion de ces «data».

Le magazine français Archimag a consacré récemment plusieurs dossiers aux «data», qu’elles soient «big», «open» ou intégrées à la nouvelle version de la norme sur le «records management»1. Voici quelques extraits publiés avec l'autorisation de leurs auteurs.


«Archivistes, emparez-vous de l'open data!»2

Archimag - Couverture no 303, avril 2017

Les données ouvertes sont un fait. Des données à qualifier, conserver, communiquer: typiquement du travail pour les archivistes! Pourtant l’implication de ces professionnels dans les projets open data n’a encore rien d’évident.

On trouve de tout parmi les métiers de l'open data: des informaticiens, des data scientists, des responsables de la communication... Mais où sont les archivistes? Si les archivistes ne sont pas encore légion dans l'univers de l'open data, il faut tout de même noter que l'Association des archivistes français s'est dotée, dès 2010, d'un groupe de travail baptisé «Réutilisation des données publiques». Objectif de l'AAF: mener «une réflexion collective avec l'ensemble des partenaires (ministériels, associatifs, économiques) à commencer par le Service interministériel des Archives de France» pour que les archivistes prennent leur place dans le mouvement. Quatre ans plus tard, une délégation de l'AAF se rendait au Sénat dans le cadre d'une mission d'information consacrée à l'open data et la protection privée. L'occasion de rappeler «le rôle pivot de l'archiviste dans la bonne gestion de l'information, sécurisée et souple, dans l'environnement numérique».

[Rappelons] le rôle pivot de l'archiviste dans la bonne gestion de l'information, sécurisée et souple, dans l'environnement numérique.

Et lors du forum des archivistes qui s'est tenu l'an dernier à Troyes, la thématique des données publiques a fait l'objet d'un «data sprint des archives»3.

Cette initiative est partie d'un constat: «Les services d'archives créent et conservent de nombreuses données et contenus. Nombreux sont ceux qui diffusent sur leur portail internet des inventaires et bases de données très riches, normalisées et des documents numérisés. Pour autant, les expériences de réutilisation, visualisations et remix de ces contenus en dehors de la sphère archivistique et culturelle sont relativement rares». De fait, il suffit d'aller sur la plateforme Data.gouv.fr pour constater que seulement neuf jeux de données estampillés «archives publiques en France» sont mis à la disposition des internautes (en février 2017)4.

Ces corpus documentaires proviennent des services d'archives municipales, départementales et nationales. Disponibles au format ODS (tableur), ces fichiers sont arides et n'ont pas été enrichis par un traitement visuel qui pourrait les rendre plus attractifs.

Si l'infrastructure informatique doit être naturellement laissée à la DSI [Direction des systèmes d’information], certaines actions peuvent parfaitement être assurées par des archivistes. C'est notamment le cas de tout le travail autour de la donnée: recensement, collecte, nettoyage... On peut également imaginer des actions périphériques: animation d'ateliers consacrés à la réutilisation de données, organisation de hackathons et de rencontres entre associations et développeurs5...

Archimag est un magazine professionnel français lancé en 1985 qui s'adresse aux spécialistes de l'information documentaire (bibliothécaires, archivistes, documentalistes, etc.). Récemment, il a consacré plusieurs numéros à la thématique des «data» (les données) et à leur importance pour les professionnels de l’information. En plus du magazine mensuel comprenant un dossier thématique et des actualités, Archimag publie plus sporadiquement des guides pratiques.


«Le records management révise ses data»6

L’Iso 15489-1:2016, nouvelle version de la norme sur le records management, intègre désormais les data. C’est en soi une petite révolution conceptuelle et pour le métier de records manager.

Archimag - Couverture no 304, mai 2017

Venons-en aux métadonnées. Si elles sont désormais prises en compte par la norme, c’est parce qu’elles viennent «étayer» les documents d’activité. Autrement dit, un document d’activité seul ne suffit pas forcément à constituer une preuve ou un actif informationnel.

Plus que jamais, on se situe dans «l’ère de la trace»7. Un document n’est pas forcément attaché à une personne, mais se voit changer de mains au gré d’un travail collaboratif ou d’une relation de travail, aussi bien en interne qu’en lien avec l’externe. Il est créé, enrichi, corrigé, édité; Sans peut-être ne jamais être définitivement validé. Son contenu peut provenir de sources diverses, de bases de données, parfois automatiquement (par exemple, pour la génération d’une facture en rassemblant des informations sur l’émetteur, le destinataire, l’objet, le montant, la date, etc.). De plus, aux côtés des documents et dans un contexte de big data, il faut prendre en compte les données.

Des métadonnées pour «étayer» les documents d'activité: un document d’activité seul ne suffit pas forcément à constituer une preuve ou un actif informationnel.

L’Iso 15489-1:2016 a bien pris la mesure de cette évolution propre aux «environnements numériques» qui, inversement, «offrent aussi une plus grande flexibilité de mise en œuvre des mesures de contrôle au sein des systèmes et entre les systèmes de gestion des documents d’activité».

Aujourd’hui donc, pas de preuve d’activité sans trace. La question est maintenant de structurer ces traces, ces métadonnées, de manière à obtenir un SGDA [Système de gestion des documents d’activité] fiable. Pour le records manager, il faut élargir son champ d’investigation. C’est un nouveau chantier qui s’ouvre.


La gestion des «data», un nouveau nom pour une vieille activité

Ainsi, au regard de ces extraits d’Archimag, nous constatons que leurs préoccupations rejoignent celles exprimées dans arbido: la gestion des métadonnées est essentielle pour la gestion des données, tant dans le contrôle de la production documentaire (s’assurer de la fiabilité de l’information) que dans la valorisation des ressources informationnelles (mise en réseau, partage, réutilisation).

Les termes de «data» sont également à l’honneur d'arbido depuis quelques années. Le numéro 2013/4 n’était-il d’ailleurs pas intitulé Linked Open Data - Big Data: Alles vernetzt / Tout en réseau / Tutto in rete?

Or, la gestion de ces données ou «data» et de leurs métadonnées est au cœur de nos professions en information documentaire, et ceci depuis bien longtemps. Si ce n’est le nom qui change, l’on retrouve ici l’une des fonctions centrales de l’archivistique et de la bibliothéconomie, à savoir la description (sous forme d’inventaire, de catalogage ou autre) avec son corollaire essentiel qu’est la diffusion de l’information (par la mise à disposition de ressources, la gestion de leurs accès, leur communication et, in fine leur valorisation8).

Kern Gilliane (2014)

Gilliane Kern

Master of Science en Information documentaire en 2011 à la Haute école de gestion de Genève, conjointement avec l’École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal.

Archiviste et conseillère en gestion documentaire depuis 2012 pour la société docuteam, elle est membre de la direction et responsable en Suisse romande des projets de gestion de l’information, du Service intercommunal d’archivage dans le canton de Neuchâtel (SIAr) et représentante des activités en archivage électronique.

Elle fait partie du comité de rédaction d'arbido depuis 2014 et du comité de l’Association des archivistes suisses (AAS) depuis 2015.

Sous le pseudo Gilliane, elle est aussi wikimédienne et cherche à optimiser le travail des archivistes (et autres professionnel·le·s GLAM) par les outils Wikipédia, Wikidata, Wikimedia Commons et Wiktionary.

Remize Michel 2017

Michel Remize

Ancien élève du Cnam-INTD (Institut national des sciences et techniques de la documentation) et diplômé en droit et sciences politiques, Michel Remize est rédacteur en chef du magazine Archimag depuis 1997 (mensuel professionnel, site web Archimag.com et newsletters) et responsable de la collection des Guides Pratiques Archimag. Il est responsable du département Edition du Groupe Serda.

Avatar

Bruno Texier

Journaliste à Archimag.

  • 1 Articles consultables sur la page web «Univers data».
  • 2 Introduction de Bruno Texier, dossier Archimag no 303, avril 2017, pp.15-16.
  • 3 Cette initiative a été inspirée en partie du hackathon culturel qui s’est tenu à la Bibliothèque nationale à Berne en 2015. À ce sujet lire: Frédéric Noyer, «Open Cultural Data Hackathon: rencontre du 3e type sur la chaîne de valorisation numérique», dans arbido 2015/3 GLAM und/et/e Wikimedia, p.39 et Elias Kreyenbühl «Lessons learnt? Eindrücke eines Archivmitarbeiters vom Swiss Open Cultural Data Hackathon», dans arbido 2015/3 GLAM und/et/e Wikimedia, p.41.
  • 4 En Suisse, les Archives fédérales (AFS) exploitent la plateforme LINDAS depuis début 2017 afin de permettre aux autorités suisses de mettre à disposition leurs données sous forme de données liées (en anglais Linked Data). À noter que peu d’autres institutions suisses sont à ce jour impliquées de façon proactive dans ce mouvement, à l’exception de la Ville de Zurich (juillet 2017).
  • 5 Ces activités périphériques ont été au cœur des actions entreprises par les archivistes suisses lors de la Journée des archives du 9 juin 2017: ateliers d’édition Wikipédia organisés en collaboration avec Wikimedia CH à Bâle, Berne, Lausanne, Schaffhouse, Zoug et Zurich, création d’un modèle de citation d’archives pour Wikipédia, organisation d’un Hackday archivistique à Zurich avec OpenGLAM en vue du 3e Hackathon culturel les 15-16 septembre 2017 à Lausanne, etc. Sans compter le concept de salle de lecture virtuelle proposé par le groupe de travail «Accès et communication» de l’Association des archivistes suisses.
  • 6 Introduction de Michel Remize, dossier Archimag no 304, mai 2017, p. 14.
  • 7 Voir l’article dans le guide Archimag no 57 «Sécurité de l’information et archivage électronique».
  • 8 À comprendre au sens étymologique du mot de «Mise en valeur de quelque chose pour en tirer davantage de ressources» (Trésor de la langue française informatisé).

Résumé

Archimag est un magazine professionnel français qui s'adresse aux spécialistes de l'information documentaire (bibliothécaires, archivistes, documentalistes, responsables de veille stratégique, membres des directions informatiques, ...). Récemment, il a consacré plusieurs numéros à la thématique des «data» (les données) et à leur importance pour les professionnels de l’information.

Archimag ist eine französische Fachzeitschrift, die sich an Informationsspezialistinnen und -spezialisten richtet (Bibliotekare, Archivarinnen, Dokumentalisten, Verantwortliche für Geschäftsinformationen, IT-Verantwortliche...). In der letzten Zeit hat die Zeitschrift mehrere Ausgaben dem Thema "Data" (Daten) gewidmet und deren Bedeutung für InformationsspezialistInnen beleuchtet.