Kommentare Abstract
2014/2 Zur Erschliessung von AV-Medien

Indexation audiovisuelle aux Archives de la Ville de Lausanne: 20 ans de mutations. Et ce n’est pas fini!

Kommentare Abstract

Nous vivons les débuts d’une révolution numérique dont l’effet sur la vie des humains comme leur organisation sociale et professionnelle va être à la fois rapide, perturbant et profond. En ce XXIe siècle, la reconfiguration du travail au sein des institutions place les archivistes dans une position inconfortable, qui ressemble à une course contre la montre pour réguler les conditions de structuration des masses documentaires numériques natives, en vue de leur élimination ou conservation à long terme.

Dans ce contexte, le monde audiovi­suel, par ses spécificités sociétales (po­litiques, militaires, commerciales) et techniques originelles (temps, espace, son et sémantique interprétés par des machines), a très vite été gagné par le numérique. La désolidarisation du sup­port physique avec le contenu de l’infor­mation qui suppose évolutivité et mi­grations, si elle soulève encore des réti­cences – notamment dans le secteur de la conservation cinématographique sur pellicule – n’est plus un objet débattu dans un milieu professionnel préoc­cupé jadis par le concept d’original. Aujourd’hui, l’archivage numérique, audiovisuel compris, se confronte d’abord à des exigences d’authenticité, de fiabilité, d’intégrité et d’accessibilité aux documents. Cette accessibilité est liée à de nombreux paramètres qui se combinent pour faire système, les étapes d’indexation et de communica­tion ne pouvant plus être dissociées.

Les mutations d’une indexation

Entre le début des années 1990 et 2014, l’inventaire lausannois des sources au­ diovisuelles peut se résumer en trois phases.

La première phase est fondatrice: elle est marquée par la constitution d’ar­chives audiovisuelles (sonores et fil­miques) et la reconnaissance politique de cette mission au sein des Archives de la Ville de Lausanne. La deuxième phase, entre 1997 et 2010, correspond à une prise en charge active des sources audio­visuelles avec création de masters nu­mériques sur bandes pour la vidéo et fichiers pour le son. Ce traitement était accompagné d’un inventaire sur base de données qui intégrait une segmentation des productions, permettant d’ordon­ner le rang de passage de chaque «cha­pitre» analysé. La troisième phase, dès 2011, correspond à une gestion globale de l’information audiovisuelle sous forme de fichiers numériques permet­ tant une indexation chrono­référencée, avec segmentation et consultation im­ médiate des vidéos sur un portail web (www.dartfish.tv/lausanne) moissonné par les moteurs de recherche (avec toutes les réserves que cela implique).

A chaque phase, l’octroi de ressources humaines, technologiques et finan­cières a été décisif dans un environne­ment fortement contraint par les fi­nances publiques et par le fait que ce travail s’inscrit dans une institution généraliste qui ne met donc pas les archives audiovisuelles – essentiellement de provenance privée – comme cœur de métier. Depuis 1997, l’archiviste en charge de ce secteur travaille en étroite collaboration avec les cadres du service pour définir la politique d’archivage. Un soutien est par ailleurs assuré par le service informatique de Lausanne qui met ses infrastructures de serveurs et assure connectivité et sécurité. En revanche, les Archives financent leur outil de gestion ainsi que les dévelop­pements logiciels. Faute de moyens fi­nanciers, bon nombre d’applicatifs d’automatisation de processus ont été modélisés, implémentés et maintenus grâce aux compétences internes du ser­vice.

Le compromis actuel

Fin 2013, 18 350 productions vidéos ou filmiques (pellicules 8 à 35 mm) et 6050 productions sonores sont inven­toriées au sein des Archives de la Ville de Lausanne. Le stockage hors ligne des masters numériques représente 79 To pour la vidéo et 5 To pour le son (Ultrium LTO 6). Les Archives de la Ville de Lausanne ont pu affermir la pérennité de leur action en matière audiovisuelle sur deux pi­liers. Le premier pilier était une activité de production de films documentaires (16 mm puis vidéo numérique) portée par une commission créée en 1982 mais dissoute en 2011, faute de renou­vellement des moyens. Une pratique de tournage et montage vidéo subsiste mais de manière très limitée. C’est une perte, car la pratique de la production avait l’avantage de faire dialoguer les exigences archivistiques avec les pra­tiques de tournage, dont chacun tirait des savoirs utiles et immédiatement exploitables. Même du point de vue budgétaire, la perte est évidente, car cette porosité entre production et archi­vage autorisait des investissements qui alimentaient toute la chaîne d’activité autour des sources audiovisuelles.

Le second pilier est une activité d’archi­vage des productions radios et télévi­sées d’intérêt local ou régional qui structurent l’espace médiatique lausan­nois depuis les années 1990: Radio Aci­dule, Télévision régionale lausannoise (Tvrl), La Télé (télévision Vaud­-Fri­bourg) et Télé Bourdo.Net (télévision de quartier sur le câble). Il convient de relever que tous ces canaux de produc­tion ont bénéficié d’un soutien de la Ville de Lausanne, par subvention ou capitalisation.

Au fil des années, les versements jour­naliers se sont régulièrement accrus, alors que d’autres institutions liées à la Ville complètent les fonds audiovisuels des Archives de la Ville de Lausanne: théâtres, musées ou conseil communal notamment. Pour la seule télévision Vaud-­Fribourg, depuis ses débuts en juillet 2009 et jusqu’en mars 2014, 7076 émissions représentant 2036 heures stockées sur environ 22 To, ont été versées. Pour l’année 2013, on dé­nombre 1132 émissions, soit 460 heures d’émissions stockées sur 5,4 To. 

Pour toutes ces productions récentes, le format d’archivage est de type HDV 1080i (fichiers m2t, 16/9, 1440*1080) et le traitement se fait uniquement par transit de fichiers entre la régie et les serveurs de la Ville. A une autre échelle, TV Bourdo.Net, projet social de quar­tier né en 2002, offre ses réalisations aux archivistes grâce à un partenariat pensé dès les débuts. 1400 émissions représentant 440 heures ont été remises aux Archives. Symbole d’une hétérogénéité familière des archivistes audiovisuels, qui est aussi source de difficultés de gestion, en 2013, cette télévision de quartier a remis environ 500 Go de fichiers de type mov et mp4, certains en format SD et d’autres en HD.

Face à de tels accroissements et compte tenu des forces disponibles, il a fallu pri­vilégier une démarche pragmatique en matière d’inventaire et d’accès aux sources. Tout d’abord, le temps machine pris par le codage rend impossible la convergence des formats versés vers un seul standard numérique. De plus, pen­dant plusieurs années, l’archivage impli­quait la création de masters numériques sur cassettes (Digital S–4:2:2). La ges­tion documentaire souffrait alors de l’impossibilité à relier finement le ni­veau de description retenu – fondé sur le concept d’unité de «production» (film, émission télé, prise de son) – avec le stockage de plusieurs productions sur une cassette pour d’évidentes questions de coûts. En somme, l’inventaire ne pou­vait être associé à un time code permet­ tant de lier master de conservation et fichier de consultation à l’inventaire. La lecture de l’inventaire permettait d’iden­tifier les sources qu’il fallait ensuite «charger» sur magnétoscope ou mettre à disposition sur serveur manuellement.

Aujourd’hui, l’indexation vidéo a franchi une étape importante en per­mettant de traiter de manière intégrée et cohérente, la phase de numérisation (création et copie de conservation de masters, création conjointe de fichiers de consultation) avec celle de l’indexa­tion et de la diffusion par un accès web.

Dans ce cadre, un des enjeux majeurs de l’archivage audiovisuel d’un corpus documentaire aussi ouvert que celui d’un centre d’archives publiques est d’avoir un modèle d’indexation riche, respectueux a minima de normes des­criptives de base type Dublin Core, adapté aux forces de travail et disposant d’un outil logiciel qui permette de tirer pro­fit, sans aucun délai de mise en ligne, du modèle archivistique mis en place pour faciliter les recherches documen­taires des internautes, archivistes com­pris. Un outil qui doit donc être à la fois un instrument de gestion d’informa­tion et de communication efficace, en streaming, autorisant une régulation fine des droits d’accès comme des conditions de téléchargement. Un outil qui doit permettre enfin de conserver la totale maîtrise opérationnelle de la conservation des masters et des méta­données introduites dans l’outil par extraction xml régulière déposée sur le serveur des Archives.

Certains projets (on peut citer par exemple le travail mené sur la collection Plans fixes) ont proposé une finesse d’indexation-­segmentation des produc­tions audiovisuelles qui dépasse les possibilités d’un travail «au long cours» alimenté journellement par de nouveaux versements. La grille d’analyse mise en place à Lausanne fait donc fi­gure de compromis.

L’information est indexée sur deux ni­veaux: le premier, obligatoire, concerne la production (par production, on en­ tend émission télévisuelle, prise de son, captation de spectacle) dans son en­semble. Le second niveau, facultatif, consiste à documenter des segments temporels de la production. La segmen­tation a l’intérêt de pouvoir être menée à des niveaux de détail très variables, revue ou enrichie à tout moment et potentiellement confiée à toute per­sonne accréditée, la possibilité de lais­ser des commentaires ou des annota­tions étant généralement une option logicielle très attractive mais indépen­dante de la pure indexation.

Niveau d’indexation «Vidéo»

Fonds:

– identificateur non ambigu du fonds d’archives dont provient la vidéo

Cote:

– identificateur non ambigu de la vidéo

Titre:

– titre original ou factice avec mention du fonds et de la date de production/ diffusion

Description:

– résumé de la production sous forme de texte libre

Langue:

– langue principale, multilingue ou muet

Date:

– de la première diffusion ou de la pro­duction

Durée:

– mention facultative pour les docu­ments sous droits ou non communi­cables et conservés hors ligne

Format master:

– format du document reçu par les Archives analogique ou numéri­que

Format transfert:

– format du master vidéo conservé par les Archives sur bande Ultrium. Plus de 30 formats dénombrés.

Genre:

– type de la production selon liste fer­mée de 14 entrées: 

– Actualité 

– Communication et publicité

– Conférence 

 – Débat 

 – Divertissement 

 – Evénement muséal 

– Evénement politique 

– Evénement sportif 

 – Fiction 

 – Images non montées 

– Pédagogie 

 – Portrait et interview 

– Reportage 

 – Spectacle

Période:

– découpage par blocs temporels pour faciliter la navigation dans les ar­chives audiovisuelles

Droits:

– mention du détenteur

Emission:

– mention facultative du nom de l’émission dont est issue la vidéo

Animateur:

– patronyme du présentateur de la pro­duction, le cas échéant

Niveau d’indexation «Séquences»

Localisation:

– découpage géographique repéré à l’indexation de la séquence soit: men­tion des continents pour production hors Europe, des pays européens hors Suisse, des communes suisses hors Lausanne, des rues ou quartiers de Lausanne.

Domaine:

– liste fermée de huit domaines théma­tiques: art et culture, économie, for­mation, politique, science et tech­nique, société, sport, territoire.

Intervenant:

– nom, prénom ou pseudonyme de toute personne identifiée

Organisation:

– nom de l’organisation, entreprise, association ou collectif concernée

La plus-­value de la segmentation en­ richie par une indexation fondée sur des descripteurs contrôlés est incontes­table si on la compare à un simple ré­sumé des contenus comme on le ren­contre le plus souvent sur des plate­ formes de type YouTube.

Elle facilite la recherche d’images pour une exploitation d’extraits ou d’objets documentaires faisant «chapitre» dans un ensemble plus large, notamment dans la production télévisuelle d’infor­mation. Elle n’entrave en rien la consul­tation irremplaçable d’un objet dans son intégralité et ne nécessite pas de segmentation physique des fichiers. Elle participe d’un système général d’information qui peut – à l’image de toutes les normes archivistiques – être d’une granularité variable entre le fonds et la pièce. L’atome limite de référence serait ici le «frame» rapporté à un time code.

Demain, l’indexation

Aujourd’hui, on entend quotidienne­ment: «Produisez, partagez, le cloud se chargera du reste!» Le traitement archi­vistique valorisé ici serait-­il une étape intellectuelle que les mirages du numé­rique tendent à mettre «hors jeu»? Pour les archivistes pourvoyeurs et contrô­ leurs des métadonnées, quelles voies faut­il préconiser aujourd’hui, dans un contexte temps­-ressources très limité en regard des heures de production à archiver?

Pour apporter une réponse crédible, il faut se tourner vers l’industrie dont les développements sont dictés par un mo­dèle de consommateur toujours plus exigeant, désireux d’accéder instanta­nément à un contenu, payant ou non. En somme, l’industrie audiovisuelle va passer d’une culture de masse à une culture singularisée massive faisant de l’enrichissement contextuel et sa com­mercialisation, la clé d’un business ju­teux.

D’ores et déjà, l’automatisation de l’in­dexation associée au speech to text (reconnaissance vocale automatique) per­met une transcription à la mesure des volumes conservés, point de départ vers d’autres usages de l’indexation. Les tests menés sur le logiciel Vocapia à partir de sources lausannoises montrent un réel potentiel pour constituer des descripteurs contrôlés, en parallèle d’une recherche libre sur le texte ainsi généré. La création d’ontologies locales en sortira renforcée et plus aisée à maintenir. Au prix sans doute d’un trai­tement préalable des particularités ré­gionales liées aux accents des interve­nants et à l’interprétation des noms propres, l’indexation des archives au­diovisuelles lausannoises va se tourner rapidement vers ce modèle, à l’image de ce qui se fait aujourd’hui pour la presse écrite.

De plus, les analyses de formes ou la reconnaissance faciale permettront de faciliter des recherches sur les compo­ sants visuels de l’image. Ces analyses modélisées sous mpeg7 permettront le déploiement longtemps retardé de cette norme, aujourd’hui difficilement ex­ploitable du fait d’un coût de traitement manuel trop élevé. 

L’archiviste déclassé par la machine?

Si l’indexation peut se déployer à travers des algorithmes toujours plus puis­sants et être utilisée à travers des inter­faces utilisateurs également toujours plus smarts pour guider l’internaute, faut-­il imaginer que l’archiviste audio­visuel est voué à disparaître?

L’ère numérique, associée à l’évidence trompeuse de l’image, est source de représentations simplificatrices des archives et surtout de ce qui devrait fon­der le travail d’archivage: la préserva­tion d’une connaissance approfondie du contexte de production et de trans­mission, seul moyen d’éviter une lec­ture naïve ou illustrative voire instru­mentalisée, des documents tirés d’un passé pas si lointain. C’est d’ailleurs cette dimension éminemment histo­rique de l’information à gérer, volon­tiers écartée au nom de préoccupations à court terme, qui offre encore un sens et une spécificité au métier d’archiviste. Je reste persuadé que l’archiviste audio­visuel ne se résumera pas à un veilleur technicien mais que la connaissance comme la valorisation des fonds dans leur connexion à la production audiovi­suelle archivée, en collaboration avec les universitaires ou d’autres métiers, est une exigence. Si la machine doit remplacer une part du travail mené par l’archiviste, celui­ci doit en profiter pour cultiver cette dimension de l’esprit qu’est l’espace de l’analyse et du dis­cours interprétatif, toujours débattu, toujours reconstruit et qui rencontrera encore longtemps une demande so­ciale, virtuelle ou non. Sur cela, les humains ne devraient rien devoir céder à la machine.

Avatar

Frédéric Sardet

Archiviste de la Ville de Lausanne, directeur de la Bibliothèque de Genève.

Abstract

Die Verschlagwortung der audiovisuellen Archive der Stadt Lausanne ist heute direkt mit einem E-Suchportal im Internet verbunden (www.dartfish.tv/lausanne). Die Verschlagwortung von Ton- oder Filmdokumenten, die die Dublin-Core-Norm erweitert, erfolgt auf zwei Ebenen: Die erste, obligatorische Ebene ermöglicht es, das Produkt allgemein zu beschreiben. Die zweite Ebene nimmt eine Verschlagwortung der Produkte mittels Segmentierung vor. Dadurch können die Sichtweisen auf das audiovisuelle Objekt vervielfacht werden, und die verschiedenen Sichtweisen können mit einem eindeutigen Timecode verknüpft werden, der sowohl für die Suchportaldatei wie auch für das Original gilt. In den kommenden Jahren wird aber die Verschlagwortung stark automatisiert werden. Die erste Etappe (die automatische Transkription von gesprochener Sprache) bietet die Grundlage für verfeinerte semantische Verfahren und könnte gekoppelt werden mit Verfahren zur Formerkennung, was neue Modelle für die Suche in den vorhandenen Beständen ermöglichen würde.