Commentaires Résumé
2017/3 Métadonnées – Données de qualité

La notion de facettes appliquée aux archives: un outil pour faciliter l’organisation et la diffusion

Commentaires Résumé

L'application de la théorie des facettes en archivistique est une piste de solution pour améliorer l’organisation des documents et les interfaces de navigation.

La croissance exponentielle des archives et leur dématérialisation poussent à repenser la façon dont sont organisés et décrits les documents d’archives et les données et métadonnées y étant associées. Issue de la bibliothéconomie, la théorie des facettes peut faciliter la gestion et la diffusion numérique de documents d’activité (records) et d’archives historiques.

La notion de facette

Formulées par le bibliothécaire et mathématicien Ranganathan (1967), les facettes sont des groupes conceptuels combinés entre eux et utilisés pour représenter des sujets complexes ou les attributs d’un objet. À la différence de la classification hiérarchique traditionnelle, l’efficacité des facettes tient à leur capacité à intégrer différentes dimensions d’analyse mutuellement exclusives sur des sujets ou des objets informationnels, à caractériser et à rendre l’accès à l’information plus facile en offrant de multiples voies de navigation vers n’importe quel document ou notice descriptive.

Les modalités des facettes

On dénombre trois modalités d’application de la théorie des facettes: l’analyse par facettes, la structure par facettes et le dispositif à facettes (Figure 1). L’analyse par facettes est réalisée à l’aide de règles de classification, la structure à facettes est fixée à l’aide de schémas et le dispositif à facettes est concrétisé à l’aide de moyens technologiques.

Figure 1 – Modalités d’application des facettes

L’analyse par facettes désigne le processus analytico-synthétique (Foskett, 2009) par lequel on déconstruit un univers original (Beghtol, 2008) (un ensemble de sujets ou d’objets donné, un fonds d’archives par exemple) à l’aide des catégories fondamentales comme principe de division (Mills, 2004). Ces dernières sont des règles servant à extraire les facettes d’un ensemble donné (Broughton, 2006, p. 53). Ranganathan propose cinq catégories fondamentales – Personnalité (objet ou sujet principal), Matière (substance), Énergie (activité ou action), Espace (lieu) et Temps –, mais, selon les caractéristiques de l’ensemble à analyser, d’autres catégories fondamentales peuvent être sélectionnées.

Les structures à facettes désignent les schémas classificatoires résultant de l’analyse par facettes d’un univers original. Elles peuvent se présenter sous plusieurs formes: ontologies, classifications, schémas de métadonnées, vocabulaires contrôlés pour l’indexation, thésaurus, etc. (Gnoli, 2008b; Maniez, 1999).

Les dispositifs à facettes désignent les moyens technologiques qui permettent à un usager de rechercher, d’utiliser ou d’indexer des objets ou des sujets à l’aide des facettes. Par exemple, les interfaces web de recherche à facettes (Fagan, 2010), les moteurs de recherche à facettes dans un ordinateur personnel, les documents, bases de données ou métadonnées encodées ou organisées par facettes, etc.

Les applications en archivistique

Surtout appliquée en bibliothéconomie (Maisonneuve et Touitou, 2007), en informatique (Dumais, 2009; Tunkelang, 2009) et en organisation de la connaissance (Desfriches Doria, 2012; Hjørland, 2013; Hudon et El Hadi, 2017), la notion de facettes se développe depuis quelques années en archivistique. Elle constitue l’objet de recherche de plusieurs chercheurs en sciences de l’information (Hudon et Mas, 2001; Mas et Marleau, 2009; Mas, Maurel et Alberts, 2011) et a été mise en production dans plusieurs organismes du gouvernement fédéral canadien pour l’indexation et le repérage de leurs documents d’activité.

L’analyse par facettes

L’analyse par facettes peut servir à décrire, indexer et classer les documents d’activité (Mas, Maurel et Alberts, 2011) ou ceux d’un fonds d’archives historiques (Mas, 2013-2014). Pour illustrer nos propos, prenons comme simple exemple un document d’archives, soit un ordre de déportation émis par le gouvernement canadien (Figure 2).

Figure 2 – Ordre de déportation. (Source : Bibliothèque et Archives Canada, Department of Employment and Immigration fonds, Samples of forms used for deportation cases. 1925-1938.)

Appliquons les catégories fondamentales proposées par Ranganathan au sujet du document: la Personnalité correspond au sujet principal du document, dans ce cas-ci les immigrants; la Matière est ici le type de document, soit le formulaire; l’Énergie est l’action liée au sujet principal du document, soit l’expulsion (des immigrants); l’Espace est le lieu, soit le Canada; et le Temps est la période 1926-1938.

Les structures à facettes

Les structures à facettes résultant de l’analyse par facettes servent à organiser autant les données et métadonnées que les documents et le contenu de ceux-ci. Par exemple, en gestion des documents d'activité, ces structures peuvent aider à «indexer et à repérer le contenu informationnel de n’importe quelle ressource documentaire au sein d'une entreprise» (Marleau, Mas et Zacklad, 2008, p. 91). Elles sont ainsi particulièrement utiles pour indexer les métadonnées de documents dans un espace de travail partagé (Figure 3).

Figure 3 – Extrait d’une taxonomie à facettes pour l’indexation et le repérage de documents d’activité en milieu universitaire canadien

Soulignons que certains schémas, bien qu’ils puissent résulter d’un processus d’analyse par facettes, ne sont pas tous de facto des structures de classification à facettes. Une structure classificatoire à facettes doit permettre l’ajout de classes au fur et à mesure de l’évolution d’un domaine de connaissance ou de l’expansion d’un ensemble d’objets. De plus, la particularité des schémas à facettes est la capacité d’illustrer des relations sémantiques entre les termes des facettes (Vickery, 1966) – avec la catégorie fondamentale de l’Énergie qui exprime une action, un état, par exemple (Figure 4). Ces types de facettes, appelées «facettes relationnelles», précisent la relation entre les «facettes de base» telles que Matière, Temps et Espace (Hudon et El Hadi, 2017, p. 14).

Figure 4 – Exemple de relations sémantiques entre facettes

Les dispositifs à facettes

Enfin, les dispositifs à facettes, en particulier les interfaces de recherche web, constituent un moyen pour faciliter l’accès aux archives en adaptant le schéma classificatoire à l’environnement informatique. L’efficacité, la souplesse et la facilité d’utilisation en plus d’une plus grande satisfaction des usagers ont été soulignées comme points forts contribuant à l’adoption d’interfaces à facettes pour la recherche de ressources informationnelles (Dugast, 2011). La définition du terme facettes n’est pas la même en informatique, étant dans ce cas synonyme d’attribut ou de dimension (Dumais, 2009, p. 1103). Ainsi, la plupart des interfaces dites «à facettes» actuellement disponibles ne permettent pas toute l’expression de la richesse sémantique et syntaxique de la structure à facettes et proposent plutôt des filtres de recherche qui décrivent les caractéristiques des objets (par exemple, le format du support ou la langue) plutôt que les sujets des documents (Figure 5) (Frické, 2013). Ces interfaces de recherche répondent, bien entendu, à des besoins et fonctionnent relativement bien, ce n’est pas ici notre propos. Nous souhaitons souligner cependant qu’ils ne sont pas des systèmes de représentation ou de recherche qui découlent d’analyses et de structures par facettes ou permettent la véritable recherche par facettes.

L’intégration entre les formats machine et les structures conceptuelles restent un défi, car la représentation de la nature relationnelle de la structure à facettes à travers les logiciels et les données est problématique (Gnoli, 2008a). Or, il est important de conserver la flexibilité de la structure à facettes dans l’interface de recherche à facettes, même lorsqu’il s’agit de description d’objets plutôt que de sujets (Vickery, 2008). Par exemple, une interface à facettes doit permettre des combinaisons de termes plus qu’uniquement à l’aide d’opérateurs booléens. En effet, une des forces de la structure à facettes est la richesse d’expression permise par les facettes relationnelles, richesse qui doit être accessible à travers le dispositif.

Figure 5 – Interface de recherche web comportant des filtres basés sur les caractéristiques des objets (Source : http://www.memobase.ch/)

Développements futurs

La notion de facette est une piste de solution pour améliorer l’accès à l’information et aux documents à travers l’organisation multidimensionnelle des données et métadonnées qui décrivent non seulement l’objet informationnel (le document) mais aussi son contenu thématique (le sujet). La théorie des facettes se décline en modalités d’analyse, de structure et de dispositif qui représentent chacune une étape de la mise en place d’un système à facettes réalisé grâce à divers moyens (règles, schémas et technologies). Pour qu’un système à facettes soit efficace, il faut conserver à travers sa mise en œuvre toute la flexibilité sémantique qui en fait leur force.

Les champs d’application pour les archives sont larges autant pour l’organisation et la diffusion de données, de métadonnées, de documents et d’informations archivistiques en gestion des documents d'activité que dans le domaine des archives historiques, les schémas de classification à facettes et les interfaces de recherche web constituant des développements futurs importants.

Cote Lapointe Simon 2017

Simon Côté-Lapointe

Simon Côté-Lapointe est pianiste, vidéaste, compositeur et doctorant en sciences de l’information à l’Université de Montréal. Il a été chargé de projet pour l’Association internationale des archives francophones (AIAF) et consultant en gestion de base de données musicale. Il s’intéresse à la création à partir d’archives, à l’organisation et la diffusion des archives audiovisuelles ainsi qu’à la notion de facettes appliquée en archivistique.

Mas Sabine 2017

Sabine Mas

Sabine Mas est professeure agrégée à l’École de bibliothéconomie et des sciences de l’information de l’Université de Montréal. Elle a participé à plusieurs projets de recherche sur le concept de document, de dossier, de genre, et sur la classification hiérarchique et à facettes des documents d’activité (records). Ses intérêts de recherche touchent présentement à la typologie et à la classification des documents et des dossiers d’archives, à l’automatisation de l’indexation par assignation de mots-clés, et à de nouveaux modes d’indexation de l’information juridique.

Bibliographie

Beghtol, Clare. (2008). “From the universe of knowledge to the universe of concepts: The structural revolution in classification for information retrieval”, Axiomathes, vol. 18, no 2, p. 131-144, doi:10.1007/s10516-007-9021-0.

Broughton, Vanda. (2006). “The need for a faceted classification as the basis of all methods of information retrieval”, New Information Perspectives, vol. 58, no 1/2, p. 49-72, doi:10.1108/00012530610648671.

Desfriches Doria, Orélie. (2012). «Contribution de la classification à facettes pour l’organisation des connaissances dans les organisations. Études de communication», Langages, information, médiations, no 39, p. 173-200.

Dugast, Claire. (2011). «Utilisabilité des interfaces de recherche à facettes proposées par les OPAC de nouvelle génération», Revue électronique suisse de science de l'information (RESSI), no 12, http://www.ressi.ch/num12/arti... (consulté le 31 juillet 2017).

Dumais, Susan. (2009). “Faceted search”, In: L. Liu et M. T. Zsu (dir.), Encyclopedia of Database Systems, p. 1103-1109, New York, NY: Springer.

Fagan, Jody Condit. (2010). “Usability studies of faceted browsing: A literature review”, Information Technology and Libraries, vol. 29, no 2, p. 58-66.

Foskett, Douglas John. (2009). “Facet analysis”, In: M. J. Bates et M. N. Maack (dir.), Encyclopedia of library and information sciences, 3e édition, p. 1818-1822, New York: Taylor & Francis.

Frické, Martin. (2013). “Facets: Ersatz, resource and tag”, Information Research, vol. 18, no 3, http://www.informationr.net/ir... (consulté le 31 juillet 2017).

Gnoli, Claudio. (2008a). “Ten long-term research questions in knowledge organization”, Knowledge Organization, vol. 35, no 2/3, p. 137-149.

Gnoli, Claudio. (2008b). “Facets: A fruitful notion in many domains”, Axiomathes, vol. 18, no 2, p. 127-130, doi:10.1007/s10516-008-9032-5.

Hjørland, Birger. (2013). “Facet analysis: The logical approach to knowledge organization”, Information Processing & Management, vol. 49, no 2, p. 545-557, doi:10.1016/j.ipm.2012.10.001.

Hudon, Michèle et Sabine Mas. (2001). Analyse des facettes pour la classification des documents institutionnels au gouvernement du Québec, Québec, QC: Secrétariat du Conseil du Trésor. Rapport préparé pour le Groupe de travail en classification et indexation.

Hudon, Michèle, et Widad Mustafa El Hadi (dir.). (2017). «Introduction: la classification à facettes revisitée: de la théorie à la pratique», Les Cahiers du numérique, vol. 13, no 1, p. 9-24.

Maisonneuve, Marc et Cécile Touitou. (2007). «Une nouvelle famille d’OPAC: navigation à facettes et nuages de mots», Bulletin des bibliothèques de France, vol. 52, no 6, p. 12-19.

Maniez, Jacques. (1999). «Des classifications aux thésaurus: du bon usage des facettes», Documentaliste, vol. 36, no 4-5, p. 249-260.

Marleau, Yves, Sabine Mas et Manuel Zacklad. (2008). «Exploitation des facettes et des ontologies sémiotiques pour la gestion documentaire», In: Actes de la deuxième conférence Document numérique et société «Traitements et pratiques documentaires: vers un changement de paradigme?, p. 91-110, Paris, France: ADBS.

Mas, Sabine et Yves Marleau. (2009). «Proposition of a Faceted Classification Model to Support Corporate Information Organization and Digital Records Management”, In: Proceedings of the 42nd Hawaii International Conference on System Sciences, p. 1-10, Waikoloa, Big Island, Hawaii, http://doi.ieeecomputersociety... (consulté le 11 août 2017).

Mas, Sabine, Dominique Maurel et Inge Alberts. (2011). “Applying faceted classification to the personal organization of electronic records: Insights into the user experience”, Archivaria, no 72, p. 29-59.

Mas, Sabine. (2013-2014). «La notion de facettes et son application dans un contexte de recherche dans les fonds d'archives: analyse des questions de recherche et de l'expérience vécue par des usagers novices», Archives, vol. 45, no 1, p. 85-105.

Mills, Jack. (2004). “Faceted classification and logical division in information retrieval”, Library Trends, vol. 52, no 3, p. 541-570.

Ranganathan, Shiyali Ramamrita. (1967). Prolegomena to library classification, 3e éd., New York, NY: Asia Publishing House.

Tunkelang, Daniel. (2009). “Introduction: What are facets?”, In: Faceted search, p. 3-9, San Rafael, CA: Morgan & Claypool.

Vickery, Brian. (1966). Faceted classification schemes, New Brunswick, NJ: Graduate School of Library Science at Rutgers University.

Vickery, Brian. (2008). “Faceted classification for the web”, Axiomathes, vol. 18, no 2, p. 145-160, doi:10.1007/s10516-007-9025-9.

Résumé

La notion de facettes permet de représenter de façon multidimensionnelle un sujet ou un objet. Celle-ci peut être utilisée afin de faciliter l’organisation et la diffusion des documents d’activité et d’archives historiques. La théorie des facettes se décline en trois modalités: l’analyse par facettes, la structure par facettes et le dispositif à facettes, chacune correspondant à autant de pistes de solution pour améliorer l’accès aux archives ainsi qu’à leurs données et métadonnées.

Facetten erlauben die multidimensionale Darstellung eines Themas oder eines Objektes. Diese Darstellung kann für die Organisation und die Vermittlung von Dokumenten in ihrem gesamten Life Cycle bis hin im Archiv verwendet werden. Die Theorie zu Facetten erstreckt sich auf drei verschiedene Richtungen: die Analyse durch Facetten, die Strukturierung durch Facetten und die Nutzung von Facetten als Werkzeug. Jede der drei Richtungen befasst sich damit auch mit entsprechenden Lösungswegen, um den Zugang zu Archiven, zu archivierten Daten und zu Metadaten zu verbessern.