Kommentare Abstract
2014/2 Zur Erschliessung von AV-Medien - Le catalogage des médias audiovisuels

Erschliessungstheorie und AV-Dokumente

Kommentare Abstract

Wenn wir von «Erschliessen» reden, dann meinen wir «unsere Informationsbestände für andere Personen auffindbar, zugänglich und nutzbar machen». Das Wort «Erschliessen» wird auch ausserhalb unseres Berufsbereichs oft verwendet. Eine Gemeinde baut beispielsweise eine Erschliessungsstrasse, um ein Gelände für Fahrzeuge zugänglich und nutzbar zu machen. Im Französischen und Englischen gibt es meines Wissens keine genau entsprechenden allgemeinsprachlichen Wörter. In der Fachsprache gibt es dagegen verschiedene Begriffe mit je unterschiedlichem semantischem Gehalt, im Französischen etwa «classification», «description» oder «catalogage», welche alle nur eine bestimmte Art und einen bestimmten Teil des Erschliessungsvorganges bezeichnen, welcher im Wesentlichen aus analysieren, beschreiben und präsentieren besteht.

Analogie Kartografie

Der offene deutsche Begriff scheint mir in der heutigen digital geprägten Welt geeigneter. Er verleitet auch dazu, Ana­logien zu betrachten und Analogien helfen oft, eine neue Perspektive auf etwas Bekanntes zu werfen. Eine Land­ karte bspw. erschliesst uns die Topogra­fie eines Gebietes, eine Strassenkarte das Strassennetz. Zur Herstellung der Karten stehen ganze Regelwerke mit Signaturen und Definitionen zur Ver­fügung, die bestimmen, welche Objek­te für welchen Kartentyp relevant sind und wie sie dargestellt werden sollen. Gleichzeitig braucht man Messgeräte und deren Daten um Lage und Grösse dieser Objekte zu bestimmen und schliesslich muss man das Wissen da­rüber sammeln, wie die Menschen die jeweiligen Orte und Objekte benennen. Heute benutzt man beim Autofahren häufig Navigationssysteme. Diese Sys­teme haben digitale Karten eingebaut, sie kennen immer meine aktuelle Posi­tion und können mir in jedem Moment meiner Reise genau sagen, in welche Richtung ich mich weiter bewegen muss. Als Voraussetzung muss ich nur das Ziel meiner Reise im Gerät einge­ben. Das Navigationsgerät erschliesst mir die Landschaft für mein Bedürfnis, auf dem besten Weg zu einem Ziel zu kommen, optimal. Das Navigationsge­rät stösst aber sofort an seine Grenzen, wenn man den Zielort nicht genau be­nennen kann, wenn man einfach an einen schönen Ort will, der an einem Südhang liegt und ein Hotel mit Hal­lenbad hat. Das Navigationssystem könnte das nur, wenn es sich verbinden könnte mit touristischen Datenbanken, in denen die Ortschaften nach topogra­fischer Ausrichtung und nach Vorhan­densein und Ausstattung von Hotels erschlossen sind. 

Was die Analogie uns lernen kann

Was kann man aus dieser Analogie ler­nen? Die klassischen Landkarten sind mit grossem Aufwand nach genau for­ mulierten Regeln gebildet, genau wie unsere grossen Kataloge und Informa­tionssysteme. Wer die Landkarten in vollem Umfange nutzen will, muss sie lesen und die Signaturen verstehen können. Auch die Katalogsysteme in unseren Institutionen muss man lesen können. Erfolgreich Abfragen erfor­ dern von unseren Nutzer/innen eini­ges Wissen über die Definition der Metadatenfelder oder über die in den Einträgen verwendeten Abkürzungen. Benutze ich im Auto ein Navigations­ system, muss ich nicht mehr kartenle­sen können, ich werde vom System zum Ziel geleitet. Bald muss ich ja auch nicht mehr autofahren können, wenn ich zum Navigationsgerät noch ein sich selbst steuerndes Auto habe. Gibt es etwas Analoges zum Navigationssys­tem in unseren Informationssyste­men? Die Antwort ist: «Noch nicht» oder «erst in Teilbereichen». Ein analo­ges System müsste eine natürlich sprachliche Wissensfrage verstehen und mir Antworten dazu liefern oder zumindest Wege aufzeigen, wie ich zu Antworten kommen kann. Wolfram Al­pha und Google Knowledge Graph sind auf je unterschiedliche Weise Schritte in diese Richtung. Beides sind Erschlies­sungssysteme, auch wenn sie in Bezug auf ihre Funktionsweise wenig gemein­sam haben mit unseren Archiv­, Biblio­theks­ und Dokumentationssystemen. Sie analysieren und verknüpfen alle Daten, die ihre Maschinen im WWW finden, auch unsere Erschliessungs­daten, soweit sie darauf Zugriff haben. Dabei stellt sich die Frage, ob wir in Zukunft auf die Symbiose mit den gro­ssen Internetdiensten angewiesen sein werden? Wir liefern die Daten und Metadaten und die Internetdienste er­ schliessen sie für die Nutzer/innen? Oder könnten auch wir in allen zugäng­lichen Quellen verfügbare Informa­tionen zusammensuchen, verknüpfen und damit unsere eigene Erschlies­sungsarbeit beschleunigen und die Findmittel ergänzen?

Erschliessung in Theorie und Praxis – ein Überblick 

In unserer täglichen Praxis findet Er­schliessung in der Regel in einem sehr engen Rahmen statt. Wenn man nicht in der Lage ist, ein Erschliessungssys­tem von Grund auf neu zu bauen – und das sind wohl die wenigsten von uns – muss man mit dem Vorlieb nehmen, was man hat und das sind die Archiv­, Bibliotheks­ oder Dokumentationssys­teme, die bereits installiert sind. Diese Informationssysteme orientieren sich in der Regel an einem bestimmten Er­ schliessungsstandard, der auf einem bestimmten Modell der Informations­ objekte, die wir erschliessen, aufbaut. Sie geben der erschliessenden Person die möglichen Datenelemente und der suchenden Person die Abfragemöglich­ keiten vor. Entscheidungsspielraum haben wir meist nur beim Bestimmen der Erschliessungstiefe und bei der Wahl des beschreibenden Vokabulars. Eine automatische Analyse und Be­schreibung der Informationsobjekte ist, abgesehen von der Volltextindexie­rung meist nur ausserhalb dieser Sys­teme möglich.

Erschliessungsstandards und ­regeln gibt es ziemlich viele. In ihnen konden­ siert sich die Erschliessungstheorie und die Erschliessungspraxis der Spe­zialisten, welche an der Ausarbeitung jeweils beteiligt waren.

ISAD(G)

Im Archivbereich dominiert der Stan­dard ISAD(G), was «International Standard Archival Description (Gene­ral)» heisst und vom International Council on Archives erarbeitet worden ist. Sein inhärentes Modell bildet das traditionelle, Papier basierte Archiv­ gut und seine Aggregationsformen ab. Die zentrale Einheit ist das Dossier, das aus einzelnen Dokumenten besteht und dem dokumentarischen Nieder­schlag einer abgeschlossenen Ge­schäftstätigkeit entspricht. Dossiers von gleichartigen Geschäften, die zu einer bestimmten Aufgabe gehören, werden in der Regel in Serien, die zu einem ganzen Aktenplan­System aus­ gebaut sein können, geordnet. Alle Dossiers einer Organisation mit eige­nen Entscheidungskompetenzen wer­ den schliesslich gemäss dem traditio­nellen Provenienzprinzip zu einem Archivbestand vereint. Ergänzt wurde dieser Standard mit den beiden Stan­dards ISAAR(CPF) und ISDF sowie einem nicht als Standard verabschiede­ ten Dokument «Relationships in archi­val descriptive systems». Archivisches Erschliessen bedeutet wesentlich, In­ formationsobjekte in Beziehung zu ihrem Entstehungs­, Nutzungs­ und Überlieferungskontext zu setzen im Wissen darum, dass man Informationsobjekte erst adäquat verstehen und kritisch nutzen kann, wenn man diese Kontexte kennt. Die genannten zusätz­lichen Standards regeln die Identifizie­rung und Beschreibung sowohl der Akteure (Personen, Körperschaften) aus diesen Kontexten wie auch der Auf­gaben und Funktionen, welche diese ausführen und dabei die beschriebe­nen Informationsobjekte erzeugen, empfangen oder nutzen.

FRBR

Das Modell, das im bibliothekarischen Standard FRBR (Functional Require­ments for Bibliographic Records) im­plizit erkennbar ist, bildet den traditio­nellen Gegenstand einer Bibliothek, das Buch ab, berücksichtigt aber bereits die digitale Welt mit ihren Möglichkei­ten, Werke relativ leicht in unterschied­lichen Bearbeitungen und Formen zu reproduzieren. Das Modell kann prob­lemlos auch für audiovisuelle Doku­mente verwendet werden. Im Unter­schied zu den archivischen Standards spielt hier der Herstellungs­ und Ver­ wendungskontext eine geringere Rolle. Personen und Körperschaften sind da­ rin nur in ihrer Rolle aus Autoren, He­rausgeber, Eigentümer etc. vorgesehen und es ist nicht möglich, ein Dokument als Produkt einer spezifischen Aktivität mit spezifischen Zwecken zu beschrei­ben. Man geht offenbar stillschweigend davon aus, dass ein Buch oder ein au­ diovisuelles Dokument als selbständi­ges, sich selbst erklärendes Produkt für den Buchmarkt, bzw. den Film­, Tonträ­ ger­ oder Fotomarkt produziert und dort über mehr oder weniger zahlreiche Vervielfältigungen und in unbekann­ten Kontexten verwendet wird.

Spezifische Standards

Neben diesen beiden archivischen und bibliothekarischen Standards bzw. Mo­dellen gibt es spezifische Erschlies­sungsstandards der IASA (Internatio­nal Association of Sound and Audiovi­sual Archives) für Tonaufzeichnungen (IASA Cataloguing Rules 1999), der FIAF (Fédération Internationale des Archives du Film) für bewegte Bilder (FIAF Cataloguing Rules 1991) und der European Commission on Preservation and Access für Fotodokumente bzw. Fotosammlungen (SEPIADES 2003).

Aus den IASA Cataloguing rules ist kein klares, zugrundeliegendes Modell erkennbar, weil die Autoren bestrebt sind, ganz unterschiedlichen Typen von Tonaufzeichnungen gerecht zu werden. Obwohl darin empfohlen wird, sich an bibliographischen Modellen zu orientieren – nicht zuletzt, um Er­schliessungsdatensätze einfacher aus­ tauschen zu können –, wird darauf hingewiesen, dass auch ISAD(G) ein brauchbares Modell für eine Hierarchie­sche Mehrebenen­ Erschliessung von Tonaufzeichnungen bietet, die dann sinnvoll ist, wenn man zunächst nur auf Bestandes­ oder Kollektionsebene erschliesst um dann später tiefer bei Bedarf bis auf Einzeldokumente zu ge­hen.

Die FIAF Cataloguing Rules für be­wegte Bilder gehen in ähnlicher Weise vom bibliothekarischen Standard ISBD aus, machen aber ebenfalls gleich zu Beginn klar, dass dieser dem Film nicht gerecht werden kann, da ein archivier­tes Filmwerk ja häufig aus vielen Ele­menten besteht. Ein Film ist meist auf mehrere physische Einheiten verteilt, er kann in mehreren verschiedenen Ko­pien überliefert sein und von unter­schiedlichstem Material aus der Pro­duktions­ und Nutzungsphase begleitet sein.

Das SEPIADES­Modell für Foto­grafien (Safeguarding European Photo­graphic Images for Access Data Ele­ment Set) bezieht sich explizit auf den archivischen ISAD(G) Standard und besteht analog aus einem Mehrebenen­ Modell, das zwar andere Begriffe als ISAD(G) benutzt, aber in seinen we­sentlichen Elementen sehr ähnlich ist. Anstelle von Beständen spricht SEPIA­DES von Kollektionen und an Stelle von Serien und Dossiers von Gruppen auf mehreren möglichen Ebenen. Auch die Provenienz wird als sehr wichtig erach­tet, sie taucht dann aber eher versteckt in der Entität Akquisition als Attribut auf. Die Provenienz von fotografischen Kollektionen in der Beschreibung dar­ zustellen kann eine ausgesprochen schwierige Aufgabe sein, da Fotobe­ stände oft Besitzer und Zusammenset­zung wechseln können. Im SEPIADES­ Modell muss eine solche Herkunftsgeschichte im Freitext dargestellt werden.

Dieser kurze Überblick über eine Aus­ wahl von Erschliessungsstandards und ­modellen zeigt, dass bisher die Er­schliessungsregeln vor allem aus den Bedürfnissen des jeweiligen Medien­typs herausgewachsen sind. Die Mehr­heit der Institutionen hat aber Bestän­de, welche verschiedene Medientypen umfassen und nur ein einziges Infor­mationssystem zur Erschliessung und Nutzung. Für sie ist die Situation schwierig, sie müssen Kompromisse eingehen und eigene Modelle und Er­schliessungsregeln ausarbeiten, die alle ihre Medientypen integrieren und die sich in ihrem System auch umset­zen lassen.

Integration der Standards?

Legt man die verschiedenen bereichs­ spezifischen Standards nebeneinan­der, bekommt man den Eindruck, dass ein einheitlicher Erschliessungsstan­ dard für alle Medientypen möglich und sinnvoll wäre. Das Zentrum des FRBR­ Modells mit seiner Unterscheidung von «Work», «Expression», «Manifesta­tion» und «Item» wäre unter Anpas­sung der Begriffe geeignet zur Be­schreibung aller Informationsobjekte. Diesen Kern könnte man in das Modell der archivischen Standards um ISAD(G) integrieren, um sicherzustel­len das Entstehungs­ und Verwen­dungskontexte der Informationsobjek­te adäquat beschrieben werden können. Wahrscheinlich käme man dann zu einem relativ einfachen Modell, das mit den Entitäten «Informationsobjekt», «Akteur» und «Handlung» auskom­men würde, aber starkes Gewicht auf die Qualifizierung der Beziehungen dieser Entitäten untereinander legen würde, so dass bspw. ein und dieselbe Person bzw. Organisation als Autorin, Besitzerin, Produzentin, Auftraggebe­rin etc. mit beliebig vielen Informationsobjekten verknüpft werden könnte. Die Provenienz liesse sich so differenziert und, was im digitalen Zeitalter besonders wichtig ist, in strukturierter Form darstellen und nicht wie bisher mehrheitlich als Attribut mit einem Freitexteintrag, der sich durch Compu­ter nur schwer auswerten lässt.

Der gleichgewichtige Einbezug von Ak­teuren und Handlungen neben den eigentlichen Informationsobjekten in die Erschliessung ist für Archivar/in­nen von Textdokumenten selbstver­ständlich. Bei audiovisuellen Doku­menten ist das genauso wichtig. Audio­visuelle Dokumente sind – wenn sie nicht vollständig am Computer gene­riert oder als künstlerische Produkte erstellt worden sind, per se Aufzeich­nungen eines zeitlich und örtlich be­stimmten Wirklichkeitsausschnittes. Sie haben auch heute noch – wenn auch nicht mehr so stark wie in den Frühzei­ten von Fotografie, Film und Tonauf­nahme – die Aura des getreuen Abbil­des von Wirklichkeit. Dabei wissen wir oder sollten wir eigentlich wissen, dass bspw. audiovisuelle Aufzeichnungen aus Konfliktgebieten zu einem grossen Teil gestellt oder manipuliert sind. Wenn ich nicht zeigen kann, wer in wel­chem Handlungsrahmen für welche Zwecke die Aufzeichnungen erstellt und verarbeitet hat, können solche Auf­zeichnungen nur Aussagen darüber erlauben, wie man einem Publikum einen Konflikt darstellen will. Rück­schlüsse von den Aufnahmen auf reale Vorgänge sind ohne dieses kontextuelle Wissen nicht statthaft.

Suchbedürfnisse

Der bibliographische Standard FRBR geht nicht nur von einem bestimmten Modell der Informationsobjekte aus, ersetzt auch explizit bei den Suchbedürf­nissen an, welche mit der Erschlies­sung befriedigt werden sollen. Die Suchfragen, die im Standard genannt werden, lassen sich leicht auf einen grösseren Nutzungsbereich erweitern: 

– Ist etwas Bestimmtes, von dem ich die Provenienz, den Autor, den Titel oder eine andere Identifikationsin­formation kenne, vorhanden?

– Was gibt es überhaupt von einer be­stimmten Provenienz bzw. von ei­nem bestimmten Autor, Fotografen etc.?

– Was gibt es für Dokumente über ein bestimmtes Thema?

– Wo kommen bestimmte Motive bzw. bestimmte Inhaltselemente vor?

– Wie ist etwas zugänglich bzw. benutz­bar?

Zu diesen Fragen kommen spezifische betriebliche Recherchebedürfnisse zur Verwaltung der Informationsobjekte, die auch als Fragen formuliert werden könnten.

Die verschiedenen dargestellten Typen von Suchfragen können in der Realität sehr unterschiedliche Wichtigkeit ha­ben, je nach Institution und Kunden­ stamm und je nach Inhalt eines Bestan­des. In einer Fotosammlung von Bau­ werken einer Stadt bspw. wird die Su­che nach Bauwerken bzw. Orten wesentlich wichtiger und häufiger sein als die Suche nach dem Fotografen. In der Praxis wird es wichtig sein, zu Be­ginn eines Erschliessungsprojektes diese prioritären Suchbedürfnisse zu bestimmen. Sie sind ein Schlüssel da­zu, die meist knappen Ressourcen für Erschliessungsprojekte gezielt einzusetzen. 

Inhaltsanalyse

Die klassischen «Gibt es»­Fragen ent­ sprechen nur zum Teil den Erwartun­gen von Nutzer/innen. Diese möchten Informationsobjekte heute über das Internet nicht nur lokalisieren, sie möchten zunehmend direkt auf die ge­suchten Fakten und Informationen zu­ greifen ohne sich um die Informations­objekte, in denen diese enthalten sind, kümmern zu müssen. Bei audiovisuel­len Unterlagen stellt sich dabei das Pro­blem, wie man Bild­ und Toninforma­tionen möglichst effizient analysiert und in Form von strukturierten Daten für Recherchesysteme erschliesst. Um personelle Ressourcen zu sparen, macht es Sinn, möglichst viel Analyse­ und Beschreibungsarbeit durch Com­puter ausführen zu lassen. Vorausset­zung dazu ist, dass die Informationsob­jekte in digitaler Form vorliegen. Für Textdokumente sind ja schon lange relativ ausgeklügelte Indexierungsver­fahren bekannt und im Einsatz. Im Be­reich der audiovisuellen Dokumente lassen sich seit einiger Zeit bereits Ver­fahren wie die Erkennung von Gesich­tern und anderen Bildmustern erfolg­reich einsetzen. Auch die Spracherken­nung aus Tondokumenten ist weit fort­ geschritten und liefert für eine weitere inhaltliche Analyse brauchbare Texte. Eine detailliertere Inhaltsanalyse lässt sich also heute für alle Medientypen, die digital vorliegen, mehr oder weni­ger automatisieren. Natürlich sind die Ergebnisse nicht vergleichbar mit einer von ausgebildeten Personen auf der Ba­sis einer einheitlichen Dokumentati­onssprache erstellten Beschreibung. Trotzdem sind die Ergebnisse für Nut­zende ganz gut brauchbar. Die Google­ Generation hat sich an Lücken und falsche Treffer bei der Suche gewöhnt. 

Öffnung und Verknüpfung der Daten

Ausserdem existieren viele Informatio­nen und Daten, die wir für die Beschrei­bung unserer Objekte brauchen, be­reits irgendwo, oft sogar als qualitativ hochstehende Normdatei bspw. zu ei­ner Person oder Körperschaft. Solche Informationen braucht man heute oft auch nicht mehr ins eigene System ab­zuschreiben, denn man kann sie etwa als Kopie in offenen Formaten über das Internet beziehen oder man kann sie über eine Internet­URL als Verknüp­fung in das eigene Informationssystem einbauen. Die erste Variante setzt aller­ dings voraus, dass man dieselben Erschliessungsstandards anwendet, wenn man nicht potentiell aufwändige Umwandlungsarbeiten in Kauf neh­men will.

Ein Beispiel für eine Erschliessung von unterschiedlichen Informationsres­sourcen in verschiedenen Formaten bietet das Projekt metagrid.ch. Die noch im Aufbau begriffene Webseite bietet ein Navigationssystem durch die Informationslandschaft indem sie Informationen unter verschiedenen As­pekten verknüpft und diese wie eine Landkarte grafisch darstellt (lonsea.org). Damit ermöglicht bzw. verlangt man ein völlig anderes Suchverhalten. Anstatt ausgeklügelte Anfragen in mehr oder weniger grosse Suchmasken einzutippen, reicht es, einen Zugangs­punkt, bspw. einen Personennamen zu wählen, um an den Startpunkt einer Informationslandkarte zu kommen. Von dort aus bietet das System ähnlich wie bei einem Empfehlungssystem alle möglichen Verzweigungen zum ange­strebten Wissensziel an, womit wir wie­ der bei der eingangs dargestellten Ana­logie zum Navigationssystem im Auto wären. Damit aber solche Informati­onslandkarten möglich sind, braucht es viele Beteiligte, die ihre Daten und In­formationen zur Verlinkung oder zum Download freigeben.

Schlussfolgerungen

Zusammenfassend kann man folgende Punkte festhalten: – Die traditionelle Erschliessungstheo­rie für audiovisuelle Medien ist auf den jeweiligen Medientyp bezogen und deshalb für den grossen Teil un­serer Institutionen sowie überhaupt für neue multimediale Dokument­ formen nur beschränkt geeignet.

– Es dürfte sich lohnen, das manuelle Erschliessen auf einen harten Kern an standardisierten Metadaten zu be­schränken und diese in einer Form zu präsentieren, die leicht verlinkbar ist. Frei werdende Ressourcen sollten für die Digitalisierung genutzt wer­ den, um oft überhaupt erst das Poten­tial für die automatische Analyse und die vernetzte Nutzung zu schaffen, welche im Blick auf die Zukunft wich­tiger sind, als eine detaillierte Be­schreibung.

– Metadaten und Informationsobjekte sollten nicht in den eigenen Syste­men vergraben werden, sondern im Sinne der Open Data­Bewegung an­ deren Institutionen für ihre Erschlie­ssungsarbeit und unseren Nutzer/innen für ihre Auswertungen zur Verfügung gestellt werden.

Avatar

Niklaus Bütikofer

Universität Bern

Kommentare

*Pflichtfeld

Abstract

La théorie classique du catalogage des médias audiovisuels se réfère à chacun des types de médias spécifique et n’est donc adéquate que dans une mesure restreinte pour la plupart des institutions I&D concernées ainsi que, évidemment, pour les nouvelles formes de documents multimédias.

Il serait donc judicieux de limiter le catalogage manuel à un noyau dur de métadonnées standardisées et de présenter ces dernières sous une forme qui permette de travailler facilement avec des liens. Les ressources libérées devraient être utilisées pour la numérisation afin de créer d’abord le potentiel pour l’analyse automatique et l’utilisation réticulée, deux aspects qui sont prospectivement plus importants qu’une description détaillée.

Les métadonnées et les objets d’informations ne devraient pas être enfouis dans les systèmes en propre, mais être mis à disposition d’autres institutions pour leur travail de catalogage et de nos clientes et clients pour leur valorisation, et ce, dans le sens du mouvement Open Data. (traduction: sg)