Kommentare Abstract
2014/2 Zur Erschliessung von AV-Medien

Web-Portale: «Die Pforten der Wahrnehmung» von Kulturgut

Kommentare Abstract

35 Jahre vor der Erfindung des Web veröffentlichte Aldous Huxley seinen Essay «The doors of perception», in dem er seine Experimente mit bewusstseinserweiternden Drogen verarbeitete. Er kam u. a. zum Schluss, dass unser Hirn und Nervensystem hauptsächlich darauf ausgelegt sind, uns durch sinnvolle Reduktion der Komplexität vor der Unendlichkeit der Realität zu schützen. In vielleicht etwas verwegener Analogie, aber nüchtern betrachtet könnte man Online-Portalen und deren Metadatenschemen eine ähnliche Funktion im quasi bewusstseinserweiternden Web zuschreiben.

Portale und Aggregatoren

Web­Portale für Kulturgut wie die Eu­ropeana erfüllen zunächst den Zweck, auf einheitliche Weise sprach­, medi­en­, institutions­ und länderübergrei­fende Recherchier-­ und Konsultations­möglichkeiten für geografisch verteilt aufbewahrte, oft auf unterschiedliche Weise erschlossenes (historische) Kul­turgut für die Benutzung anzubieten. Darüber hinaus sind die dahinter ste­henden Projekte – insbesondere so gross angelegte wie die Europeana – Kristallisationspunkte für aktuelle fachliche Entwicklungen wie Digitali­sierung und Vermittlung, Umgang mit Metadaten, innovative Präsentations­ und Benutzungsmöglichkeiten, Be­handlung rechtlicher Fragen usw. Erarbeitete Lösungen manifestieren sich auf der jeweiligen technischen Platt­form mit Tools, weiterverwendbaren Daten und offenen Schnittstellen.

Aggregatoren haben die Funktion, Daten zu sammeln, aufzubereiten (Standardisieren, Harmonisieren etc.) und in einer vorgegebenen Form und Art interoperabel bereitzustellen. Meist bieten sie darüber hinaus selbst eine auf das aggregierte Kulturgut zuge­schnittene, umfassender ausgestattete Benutzeroberfläche als dies im belie­ferten Portal möglich ist, welches dafür den Mehrwert der Verbindung zu wei­terem Kulturgut bringt. Dieser Um­stand könnte eine mögliche Antwort geben auf die von Peter Haber in sei­nem Arbido­-Artikel zu Archivportalen kürzlich aufgeworfene Frage, ob es an­gesichts grösserer Portale noch sinn­ voll sei, regionale oder nationale Porta­le zu bauen1. Kleinere geografisch, thematisch oder anderswie abgegrenzte Portale erlauben neben der Vorverar­beitung für das übergeordnete oder be­nachbarte Portal (z. B. medien­)spezifische und ausführlichere Präsentation resp. Vermittlung des bereitgestellten Kulturguts. So sind Web-­Portale und Aggregatoren eher als Ergänzung denn als Ersatzinstututionseigener Online­ Angebote zu sehen, um insgesamt mehr aus den Daten und schlussend­lich dem Kulturgut zu machen. Habers Warnung vor proprietären Insellösun­gen, welche zu sehr teuren «Nachrüs­tungen» führen würden, gewinnt in diesem Zusammenhang allerdings zu­sätzlich an Gewicht.

Europeana

Die Europeana ist wohl weltweit eines der grössten Web­-Portale für Kulturgut. Es gibt Zugriff auf über 30 Millionen Objekten aus über 2300 Institutionen, 36 Ländern und in 31 Sprachen. Die Europeana bezieht ihre Inhalte von 150 Aggregatoren, hinter denen ein Land, ein Projekt oder eine unabhängige Or­ganisationen stehen; Projekt­-Aggrega­toren bilden sich um ein Konsortium mit einem spezifischen Zweck und Thema/Bereich. Im folgenden interes­sieren uns besonders die in Abb. 12 ge­nannten Aggregatoren aus dem audio­visuellen Bereich. Dessen Repräsenta­tion bleibt in der Europeanamengen­ wie anteilsmässig nach wie vor be­scheiden, wie in Abb. 23 zu sehen ist. So bestehen Ende 2013 nur ca. 2,5% der in der Europeana nachgewiesenen Ob­jekte aus bewegten Bildern und Tönen; andererseits gehören gerade diese zum weitaus gefragtesten Material4. Aus die­ sen Gründen sind Aggregatoren aus dem audiovisuellen Bereich für die Eu­ropeana besonders wertvoll.

Metadaten in Europeana

Ein Eintrag in der Europeana ist zusam­mengesetzt aus einer variierenden Menge Metadaten, einem Thumbnail sowie einem Link zur Ressource selbst, also auf den vom Content Provider betriebenen Web­-Zugang zum beschrie­benen Objekt. Als technische Anforde­rungen für die Lieferung von Daten wird Konformität zum «Europeana Data Model (EDM)» oder eine Form des «Dublin Core based Europeana Seman­tic Elements (ESE)» vorausgesetzt. Der erwähnte Link muss stabil sein und das angesteuerte System muss über eine OAI-­PMH Schnittstelle verfügen. De­taillierte Erklärungen, Anleitungen und Spezifikationen zum EDM findet man auf der Europeana-­Website für Fachleute5. Die grosse Herausforde­rung bezüglich Metadaten wird von Europeana­-Seite so beschrieben: «A vast number of Europe’s cultural heri­tage objects are digitised by a wide ran­ge of data providers from the library, museum, archive and audio­visual sec­tors, and they all use different metadata standards. This data needs to appear in a meaningful way in a crosscultural, multilingual context such as Europea­na.»6 Die Feststellung der Heterogeni­tät der angewendeten Metadatenstan­dards gilt für den audiovisuellen Be­reich umso mehr, als die Verbreitung, Anwendung und Reife allgemein aner­kannter Standards weit geringer ist als für andere Dokumentarten. Das EDM berücksichtigt allgemeine Normen/Standards wie Dublin Core (DC) oder METS sowie bereichsspezifisch ver­breitete wie LIDO (Museen), EAD (Ar­chive) und MARC (Bibliotheken) und bereitet sie semantisch auf. EDM ist in dem Sinn «a framework for collecting, connecting and enriching metadata.»7 Für eine so übergreifende Anwendung wie in der Europeana besteht die Her­ausforderung der Datenmodelle und (minimaler) Metadatensets im Finden des grössten gemeinsamen Nenners, der das Auffinden und die Verständ­lichkeit der Objekte auf dem Portal ge­währleistet sowie für die Content Pro­vider umsetzbar ist.

Dass der Umgang mit Metadaten für die Europeana eine sehr grosse He­rausforderung darstellt zeigt die Unter­schätzung des Aufwands für die umfas­sende Umsetzung des EDM, die 2013 auch zu verzögerten Datenimporten geführt hat; die Qualität der Metadaten ist eine der wichtigen Herausforderun­gen der Zukunft der Europeana, zudem erweisen sich allgemein, aber auch hier wieder insbesondere für audiovisuelles Kulturgut, Metadaten zu rechtlichen Fragen als zentral8.

European Film Gateway EFG

Welchen Aufwand komplexe Metada­tenmodelle von Aggregatoren generie­ren können zeigt das Beispiel des EFG, einem «Portal, das schnellen und ein­fachen Zugriff auf hunderttausende von filmhistorischen Dokumenten bie­tet, die in 16 [Korr. YN: 29] europäi­schen Filmarchiven und Kinemathe­ken verwahrt werden. Hierzu gehören Stand­ und Setfotos, Filmplakate, Pro­duktionsunterlagen, Kostümentwürfe, Programmhefte, Zeitschriften, Zensur­karten, seltene Spiel-­ und Dokumentar­filme, Wochenschauen und weiteres Material aus 15 unterschiedlichen Län­dern.»9 Auf dem EFG sind heute 647 264 Dokumente einsehbar, wovon allerdings nur gut 5% Filme (resp. Vi­deos) sind; in der Europeana sind davon 593 996 Dokumente nachgewiesen, wovon 30 587 Videos. Aus der Schweiz nimmt die Lichtspiel­-Kinemathek Bern teil, aus deren Sammlung 79 Filme im EFG konsultierbar sind.

Im Projekt EFG spielte die Entwick­lung eines Metadatenmodells und die Integrierung zahlreicher mehrsprachi­ger Vokabulare eine wesentliche Rolle, weil die Erschliessungspraktiken in Filmarchiven sehr heterogen sind. Be­stehende Normen und Standards wie FRBR der IFLA und EN 15907 und diverse ISO-­Normen für Vokabulare wurden aufgenommen in das Modell, wel­ches in einem semantischen Geflecht acht Haupt-­Beschreibungseinheiten auf drei hierarchischen Ebenen be­schreibt: geistige Schöpfung («creati­on»), dessen physische Ausdrucksform («manifestation») und die direkt zu­ gänglich gemachten digitalen Objekte («item»). Die Beschreibungseinheiten werden mit einzelnen Elementen (wie Identifikator, Titel, Datum, Dauer, Sprache etc.) beschrieben und mit klardefinierten «relations» verbunden; At­tribute (wie Art des angegebenen Da­tums, Rolle der angegebenen Sprache) präzisieren oder konkretisieren einzel­ne Elemente oder «relations»10. Diese Art der Beschreibung erlaubt es auf maschinenlesbare Weise ein Werk (z. B. einen Film) in einer bestimmten Fas­sung (z. B. Vorführkopie) zu beschrei­ben, mit einem oder mehreren «agents» (z. B. Produktionsfirma oder Darstel­lende) oder anderen Einheiten (wie an­dere Fassungen, Standfotos oder Kriti­ken) sowie den jeweils vorhandenen Digitalisaten (z. B. Videos, Fotos, PDFs etc.) «sinnvoll» zu verbinden.

Auf zwei bemerkenswerte Aspekte soll noch hingewiesen werden: Zum einen enthält das Modell die Beschrei­bungseinheit Sammlung, die bisher in der eher bibliothekarisch oder doku­mentarisch geprägten Erschliessung von AV ­Dokumenten wenig verbreitet war und erst langsam an Bedeutung gewinnt: «In the EFG context, a collec­tion is defined by a compilation of crea­tions (audiovisual or non­ audiovisual). This entity refers to the notion of coll­ection professionally curated in an ar­chive [...].»11 Zum anderen muss noch bemerkt werden, dass ein solch kom­plexes Modell zwar enorme Potentiale für die Benutzung und Vernetzung im Web birgt, die Umsetzung aber mit er­heblichem Aufwand verbunden ist. Dieser konnte im Fall von EFG nur dank «eines [finanziell] vergleichswei­se gut ausgestatteten Projekts» geleis­tet werden, indem die Verarbeitung der nur minimal einheitlich zu liefernden Daten durch Projektmitarbeitende ge­leistet wurde, was fast 1,5 Personenjah­re Arbeit generierte12. Nach Ablauf der Projektfinanzierung müssen Daten dem EFG­Schema konform abgeliefert werden, was seitens Content Providern einen schwer überwindbaren Aufwand verursacht.

EUscreen und EUscreenXL

EUscreenXL baut auf den Ergebnissen des Vorgängerprojekts EUscreen auf und vereint in seinem Konsortium ca. 30 Partner (Rundfunk­ und andere au­diovisuelle Archive) aus über 20 euro­päischen Ländern. EUscreen hat 2009–2012 u. a. eine Online-­Plattform für die mehrsprachige, multifunktio­nale Recherche und direkte Konsultati­on von über 40 000 Rundfunk­-Beiträ­gen geschaffen. Ein eigens für EU­screen entwickeltes Webtool ermöglichte die Bereitstellung von über zwei Dutzend kuratierten Online­-Austellun­gen auf der Plattform. Memoriav hat in Zusammenarbeit mit SRF und RTS 387 Dokumente aus deren Archiven für EUscreen ausgewählt, aufbereitet und geliefert. Diese Dokumente sind auf euscreen.eu sowie in der Europeana zugänglich. EUscreenXL entwickelt das Erreichte bis 2016 in zwei Haupt­richtungen weiter: Einerseits wird die Kernsammlung erweitert , andererseits wird die Europeana massiv mit Metada­ten beliefert (Ziel ist 1 Mio Datensätze), um den oben erwähnten kleinen Anteil an AV­ Dokumente in Europeana subs­tantiell zu erhöhnen.

EUscreen hat bezüglich Metada­tenschema einen anderen Ansatz als EFG gewählt und dafür ein vergleichs­weise einfaches Set von Metadaten ent­wickelt. Das «EUscreenXL Common Metadata Scheme» folgt den zwei Hauptausrichtungen des Projekts: Für die massenhafte Belieferung der Euro­peana ist ein Metadatenschema mit 26 Elementen vorgesehen, von denen mindestens 8 Elemente geliefert wer­den müssen; von diesen können 2 au­tomatisch generiert und weitere 4 als fester Wert für ganze Lieferungen fest­gesetzt werden. Das Schema beinhaltet vornehmlich DC-­Elemente, welche um wenige EDM­-Elemente ergänzt wur­den; für die Kernsammlung wird ein etwas ausführlicheres Schema ange­wendet, welches 42 Elemente umfasst, von denen wiederum 25 Pflicht sind. Bemerkenswert ist auch hier die neuer­liche Einführung von «series/collec­tions» als Beschreibungseinheit, mit welcher zusammengehörige Dokumente verbunden werden; der «series record» enthält gut ein Dutzend Pflichtelemente und 13 weitere für zusätzli­che Beschreibungen.

Für die Lieferung und Transforma­tion der Daten aus den ursprünglichen Datenbanken hat EUscreen das webba­siertes Mapping­ und Ingestions­-Tool «MINT» entwickelt, welches die Con­tent Providern in der Bereitstellung der Metadaten in der erforderlichen Form und dem vorgegebenen Inhalt unter­stützt.

Aufwand, Ertrag und Potentiale

EFG und EUscreen haben also kom­plett unterschiedliche Ansätze im Um­gang mit Metadaten gewählt: Ein hoch komplexes Metadatenmodell, das mit enormem Mapping­ und Transformati­onsaufwand durch Spezialisten ver­bunden ist auf der einen Seite, ein re­lativ simples Metadatenset mit Webtool für Mapping und Transformation, das von «IT­Laien» benutzt werden kann auf der anderen.

Ein wichtiges Thema, das nur ange­deutet werden konnte, stellt der Um­gang mit den Rechten dar, der für die Bereitstellung von AV ­Material zentral ist und je nach dem mit enormem Auf­wand verbunden ist. Wie oben erwähnt stellt die Bereitstellung von klaren recht­lichen Hinweisen in der Europeana – und damit natürlich für alle Aggregato­ren – eine wichtige Herausforderung dar, welcher mit eigenen Metadatenele­menten auf der Beschreibungsebene sowie einzelnen Vereinbarungen auf der legalen Ebene begegnet wird.

Der erhebliche Aufwand der Erar­beitung von Metadatenschemen und Verarbeitung von Metadaten ist wie Er­schliessung grundsätzlich als Grundla­genarbeit zu sehen, auf die künftig zu­ rückgegriffen werden kann. Die Euro­peana dokumentiert hierfür die Ergebnisse der verschiedenen Bemühungen13. Wie solide Grundlagen die eigenen Möglichkeiten und die Effizienz von späteren Projekten steigern können zeigt das Beispiel des Lichtspiels in Bern, welches dank dem EFG­-Vorgän­gerprojekt «filmarchives­online» eine neue Datenbank mit neuem Datenmo­dell erarbeiten konnte, welche für die Bereitstellung auf der eigenen Website tauglich ist und zudem Datenexporte ermöglicht, welche für die Lieferung an Portale geeignet sind; so war der Zu­satzaufwand für die Teilnahme an EFG (und damit automatisch Europeana) sehr überblickbar und betraf v. a. die Erarbeitung einer Schnittstelle für die automatische Übernahme von Daten und zusätzlichen Digitalisierungen, welche durch die günstige Gelegenheit angeregt wurden und so mehr Material überhaupt erst breiter zugänglich machten.

Den konkreten Nutzen der Bereitsstellung von AV­ Dokumenten auf Por­talen zu benennen oder gar zu messen ist nicht ganz einfach; Europeana gibt hierzu in ihrem Jahresbericht statisti­sche Informationen14. Die Nachfrage, welche die Bereitstellung auf den On­line­Portalen «filmarchives­online», EFG und Europeana generiert und die direkt bei ihm ankommt, schätzt das Lichtspiel auf ca. eine wöchentliche An­frage – mehr als durch ihre eigene Web­ seite, wo dasselbe Angebot abrufbar ist. Diese Anfragen von Forschenden, Ku­ratorInnen und engagierten Film­Ama­ teuren aus aller Welt können wiederum Digitalisierungsaufträge auslösen oder auf besondere Trouvaillen sowie bisher unbekannte Kontexte aufmerksam ma­chen. Besondere Anlässe wie der Jah­restag des Ausbruchs des Ersten Welt­krieges können für besondere Projekte wie das EFG1914 Projekt zur Digitali­sierung von Filmen aus und über den Ersten Weltkrieg genutzt werden; die so angeregte Nachfrage kann schnell einmal die Kapazitäten eines mittelgro­ssen Filmarchivs ausreizen.

Nebst ihrer Wirkung als Motoren für die Umsetzung latenter Vorhaben kann man Web­Portale also vielleicht tatsächlich als Pforten der Wahrneh­mung von Kulturgut sehen, wobei die dabei erarbeiteten Metadaten gewisser­ massen das zentrale Nervensystem bilden, welches durch sinnvolle Kanalisie­rung und Reduktion der unendlichen Web­Realität die Grundlage qualifizierter Nutzungs-­ und Vermittlungsmög­lichkeit darstellt.

Avatar

Yves Niederhäuser

Yves Niederhäuser ist verantwortlich für den Bereich Video/TV von Memoriav. 

Abstract

Les portails Web offrent, d’une manière uniformisée, des possibilités de recherche et de consultation, à travers les langues, les médias, les institutions et les pays, des biens culturels (historiques) catalogués, répartis géographiquement et conservés souvent de manières différentes. Les agrégateurs jouent un rôle important dans ce contexte, car ils collectent, standardisent et mettent à disposition des données sous une forme prescrite. Les Europeana offrent aujourd’hui un accès à plus de 30 millions d’objets, dont seuls 2,5% sont des biens culturels audiovisuels; mais comme la demande de ce type de documents est très grande, les agrégateurs sont particulièrement importants dans ce domaine. Le European Film Gateway et le EUscreenXL fournissent les Europeana avec des documents filmés, tels des archives TV. Pour ce qui est des métadonnées indispensables à cette fin, deux approches différentes ont été adoptées: d’une part, un modèle de données hautement complexe, conçu sémantiquement et impliquant des coûts de traitement énormes et, d’autre part, un schème comparativement simple avec un outil en ligne pour le mapping et les transformations. (traduction: sg)