Kommentare Abstract
2013/4 Linked Open Data und Big Data

Die Bibliographic Framework Initiative (BIBFRAME) der Library of Congress – Offene, verknüpfte Datensätze

Kommentare Abstract

Die Bibliographic Framework Transition Initiative stellt ein zukunftsorientiertes Modell für den Übergang von MARC zu verknüpften offenen bibliografischen Daten vor. Das Modell orientiert sich sowohl an der Praxis als auch an bereits vorliegenden Modellen (FRBR) und neuen Katalogisierungsregeln (RDA).

Grenzen neuer Dienstleistungen für Bibliotheksnutzer/innen 

Bibliotheken bemühen sich bei der Ent­wicklung neuer Angebote vermehrt um Zusammenarbeit, um ein grösseres Publikum zu erreichen und die Kosten für die Dienstleistungen teilen zu kön­nen. Ein Beispiel dafür ist der Velo­buchkurier der fünf am «Bibliotheks­ platz Chur»1beteiligten Bibliotheken: Die Kunden können sich Medien der teilnehmenden Bibliotheken kostenlos in die Lieferbibliothek ihrer Wahl brin­gen lassen und Medien an der nächst­gelegenen Bibliothek zurückgeben. Die innovative Dienstleistung hat aller­dings einen Haken: Interessierte Nutzer/innen müss(t)en in zwei verschie­denen Onlinekatalogen suchen, um den Gesamtbestand der beteiligten Bi­bliotheken abzufragen – wer ist heute noch bereit, diese Mühe auf sich zu nehmen? Der Aufwand für die Realisie­rung einer Webanwendung zur gleich­zeitigen Suche in beiden Katalogen ist für die beteiligten Bibliotheken aber aus technischen und finanziellen Grün­den nicht vertretbar.

Im Rahmen des Innovations­ und Kooperationsprojekts der Schweizer Hochschulen «E­lib.ch: Elektronische Bibliothek Schweiz» wurde der Auf­wand geleistet. Mit der Eingabe von Stichwörtern im Suchfeld von Swiss­bib2werden die Bestände von 900 Bib­liotheken, Mediotheken und Archiven aus allen Landesteilen der Schweiz abgefragt, darunter auch diejenigen der Churer Bibliotheken. Aber Swissbib wäre auch keine Lösung. Weil die Suche nur auf Bibliotheksverbünde und nicht auf einzelne Bibliotheken einge­schränkt werden kann, müssen zur Ab­frage des Gesamtbestands des «Biblio­theksplatzes Chur» trotzdem zwei ge­trennte Suchen durchgeführt werden.

Verteilte geschlossene Datenbanken sind keine zukunftsorientierte Form der Datenhaltung für Gedächtnisinsti­tutionen. Um Bibliotheksnutzerinnen und ­nutzern innovative Dienstleistun­gen anbieten zu können, ist Open Data eine (notwendige) Grundlage.

Open Data

Open Data ist eine Bewegung mit dem Ziel, Daten aus geschlossenen Daten­banken zu «befreien» und im Web öf­fentlich zugänglich und nutzbar zu machen. Wer eine auf offenen Daten beruhende Dienstleistung anbieten möchte, kopiert die Daten und pro­grammiert eine passende Webapplika­tion. Ein Beispiel für offene geografischen Daten (Orte, Strassen, Gebäude usw.) bietet OpenStreetMap. Basierend auf den Daten von OpenStreetMap3stellt eine an der HTW Chur realisierte Webanwendung die (auf OpenStreet­ Map erfassten) Schweizer Bibliotheken (und Museen) auf einer Karte dar4.

Die Veröffentlichung von Daten bewegt momentan vor allem die Behörden (Open Government Data). Beispiels­ weise hat am 16. September 2013 die Bundesverwaltung ihr Pilotportal für offene Behördendaten der Schweiz5er­öffnet. Ein erster Schritt von Bibliothe­ken in Richtung Open Data wäre die Öffnung der OPAC und die Publikation ihrer bibliografischen Daten im Web. Vorreiterin diesbezüglich war die Bib­liothek des Kernforschungszentrums CERN in Genf, welche im Dezember 2009 die Datensätze des CERN Docu­ment Server im Format MARCXML im Web zum Download zur Verfügung stellte67.

Die Open-­Data-­Bewegung legt das Format der offenen Daten nicht fest. Das Format MARCXML wäre demnach für die Veröffentlichung bibliografi­scher Daten durchaus geeignet. Aber das kryptische Feldformat ist nicht mehr zeitgemäss und die Belegung der Felder von Bibliothek zu Bibliothek zu unterschiedlich (vgl. Library of Con­ gress, 2011). Die Programmierung von Metasuchfunktionen ist deshalb sehr aufwendig.

Linked Open Data

Das Konzept von Linked Open Data ist strikter als dasjenige von Open Data. Es legt nicht nur fest, dass die Daten im Web veröffentlicht und durch einen Unified Resource Locator8 (URL) ein­ deutig addressierbar sein müssen; das Konzept von Open Data legt auch fest, dass die Datensätze in einer standardi­sierten Form (RDF9) maschinenlesbar formuliert sein und Verknüpfungen (Links) mit weiteren, verwandten Da­tensätzen enthalten müssen (Berners­ Lee, 2006).

Auf bibliografische Daten übertragen ermöglichte das Konzept von Linked Open Data den Nutzerinnen und Nut­zern, Werke, Autorinnen und Autoren, Institutionen und viele weitere Fakten zu entdecken. Im Linked­-Open­-Daten­ satz zu «The Great Gatsby» wäre anstel­le des Namens des Autors (die Buchsta­benfolge «Fitzgerald, F. Scott») eine Verknüpfung zum Datensatz mit Anga­ben zum Autor Francis Scott Fitzgerald zu finden und würden beispielsweise auch Verknüpfungen zu Datensätzen mit Angaben zu den Übersetzungen und Verfilmungen des Romans enthal­ten sein. Und weil diese Datensätze maschinenlesbar wären, würde eine entsprechende Webanwendung einer Person, die sich für den grossen Gatsby interessiert, durch automatisches Ver­folgen der verknüpften Datensätze auch anzeigen können, dass Francis Scott Fitzgerald Ernest Hemingway kannte.

Einen Weg von offenen bibliografi­schen Daten im Format MARCXML zu verknüpften offenen bibliografischen Daten bietet die Bibliographic Frame­ work Transition Initiative (BIBFRAME) der Library of Congress.

BIBFRAME

BIBFRAME10ist eine Initiative der Lib­rary of Congress. In Zusammenarbeit mit der Firma Zepheira11, Library and Archives Canada, der British Library, der Deutschen Nationalbibliothek und anderen Nationalbibliotheken, zahlrei­chen MARC-Nutzergruppen und weite­ren Communities wird ein Modell ent­wickelt, das den Grundstein für die Zukunft verknüpfter offener bibliogra­fischer Daten legt. Das praxisorientier­te Modell berücksichtigt die Anforde­rungen an detaillierte bibliografische Beschreibungen, an Beschreibungen anderer kultureller Objekte und an we­niger detaillierte Beschreibungen von Inhalten gleichermassen. Die Initiative befasst sich aber nicht nur mit einem zukunftsorientierten Ersatz für das Ma­chine Readable Cataloging (MARC) Format, sondern untersucht auch As­pekte der Erfassung und des Aus­tauschs bibliografischer Daten (z.B. Katalogisierungsregeln und Datenaus­tauschprotokolle).

Das Modell von BIBFRAME lehnt sich an dasjenige der Functional Require­ments for Bibliographic Records (FRBR) an. Es unterscheidet klar zwi­schen einem Werk (work) und dessen physischen/digitalen Erscheinungsfor­men (instances), umfasst aber nur die­se beiden Ebenen (anstelle der vier Ebe­nen Werk/Expression/Manifestation/ Exemplar von FRBR). Werke und Ins­tanzen können Beziehungen zueinan­der und untereinander sowie Bezie­hungen zu Autoritäten (authorities) und Notizen (annotations) aufweisen.

Zur Beschreibung der Beziehungen stellt BIBFRAME ein Vokabular zur Verfügung, das erweiterbar ist. Bei­spielsweise beschreiben die Ausdrücke «hasInstance» bzw. «instanceOf» die Beziehung zwischen einem Werk (z.B. ein Roman) und dessen Erscheinungs­ formen (z.B. Taschenbuch). Der Aus­druck «creator» beschreibt die Bezie­hung zwischen dem Roman und des­sen Autor/in. Und mit dem Ausdruck «providerName» wird die Beziehung zwischen einer Instanz (z.B. das Ta­schenbuch) und dem publizierenden Verlag beschrieben.

Auf der Website von BIBFRAME11 steht ein Onlinedienst zur Verfügung, um MARCXML-­Datensätze automatisch in das Format BIBFRAME zu konvertie­ren. Bei der Konversion werden die Verknüpfungen mit Autoritätsdaten­sätzen ebenfalls automatisch einge­fügt. Damit können auch Verbünde kleinerer (öffentlicher) Bibliotheken 

Quellen

Avatar

Bruno Wenk

HTW Chur

Abstract

L’initiative Bibliographic Framework Transition présente un modèle d’avenir pour la transition de MARC à des données biographiques ouvertes et connectées. Le modèle s’oriente aussi bien vers la pratique que vers des modèles existants (FRBR) et de nou-velles règles de catalogage (RDA). Le travail sur BIBFRAME est encore en cours, raison pour laquelle seuls des projets-pilotes réalisés dans un cadre restreint sont judicieux pour l’instant. Cela étant, se pencher sur BIBFRAME et participer activement à la dis- cussion en cours concernant le modèle BIBFRAME est utile et nécessaire pour le développement des futures offres d’informations des bibliothèques.