Kommentare Abstract
2013/4 Linked Open Data und Big Data

«Daten öffnen, weltweit kooperieren» Grosse Fragen, noch keine abschliessenden Antworten

Kommentare Abstract

Die neuen Möglichkeiten der nahezu unbegrenzten Verlinkung von Daten, die Aggregation und Analyse riesiger Datenmengen – diskutiert unter den Überbegriffen Big Data, Linked Data und Linked Open Data (LOD) – bieten Bibliotheken völlig neue Chancen, ihre Bestände und besonderen Angebote international sichtbar zu machen. Die neue Technik des Cloud Computings, also der Bereitstellung und Nutzung von Software, Rechen- und Speicherkapazitäten als Onlinedienstleistung, ermöglicht es zudem, Routinearbeiten im eigenen Haus zu reduzieren und sie stattdessen durch Automatisierung, Vernetzung und Abgleich von z.B. Katalogen und Metadaten auf viele Schultern in der Bibliothekswelt zu verteilen. Auch die Informationsauslieferung auf mobile Computer und Smartphones lässt sich über Cloud Services relativ problemlos organisieren.

Soll man seine Daten wirklich für die ganze Welt öffnen? Wie sichert man in einer völlig offenen Welt die nationalen Interessen, wie die des eigenen Hau­ses? Wer sorgt für eine vernünftige, nachhaltige Ordnung in der Datenabla­ge, der Datenverknüpfung und der In­formationspräsentation? Wie kann man es als Bibliothek schaffen, mit dem atemberaubenden Forschungsfort­schritt mitzuhalten? Viele grosse Fra­gen, auf die es heute noch keine ab­schliessenden Antworten gibt.

Globale Clouds: Problemlösung oder Herstellerabhängigkeit? 

Als eine der ersten Bibliotheken in Eu­ropa hat die Universität Tilburg Ser­vices der cloudbasierten Softwareinfra­struktur WorldShareTM Management Services (WMS) von OCLC in Betrieb genommen: «Wir betreiben, historischgewachsen, seit Jahren mehrere Biblio­theksinformationssysteme (LIS) paral­lel. Mit der Cloud ist jetzt die Techno­logie da, hier etwas zu ändern», so ein Mitarbeiter.

Durch die Nutzung einer Cloud­ Plattform bindet man sich technisch eng an einen Anbieter. Entsprechende Befürchtungen (in Fachkreisen unter dem Begriff «Vendor Lock­In») disku­tiert, begleiten die neue Technologie. Anja Smit, Direktorin der niederlän­dischen Universitätsbibliothek Utrecht und amtierende Vorsitzende des OCLC EMEA Regional Council hielt den Be­denken in Strassburg das Verbundargument entgegen: «Alle Macht geht von den Mitgliedern aus».

Die Schweizerische Nationalbibliothek hat eine Strategie 

Die Direktorin der Schweizerischen Nationalbibliothek (NB), Marie-­Chris­tine Doffey1, hat mit ihrem Team für ihr Haus eine klare Entscheidung getrof­fen. In ihrem KonferenzvortragAufzeichnungen der Konferenzbeiträge sind, soweit sie von den Referenten freigegeben wurde, auf der Website von OCLC bereitgestellt. http://www.oclc.org/en-europe/events/2013/emear-annual-meeting-feb-26.html. Von einigen Präsentationen gibt es zudem Videoaufzeichnungen auf YouTube, u.a. vom Vortrag von M.-C. Doffey https://www.youtube.com/watch?v=aONFHqMbdig http://www.oclc.org/en-europe/events/2013/emearc-annual-meeting-feb-26.html.brach­te sie diese auf den Punkt: «Daten öff­nen, weltweit kooperieren». Das bedeu­tet, die NB kooperiert nicht nur mit den Schweizer Bibliotheken wie zum Bei­ spiel im Rahmen des Metakatalogs Swissbib und «den anderen etwa 900 Bibliotheksdiensten, die im Metakata­log sind», sondern auch mit der Euro­peana, mit dem WorldCat «und allen anderen Möglichkeiten», so Doffey. Sie begründete die Entscheidung vor allem mit der Überzeugung, dass alle Metadaten und Informationsbestände der Schweizerischen Nationalbibliothek mit öffentlichen Geldern aufgebaut sind und deshalb auch der Öffentlich­keit zur Verfügung stehen müssten; sei es vor Ort in der Bibliothek oder vir­tuell. «Durch die Öffnung können an­dere Bibliotheken und Interessenten die Metadaten für eigene Zwecke und Innovationen nachnutzen.»

Die NB hat für die Europeana den Schweizer Bibliothekskatalog Helveti­cat vollumfänglich geöffnet. Alle Me­tadaten sind unter der Corporate-­Comm­ons-­Lizenz CC­O für alle Interessenten verfügbar und können angebunden werden. Doffey erklärte: «Wir müssen dort sein, wo andere Partner, andere Bibliotheken auch dabei sind, damit wir an der Diskussion teilnehmen kön­nen. Die Schweiz ist so klein, dass wir diese Öffnung auch weltweit nutzen wollen und können.» Genevieve Clavel­ Merrin, bei der NB verantwortlich für den Bereich «Nationale und Internati­onale Kooperation» ergänzte, durch den Big-­Data­-Austausch auf Basis verlinkter Metadaten würde ein Bestands­ abgleich mit grossen anderen Metadatensammlungen möglich. Zur Veran­staltung sagte Direktorin Doffey, dass auch «die ganze Diskussion über die Cloud» sehr wertvoll sei. «Als einzelne Institution haben wir zwar nicht die gleichen Probleme wie Konsortien, aber ich denke, es ist auch einmal ganz interessant, Leute zu hören wie Ray­mond Bérard, zu erfahren, was es da für Probleme gibt und welche Fragen gestellt werden.» Bérard, Direktor des französischen staatlichen bibliogra­fischen Instituts ABES berichtete u.a., dass ABES für die französischen aka­demischen Bibliotheken eine Studie zur Ablösung der bisherigen LIS durch ein neues, geteiltes «shared LIS» durchgeführt hat. Auf Basis der ge­wonnenen Erkenntnisse hat ABES sein Bibliothekssystem neu ausge­schrieben. 

Frankreich setzt stark auf Wikipedia für Bibliotheken 

Wie Wikipedia in Bibliotheken einge­bunden und von ihnen genutzt werden kann, ist in Bezug auf Big Data und Linked Data ebenfalls ein grosses The­ma. Die Wissenschaftlerin Titia van der Werf, die vom niederländischen Leiden aus für OCLC die F&E­-Aktivitäten mit europäischen Bibliotheken koordiniert, griff die Diskussion mit Rémi Mathis als geladenem Gast und Max Klein von OCLC ResearchOCLC-Research betreibt eine eigene Website, auf der sehr interessante Forschungsprojekte und -ergebnisse stehen www.oclc.org/research.html.in einem Workshop auf. Mathis ist Bibliothekskurator und Präsident der Wikimedia France. Er be­richtete, dass das französische Kultur­ und Kommunikationsministerium mit Wikimedia France kooperiert, um die französischsprachigen Ressourcen in Wikipedia semantisch zu erschliessen. Klein beschäftigt sich als «Wikipedian in Residence» bei OCLC Research mit allen Fragen rund um die Weiter­entwicklung von Wikipedia als Quelle für verlinkbare Daten und Informatio­nen. Er versuchte, in 45 Minuten die Idee der freien, von Maschinen und Menschen gleichermassen lesbaren Datenbank Wikidata zu erklären – und wie die Forscher dieser Datenbank Multilingualität beibringen wollen.

Culturomics: Kulturgeschichte aus Digitalisaten herausrechnen 

Auf diesem hohen Niveau internationa­ler Forschung ging es nahtlos weiter. Jean­Baptiste Michel erforscht in Har­vard «die Nutzung von Millionen digi­talisierter Bücher und Dokumenten, um durch quantitative Analysen daraus z.B. Rückschlüsse zur Geschichte und Kultur zu ziehen». «Culturomics»2ha­ben er und sein Kollege Erez Lieberman Aiden dieses neue, auf Digitalisaten aufsetzende Forschungsgebiet getauft. Ihre Arbeiten führten zu einer Soft­ware, die aus grossen Datenbeständen in den Datenverborgene Trends be­rechnet und grafisch als Kurven in Dia­grammen sichtbar macht. Die For­schung brachte ihnen im letzten Jahr Titelseiten auf «Nature and Science» und auf der «New York Times». Google hat das Programm gekauft.

In Deutschland entsteht ein «Culturegraph» 

Die Deutsche Nationalbibliothek (DNB) baut an einer Plattform, über die Dienste und Projekte zu Datenvernetzung, Per­sistent Identifier und Linked Open Data für kulturelle Entitäten zusam­mengeführt werden sollen. Markus Geipel, Softwareingenieur bei der DNB, stellte die «Culturegraph» getaufte Plattform vor. Sie soll zu einem globalen Kulturschatz­-Netzwerk weit über die Grenzen einzelner Unternehmen und Einrichtungen hinaus werden. 

Neue Informationsdienste mit offenen Daten 

Wie auf Basis offener Daten mit neuen IKT entwickelte Dienste aussehen können, zeigten nach Jean-­Baptiste Michel zwei weitere Referenten auf sehr beeindruckende Weise: Silver Oli­ver, Informationsarchitekt mit Spe­zialgebiet strategische Ausrichtung der Datennutzung für Onlinepubli­shing bei der britischen Unterneh­mensberatung Ontoba3, und Dr. Klaus Ceynowa, stellvertretender Direktor der Bayerischen Staatsbibliothek (BSB). Oliver referierte über das «Zeit­ alter des Hinweisens auf Dinge, die in Beziehung zum persönlichen Interes­se stehen» («The age of pointing at things»). Gemeint ist das automa­tische Anbieten von weiterführenden Informationen direkt in den Informa­tionsraum hinein, in dem sich der Nutzer gerade bewegt.

Dr. Klaus Ceynowa zeigte innovati­ve Nutzungsszenarien für digitalisierte Inhalte aus Bibliotheksbeständen, die von der BSB mithilfe von Technologien wie GPS­-gestützte Lokalisierung (Loca­tion based Services), durch virtuelle Darstellung angereicherte Informa­tionsbereitstellung (Augmented Real­ity) sowie gestengesteuerte Präsentation und Informationssuche (Gesture based Computing and Search) entwickelt wurden.

OCLC Research informiert umfassend über Datennutzung 

Nicht nur die eingeladenen Redner, auch OCLC Research hatte Spannendes aus den Forschungslaboren zu berich­ten. Roy Tennant, Senior Programm Officer, führte in die «Entfesselung des Katalogisierens»4durch Datamining in LOD ein. Die über 290 Millionen WorldCat­Einträge, die auf rund 1,95 Milliarden Holdings hinweisen, liefern den Rohstoff für schier unendliche Nutzungsmöglichkeiten. Van der Werf zeigte in ihrem Vortragsthema «Meta­daten ausser Kontrolle: Metadatenag­gregation auf Netzwerkebene», welche Aufgabe gute Metadaten erfüllen und wo die Grenzen der Technik liegen.

W3C Group für LOD-Erweiterung von Schema.org eingerichtet 

Last, but not least sprach OCLC Tech­nology Evangelist Richard Wallis im letzten Vortrag über «Linked Data und OCLC»5. Dabei berichtete er unter an­ derem, dass das World Wide Web Con­sortium (W3C) an der Weiterentwick­lung des Metadatenbeschreibungsstan­dards Schema.org in Richtung LOD­ Nutzung arbeitet. Dazu wurde eine «Schema Bib Extend Community Group»6eingerichtet. Wallis leitet sie als Vorsitzender.

OCLC hat sein 4. EMEA Regional Council Meeting 2013 unter das Thema «Dynamic Data: a World of possibilities» gestellt.

Avatar

Vera Münch

Vera Münch (55), Hildesheim (D) begleitet als freie Journalistin und PR-Beraterin für wis-senschaftliche Einrichtungen die Entwicklungen in der Fachinformation und im Bibliothekswesen. Sie berichtet für die deutsche Bibliotheksfachzeitschrift b.i.t.online über Konferenzen, Messen und Trends.

Abstract

Les nouvelles possibilités que présentent la mise en réseau pratiquement illimitée des données, l’agrégation et l’analyse d’énormes quantités de données (Big Data, Linked Data et Linked Open Data) offrent aux bibliothèques de nouvelles chances de valoriser leurs fonds à l’échelle internationale et de proposer des offres spécifiques. La nouvelle technique du Cloud Computing, autrement dit la mise à disposition et l’utilisation de logiciels, de capacités de calcul et de stockage comme prestation en ligne, permet en outre de réduire les travaux de routine et de répartir ces derniers via l’automatisation et la mise en réseau de catalogues et de métadonnées. La fourniture d’informations sur des ordinateurs portables et des téléphones intelligents peut également être organisée sans trop de problèmes via les Cloud-Services.