Libronomies
Die Sacherschliessung ist ins Gerede gekommen. Ist die von Bibliothekaren erbrachte Dienstleistung der Katalogisierung, also das aufwendige und mühsame Erfassen von Metadaten im Informationszeitalter noch sinnvoll bzw. betriebswirtschaftlich vertretbar? Fragt man die Führungsebene, so scheint die Antwort schnell gefunden zu sein, sie lautet: «Nein, Sacherschliessung ist zu teuer und mittelfristig abzuschaffen, die Metadaten beschaffen wir uns anderswo!» Hört man sich in den Reihen der Sacherschliesser selbst um, verweist man empört auf die hohe und unverzichtbare Qualität der Sacherschliessung, deren Abschaffung den Kern der bibliothekarischen Arbeit zerstöre.
Es erscheint allerdings möglich, dass die Wurzel dieses Konflikts ein Schnittstellenproblem – in der doppelten Bedeutung des Worts – darstellt: So wird einerseits die Arbeit der Sacherschliesser in den Benutzerschnittstellen der Onlinekataloge falsch bzw. nicht benutzergerecht vermittelt: Der Zugriff auf den Schlagwortkatalog geschieht oft verdeckt, an dritter oder vierter Stelle in einem komplizierten Menu, zudem hinter teils kryptischen Bezeichnungen versteckt, die für den herkömmlichen Benutzer nicht verständlich sind.
Setzt man andererseits die Daten und Metadaten der Onlinekataloge im Kontext zum Web und dessen aktuellen Entwicklungen, erscheinen sie als autoritär verwaltete Informationsblöcke, die wenig Schnittstellen im Sinne von Angriffs- und Anknüpfungsflächen für Benutzer und andere Informationssysteme bieten, obwohl sich diese in Fülle anbieten: In puncto Benutzer reichen diese in das Web 2.0 hinein und lassen sich am besten mit dem Phänomen der Folksonomies zusammenführen, in puncto maschineller Informationssysteme berühren sie die Ontologien der Semantic-Web-Technologie des Web 3.0; in deren Mitte scheinen sich die Mashups zu befinden. Das Potenzial all dieser Verbindungen soll unter dem Begriff Libronomies veranschaulicht werden.
Folksonomies (ein Neologismus aus folks und taxonomy) sind eines der erstaunlichsten Phänomene des Web 2.0. Sie bezeichnen das spontane, kollaborative und dezentrale Klassifizieren von Information. Im Gegensatz zu hierarchischen Klassifikationssystemen besteht hier keine Einschränkung durch eine prädefinierte Terminologie, die das Produkt einer wohlüberlegten Reflektion und langwierigen Überprüfung ist. In Folksonomies vergibt der Benutzer zwar keine beliebigen Schlagwörter – die in diesem Zusammenhang in der Regel als Tags bezeichnet werden –, allerdings jene Tags, die ihm belieben. Jeder Tag bildet dabei seine eigene Klasse. Andererseits zeigt ein Blick in die Plattformen des Web 2.0 nicht nur deren Vielseitigkeit, sondern auch ihre Effizienz. Sie werden zur Klassifizierung von Bookmarks, zur Kennzeichnung von Blogeinträgen, beim Upload von Fotos, Videos und anderen Medien verwendet und stellen gleichzeitig die Grundlage für die Herstellung von sozialen Kontakten dar. Wie sieht aber nun die Auseinandersetzung zwischen Bibliothekskatalogen und Folksonomies aus? In einigen Fällen haben Bibliotheken ihre Kataloge schon freigeschaltet für die Benutzer und ihnen die Möglichkeit gegeben, die Medien entsprechend ihrer Vorstellung zu taggen. Dies ist ein gewaltiger Schritt, allerdings kann dessen Mächtigkeit bezweifelt werden. Der typische Web-2.0-Benutzer interessiert sich hauptsächlich für Eigenes, im gegebenen Kontext heisst dies selbstverfasste bzw. selbstbenutzte (gelesene, gehörte) Medien. Dafür stehen ihm im Web ausreichend Plattformen zur Verfügung. Dennoch ist es zu früh, um hier ein abschliessendes Urteil auszusprechen. Sowohl den Benutzern als auch den Bibliothekaren muss die Zeit gegeben werden, sich an dieser Schnittstelle aufeinander einzulassen. Ein nüchterner Blick zeigt, dass die Folksonomies und die Taxonomien der Sacherschliesser eine eher geringe Schnittmenge aufweisen und sich von daher eher für eine komplementäre Vereinigung eignen: hier die spontane und unkontrollierte Benennung, dort die reflektierte und kontrollierte Verschlagwortung.
Dieses Potenzial lenkt die Aufmerksamkeit auf das Phänomen der Mashups: In Mashups (von engl. Mash = dt. Brei) werden neue Inhalte durch Wiederverwendung und Rekombination existierender Inhalte erzeugt. Die Inhalte stammen dabei aus heterogenen Datenquellen. Mashups können in der Regel ohne die Kenntnis von Programmiersprachen erzeugt werden. Die besondere Bedeutung von Mashups liegt darin, dass die Zukunft des Webs in der neuen Verbindung bislang getrennter bzw. getrennt aufbewahrter Datensätze liegt. In einigen Fällen handelt es sich lediglich um die grafische Überlagerung von Datensätzen, etwa auf Kartenmaterial, die durch einfaches Klicken aktiviert werden. Etwas mehr Übung und Reflexion verlangt das Schaffen von Filtern oder neues «Verknüpfen» von Datenquellen (so wie es etwa von speziellen Mashup-Werkzeugen wie etwa Pipes pipes.yahoo.com ermöglicht wird).
Was bedeutet das für den OPAC? Dessen Datensätze sind zwar verlinkt, allerdings nur untereinander. Von daher scheint das Bild eines monolithischen Blocks oder eines Silos nicht unangebracht. Dies gilt aber auch für die Datenbestände des Web 2.0, sofern sie auf zentralen Servern einer Plattform gehostet werden. Der Austausch geschieht hier im Idealfall über gut definierte und offengelegte APIS (Application Programming Interface). Sollen die Kataloge Mashups zugänglich gemacht werden, müssen sie entweder geöffnet werden, um die Integration anderer Ressourcen zu ermöglichen, oder aber ihre Schnittstellen in Form gut definierter APIS offenlegen, um die anderweitige Integration der Daten und Metadaten zu erlauben.
Die Wertschöpfung der Sacherschliessungsarbeit zeigt sich hier gleichfalls als Schnittstellenproblem, sie wird aber eher zu einem technischen Problem. In jedem Fall beendet sie – wie im Fall der Folksonomies – die Vorstellung eines statischen, fest defi- nierten Katalogeintrags: «Gemashte» Katalogeinträge sind dynamisch und haben eher den Charakter eines Puzzles: Sie können anderweitig bereitgestelltes (Meta-)Datenmaterial enthalten (etwa Buchcover und Klappentext) und sind gleichzeitig aufbrechbar, um an anderer Stelle in einem neuen Kontext verwendet werden zu können.
Mashups können von daher dazu dienen, gehortete Datensätze aufzubrechen, um bspw. Folksonomies und Schlagwortketten in einem neuen Aggregat miteinander zu verbinden. Idealerweise geschieht dies über einen Identifikator, der in allen Datensätzen vorkommt, bei Büchern ist dies in der Regel die ISBN, bei Zeitschriften die ISSN, die eine persistente Identifikation erlaubt. Diese sind als kleinster gemeinsamer und alles verbindender Nenner des Mashup zu sehen. Die Notwendigkeit dieses Nenners macht gleichzeitig den Wunsch nach einer Ausweitung dieses Prinzips deutlich: Mashups werden umso mächtiger, je genauer und einheitlicher auf die einzelnen Fragmente referiert werden kann.
Ein einheitlicher bzw. standardisierter Zugriff kann in der Regel durch eine Ontologie bewerkstelligt werden, wobei zunächst der aufgrund seiner Komplexität weit dehnbare und in seiner langen Geschichte zahlreichen Wandlungen unterworfene Begriff der Ontologie zum Problem wird: Ontologien sind im heutigen Kontext logisch einwandfrei definierte, maschinell interpretierbare Beschreibungen von Bedeutungszusammenhängen des Sprach- und Weltwissens. Zu vermerken ist auch, dass der Begriff seit der Dominanz des Webs auf das gesonderte Interesse der Informatiker stösst, was zu einem grossen Teil mit der Semantic-Web-Initiative zusammenhängt, die – unter der Ägide des Webbegründers Tim Berners-Lee - den Versuch unternimmt, dem Web eine mehrschichtige ontologische Struktur überzuordnen, die dessen maschinelle Verarbeitung ermöglichen soll.
Ob dem Projekt «Semantic Web» ein so umfassender und gewaltiger Erfolg wie dessen unteren Schichten (URI und Unicode bzw. XML) beschieden ist, erscheint aufgrund des hohen Anspruchs, der Komplexität der Materie und der daraus resultierenden eher zögerlichen Umsetzung mehr als fraglich. Es ist eher davon auszugehen, dass in den kommenden Jahren der ersten semantischen Ebene der RDF-Daten (Ressource Description Framework) vermehrtes Interesse entgegengebracht wird. Dies umso mehr, da sich die nach der einfachen Relation von Subjekt, Objekt und Eigenschaft aufgebauten RDF-Tripel für einen vereinheitlichten Datenaustausch der in den «Silos» des Web verborgenen Daten anbieten.
Das Semantic Web benötigt jedoch neben einem technischen Gerüst, wie beschrieben, Inhalte zur Beschreibung der semantischen Zusammenhänge, da es ohne konkrete Metadaten nichts mehr als ein Gerüst ohne umschliessendes Gebäude ist. Von daher sei die Frage angebracht, welche Berührungspunkte sich zwischen der Welt der Sacherschliessung und dem semantischen Web ergeben: Hier fallen nicht nur Parallelen zur Dublin-Core-Initiative ins Auge; von weitaus grösserem Interesse wird die Integration des Wissens, das die Grundlage der Sacherschliessung ist, sein: man denke etwa an RSWK und SWD.
Auch in diesem Sinn können die Taxo- nomien der Bibliothekare, die Libronomies, sinnvoll sein, von daher ist auch die Frage, ob die Sacherschliessung obsolet sei, selbst obsolet oder so nicht zu stellen. Die Art und Weise ihres Fortbestehens wird aber in nicht unerheblichem Mass von der beiderseitigen Öffnung in Richtung Benutzer und der Schaffung neuartiger Web-Services abhängen.
Bemerkung: Der Verfasser hat zur gleichen Thematik einen Vortrag an der Fachtagung «Lernende Bibliothek» (6.–9. September 2009) in Chur gehalten. Der Vortrag ist im Tagungsband publiziert.
Résumé
- Français
L’indexation des documents est devenue l’objet de débats. Les services rendus par les bibliothécaires, soit la saisie longue et fastidieuse de métadonnées, sont-ils encore raisonnables, respectivement économiquement défendables, à l’ère de l’information? Si on pose la question aux nouvelles directions, la réponse est vite trouvée, et c’est: «Non, l’indexation est trop chère, et il faudra la supprimer à moyen terme, nous nous procurerons les métadonnées autrement.» Quant aux bibliothécaires eux-mêmes, ils estiment qu’y renoncer reviendrait à supprimer le cœur même de leur travail. L’auteur suggère d’emblée que la racine de ce conflit peut être un problème d’interface – dans le double sens du terme: d’une part, le travail d’indexation est communiqué faussement, ou tout au moins n’est pas communiqué comme il le faudrait par rapport aux besoins des utilisateurs; l’accès au catalogue des mots clés est caché, en troisième ou quatrième place d’un menu très compliqué; qui plus est, il est dissimulé derrière des descriptions hermétiques, qui ne sont pas compréhensibles pour l’utilisateur moyen.
Or, selon l’auteur, le web sémantique a besoin, à côté d’un système technique, de contenus qui décrivent les relations sémantiques, car sans métadonnées concrètes, on ne dispose que d’un échafaudage sans construction au milieu. Il est donc pertinent de poser la question des points d’interface entre le monde de l’indexation et le web sémantique: à cet égard, ce ne sont pas seulement les parallèles avec l’initiative centrale de Dublin qui sautent aux yeux; l’intégration du savoir, qui est la base de l’indexation, est bien plus intéressante.
Dans ce sens également, les taxonomies des bibliothécaires, les libronomies, peuvent être utiles, ce qui rend elle-même obsolète la question de savoir si l’indexation est obsolète, ou tout au moins exige qu’on la pose différemment. La façon dont on va progresser dans ce domaine dépend de façon substantielle de l’ouverture en direction des utilisateurs et de la création d’un système de services web novateurs.