Erkenntnisse aus dem Hackathon: Wir brauchen eine Open Data Policy

Ich meldete mich für den ersten Hackathon in der Schweizer Nationalbibliothek an, um zu sehen, was bei einer solchen Veranstaltung genau passiert, welchen Beitrag ich eventuell leisten könnte – und was diese Veranstaltungsform für Bibliotheken bedeuten kann. Überraschenderweise habe ich dann schnell ein Projekt gefunden, an dem ich mich beteiligen konnte. Es ging um die Aufbereitung historischer Karten. Eine Beschreibung des Projekts haben wir im Wiki publiziert: http://make.opendata.ch/wiki/project:oldmaps. Hier geht es aber nicht um die Inhalte dieses Projekts, sondern um die grundsätzlichen Fragen, die sich mir in Bezug auf die Rolle von Bibliotheken (eventuell allen GLAM-Institutionen, also auch von Archiven, Museen und Galerien) stellen, wenn es um Open Data geht. Wir wollten also digitalisierte historische Karten finden, die als open data bereitgestellt werden sowie die dazu gehörigen Metadaten finden und nutzen. Da ich schon gewisse Erfahrungen mit Karten und Kartensammlungen habe, machte ich mich bei der Suche nach Kartenbeständen nützlich. Dabei sind wir auf verschiedene Hindernisse gestossen:

Technische Aspekte:

  • Die Karten werden in der Regel integriert in eine Plattform angeboten. Sehr schöne Beispiele findet man in e-rara.ch und in e-manuscripta.ch oder in verschiedenen GIS-Plattformen von Kantonen. Hier kann man zwar in hochauflösende Karten zoomen, doch ist die Datei in der Regel nicht direkt zugänglich – und dies wäre für die Nutzung in einer anderen Anwendung notwendig.
  • Auch der automatisierte Zugriff auf Metadaten ist für die Nachnutzung in anderen Plattformen von zentraler Bedeutung. Die Schnittstellen zu den Publikationsplattformen der Bibliotheken oder zu den Bibliothekskatalogen sind aber meistens nicht offen. Für den Hackathon hat die ETH-Bibliothek eine temporär geöffnete Schnittstelle zur Verfügung gestellt, die aber für die Nutzung der Karten-Metadaten nicht ausreichte.

Im Rahmen des Hackathons ist es schon gelungen, an diese Daten zu gelangen, doch war es dafür nötig, Hintertüren zu nutzen, die für eine seriöse Nutzung nicht in Frage kommen.

Rechtliche Aspekte:

  • Erst wenige Dokumente sind explizit unter einer CC-0 Lizenz oder als Public Domain veröffentlicht, wie die Ryhiner-Sammlung der UB Bern (Nutzungsbedingungen). Hier ist eigentlich alles klar, die Nachnutzung möglich – um ein Belegexemplar wird gebeten.
  • Die Plattformen e-rara.ch und e-manuscripta beinhalten einschränkende Nutzungsbedingungen, die von der Open Data Community kritisiert werden. Kommerzielle Nutzung wird hier ausgeschlossen, die Nutzung für Studium und Forschung ist erlaubt. Aber es heisst in den Nutzungsbedingungen: „Die systematische Speicherung auf anderen Servern ist nur mit vorheriger schriftlicher Genehmigung der Gesamtkoordination e-rara.ch möglich.“ Gleichzeitig wird auf derselben Seite anerkannt, dass es sich in der Regel um gemeinfreie Werke handle.
  • Hier stellen sich dem seriösen Nutzer, z.B. einer Forscherin oder einem Forscher, die /der die Verbreitung des Kartendrucks untersuchen möchte, Fragen: ist die Nutzung nicht-kommerziell, auch wenn sie eine Publikation in einer kostenpflichtigen Zeitschrift bezweckt? Ist Data oder Text Mining eine Nutzungsform, und wann gilt diese als kommerziell? Diese Fragen gelten auch dann, wenn die Objekte unter einer Creative Commons Lizenz ohne kommerzielle Nutzung (CC-NC) veröffentlicht werden. Die Definition von kommerzieller Nutzung lässt hier unterschiedliche Interpretationen zu. Klar gesagt wird nur, dass unter kommerzieller Nutzung zu verstehen ist, dass der primäre Zweck der Nutzung im kommerziellen Vorteil oder monetärer Kompensation liegt („primarily intended for or directed toward commercial advantage or monetary compensation“, zitiert nach dem CC-Wiki).
  • Gilt eine allfällige Einschränkung auch für Thumbnails oder nur für grössere Repräsentationen des Werks?
  • Und schliesslich ist auch die Nutzung der Metadaten unsicher: grundsätzlich dürften Metadaten nicht unter das Urheberrecht fallen, da sie keine Schöpfung darstellen.
  • Das Eidgenössische (also Schweizerische) Institut für Geistiges Eigentum hat auf seiner Homepage im Rahmen der FAQs die Frage beantwortet, inwiefern Metadaten durch das schweizerische Urheberrecht geschützt seien:

Metadaten sind durch das Urheberrecht nicht per se geschützt. Sind sie aber an einem Ton-, Tonbild- oder Datenträger angebracht, oder erscheinen sie bei der Wiedergabe, dann dürfte es sich um urheberrechtlich geschützte Informationen für die Wahrnehmung von Rechten (Rights Management Information, RMI) handeln.

  • Die Diskussion um die Freigabe von Bibliotheksmetadaten wurde in Deutschland bereits 2009 geführt (Blogbeitrag Uebertext). Bibliotheken des hbz haben 2010 eine Open Data Policy veröffentlicht, die mittlerweile für den gesamten Verbund gilt. 2011 hat die DINI-AG KIM (Kompetenzzentrum Interoperable Metadaten) eine Empfehlung zur Öffnung bibliothekarischer Daten publiziert. (Ohne Anspruch auf Vollständigkeit: ich gehe davon aus, dass es noch weitere Beispiele gibt, die ich aber nicht weiter recherchiert habe).
  • In der Schweiz hat die Nationalbibliothek eine Open Data-Strategie veröffentlicht, in der die Metadaten des Katalogs unter der Lizenz CC-0 publiziert werden.

Handlungsempfehlungen

Die hier formulierten Handlungsempfehlungen sind als persönliche Lesson Learnt des Hackathons zu verstehen und dienen dazu, die Diskussion innerhalb der Schweizer Bibliothekscommunity zielgerichtet führen zu können. Damit die Nutzung von Metadaten und von digitalen Objeken aus Schweizer Bibliotheken (und Archiven) im Sinne von Linked Open Data oder in Forschungsprojekten zum Beispiel der Digital Humanities geklärt wird, sollten die Schweizer Bibliotheken eine gemeinsame Open Data Policy verabschieden (möglich z.B. im Rahmen der KUB, der Konferenz der Universitätsbibliotheken). Diese muss die Nutzung der Metadaten freigeben (CC-0) und eine Erklärung dazu enthalten, dass die Digitalisate von Objekten aus der Public Domain möglichst ebenfalls unter einer Creative Commons-Lizenz erfolgen sollte, entweder unter CC-0 oder CC-BY. Bei der Freigabe der Metadaten stehen die Bibliotheken vor dem Problem, dass die Urhebersachaft der Metadaten oft nicht klar ist. Teilweise wurden Fremddaten übernommen, zum Teil gar käuflich erworben oder sie stammen von anderen Bibliotheken. Öfter zitiert wird das Beispiel der 18th Century Collection online, bei der einige Bibliotheken die Metadaten dieses lizenzierten Produkts in ihre Kataloge eingespielt haben. Hier würden eventuell Lizenzbestimmungen verletzt. Ich wage zu vermuten, dass dies kein wirkliches Problem darstellt, wenn alle Bibliotheken gleichzeitig diese Policy verabschieden. Notfalls müssen diese Bestände von der Veröffentlichung ausgenommen werden. Dann müsste man aber wenigstens für die Zukunft sicherstellen, dass immer auch die freie Nachnutzung der Metadaten in die Lizenzverträge aufgenommen wird – oder solche Kollektionen nicht gekauft werden. Heikler scheint mir der Punkt mit den digitalen Dokumenten. Hier fragen sich die Bibliotheken berechtigterweise, was denn mit ihren „Schätzen“ geschieht, wenn diese frei genutzt, kopiert, aggregiert und anderswo wieder angeboten werden dürfen, wenn möglich sogar noch mit kommerziellem Zweck. Für Bibliotheken (und Archive) ist es wichtig die Nutzung ihrer Medien nachweisen zu können, in erster Linie gegenüber ihrer Trägerschaft. Solange die Medien auf eigenen Plattformen angeboten werden, kann ihre Nutzung analysiert werden. Allfällige rückläufige Nutzungszahlen vor Ort können dann durch den Nachweis steigender Zugriffe auf die Digitalisate begründet werden. Wenn die Digitalisate vollständig frei gegeben werden, wird das schwierig bis unmöglich. Ich sehe verschiedene Lösungsansätze, die noch nicht ausgereift sind, und die ich hiermit gerne zur Diskussion stelle:

  • Bibliotheken publizieren die Dokumente unter CC-BY, wodurch der Urheber und Besitzer des Originals genannt werden müssen. Auch ein Link auf das Dokument kann hier verlangt werden, wie in der Lizenz CC-BY ausgeführt wird:

If supplied, you must provide the name of the creator and attribution parties, a copyright notice, a license notice, a disclaimer notice, and a link to the material.

  • Oder man integriert (allenfalls zusätzlich) die Metadaten mit dem Besitzernachweis und allenfalls einer DOI in das Dokument selbst. Dann wären a) die Metadaten geschützt und b) die Nachverfolgung der Nutzung auf Websites relativ einfach möglich.
  • Eine Lösung könnte auch darin bestehen, dass die Nutzung auf anderen Plattformen und Websites sowie das Zitieren von Werken aus einem eigenen Bestand getrackt und analysiert werden. Ein entsprechendes Tool müsste wohl noch entwickelt werden.

Schliesslich sollten auch die technischen Voraussetzungen geschaffen werden, dass die frei gegebenen Dokumente auch auf einen offiziellen Weg bezogen und genutzt werden können. Ich denke hier an offene Schnittstellen und gehe davon aus, dass dies im Zusammenhang mit dem Projekt Linked.Swissbib.ch angegangen und gelöst wird. Voraussetzung ist jedoch auch hierfür die rechtliche Freigabe der Metadaten.

Autor: mrudolf

Professor for Library Science at HTW Chur (university of applied sciences), co-editor of Informationspraxis, co-principal investigator of the Horizon Report Library Edition, blogging on library topics - and also on mindful living (in German as Männerherz)

4 Kommentare zu „Erkenntnisse aus dem Hackathon: Wir brauchen eine Open Data Policy“

  1. „dass die Digitalisate von Objekten aus der Public Domain möglichst ebenfalls unter einer Creative Commons-Lizenz erfolgen sollte, entweder unter CC-0 oder CC-BY.“ – Werke, die eindeutig der Public Domain zuzuordnen sind, sollten mit dem „Public Domain Mark“ (http://creativecommons.org/publicdomain/mark/1.0/) gekennzeichnet werden. CC-0 eignet sich für Werke, bei denen allfällige Urheberrechte bei der lizenzierenden Institution liegen oder liegen würden, falls denn ein urheberrechtlicher Anspruch bestünde. OpenGLAM empfiehlt diese Lizenz der Klarheit halber bei der Publikation von Metadaten, da hier je nach Land die rechtliche Lage unterschiedlich ist (in der Schweiz sind Metadaten, die reine Fakten enthalten, urheberrechtlich nicht geschützt). Bei Werken, die noch urheberrechtlich geschützt sind, aber für die Weiternutzung freigegeben werden sollen, empfiehlt sich die CC-BY-Lizenz.

  2. Danke für den Beitrag, der einen guten Überblick der Problematik „Metadaten“ und „Digitalisate“ gibt. Zur Abrundung der rechtlichen Aspekte ein Blick in die Westschweiz, wo der zentrale Bibliotheksverbund RERO den Katalog im letzten Jahr unter der Lizenz CC0 zur Verfügung gestellt hat (s. http://data.rero.ch/). RERO geht das Problem der „données exclues“ und damit der unter einschränkenden Bedingungen in die Datenbanken eingespielten Metadaten systematisch an.

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s