Thema der 6. Vorlesung sind Metadaten. Doch bevor damit begonnen wurde, ging es um den Unterschied zwischen OPAC und Discovery-System. Dies bezog sich auf einen Eintrag im Lerntagebuch und auch mir war der Unterschied nicht ganz klar. Discovery-Systeme sind demzufolge eine neuere Generation von Bibliothekskatalogen. Der Unterschied besteht darin, dass diese sich im Design an grossen Webseiten orientieren, was durchaus Sinn macht. Denn User im Internet sind an Webseiten und typischen Funktionsweisen gewöhnt. D.h. sie erwarten, dass Webseiten ähnlich funktionieren wie andere. Orientiert sich nun ein Bibliothekskatalog an Webseiten wie Google und Amazon, fällt dem User die Benutzung leichter und dies führt zu einer besseren User Experience. In meiner Zeit als Bibliotheksfachangestellte bin ich auf einige Bibliothekskataloge gestossen, welche in ihre Funktion nicht intuitiv bedienbar waren und auch in ihrem Design wenig ansprechend. Aus diesem Grund finde ich es durchaus gut, wenn hier auch das Design mehr in den Vordergrund rückt.

Nach diesem Thema ging es dann aber um Metadaten und Schnittstellen. Zunächst betrachteten wir nochmals das das Schaubild von Beginn der Vorlesung. Mittlerweile war mir dieses verständlicher, da die Inhalte der Vorlesungen sich daran orientierten. Somit war es ein roter Faden durch die Vorlesungen. Das Schaubild zeigt, dass jede Software über einen OAI-PMH Schnittstelle verfügt, um so die jeweiligen Daten aus den verschiedenen Datenbanken im jeweiligen Format herunterzuladen.

OAI-PMH ist ein Austauschprotokoll für Metadaten, es dient somit der Übertragung von Daten. Dieses ist sehr weit verbreitet und dient für einen Gesamtdatenabzug, während die Protokolle Z39.50 und SRU eher für eine Livesuche sind. Als Beispiel für die Verwendung von SRU und Z39.50 wurde der KVK gezeigt. In diesem habe ich früher häufig recherchiert und konnte nun verstehen, wie dieser Metakatalog Austauschprotokolle nutzt. Der Katalog greift auf mehrere Kataloge und auch Buchhandelsverzeichnisse zu. Bei einer Suche hat der KVK keine Kopie aller Trefferdaten, sondern lädt nur einen Teil und lädt den Rest nach. Dabei gibt es nicht eine Trefferliste mit Ergebnissen aus allen Katalogen, sondern pro Katalog eine Trefferlisteso kann es vorkommen das Titel auch mehrfach in der Ergebnisübersicht auftauchen. Möchte man eine einheitliche Trefferliste über alle Ergebnisse hinweg haben, ist es notwendig eine Kopie aller Daten zu haben und diese in den eigenen Suchindex zu speichern. Hierfür wird OAI-PMH genutzt.

Für das weitere Vorgehen war es notwendig das Tool VuFindHarvest zu installieren, dieses ist notwendig, um Daten von den Schnittstellen von ArchivesSpace und Koha herunterzuladen. Dieses Tool ist nur über das Terminal bedienbar, verfügt also nicht über eine grafische Oberfläche. Mit der Anleitung hat die Aufgabe zum Harvesting aber gut funktioniert.

Nachdem die Daten heruntergeladen waren und in verschiedenen Formaten vorlagen, war es nun das Ziel diese in ein einheitliches Format zu überführen. Dabei lagen die Daten von Koha bereits im Zielformat vor, aber die Daten aus ArchivesSpace, sowie Daten aus DSpace mussten konvertiert werden. Hierfür nutzten wir die Software marcEdit (XSLT). Das Umwandeln von einem Datenformat in ein anderes wird als Crosswalks bezeichnet und auch dies war Teil des Schaubildes. In Laufe der Vorlesung sind wir also das Schaubild praktisch einmal von links nach rechts durchlaufen. So wandelten wir nun auch mit Hilfe der Software die Daten in MARC21-XML um. So kann man Daten aus verschiedenen Quellen in ein System zusammenführen, wie im obigen Beispiel mit dem KVK wäre es so möglich nur eine Trefferliste aufzuzeigen. Die Herausforderung dabei ist aber, wie beispw. Daten aus dem weniger umfangreichen Standard Dublin Core in MARC21 überführt werden sollen, da dieses viel mehr Felder zur Verfügung stellt. MARC21 ist sehr viel granularer als Dublin Core. Hierfür braucht es Regeln. In marcEdit sind diese hinterlegt, allerdings wurde bei der Übung deutlich, dass es zu unterschiedlichen Ergebnissen kommen kann und nicht ganz verlustfrei ist, je nachdem was das Ausgangsformat war. So hat mich das Ergebnis von OAIDC (DSpace) mehr überzeugt als das von ArchivesSpace, da bereits auf den ersten Blick die Daten besser strukturiert aussahen. Mit dieser Vorlesung konnte ich nun das Schaubild besser nachvollziehen.