Die 7. Vorlesung widmete sich nochmals dem Thema Metadaten. Dabei ging es heute um die Datenquelle Tabellen-Daten. Ziel war es heute diese Daten in MARC21 zu überführen mit Hilfe der Software OpenRefine. Diese Software war mir bisher nicht bekannt, aber ich fand das Thema noch interessant, da ich beruflich, während meiner früheren Arbeit in Museen auch häufiger mit Exceltabellen zu tun hatte. Diese enthielten bspw. Bilddaten zu Kunstwerken. Auch wenn Exceltabellen in der täglichen Arbeit praktisch sind, können sie doch auch problematisch sein.

OpenRefine ist auch eine Open Source Software und die Installation ging sehr schnell und mit der Vorführung bzw. Anleitung problemlos. Mein erster Eindruck der Software ist, dass hier das Design keine Rolle zu spielen scheint, so wirkt es altbacken. Aber gleichzeitig ist es auch reduziert und minimalistisch und dies hilft mir mich schnell zurecht zu finden. Allerdings hatte ich das Browserfenster neben dem Terminal geöffnet und OpenRefine scheint nicht responsive zu sein. Der Bildschirm hat sich also nicht der Screengrösse angepasst und ich konnte zunächst die Buttons nicht sehen. Ich musste etwas mit der Grösse ausprobieren, bis ich einen guten Überblick hatte. Nachdem ich dann aber die Beispieldaten eingefügt hatte und die Vorschau erhielt, musste ich das Fenster doch in voller Grösse öffnen, da ich sonst nicht alles sehen konnte und es schwierig wurde hier einen Überblick zu bekommen. An dieser Stelle fühlte ich mich von dem Inhalt erschlagen und hätte ohne Anleitung hier nicht weitergewusst. So war es mir nicht gleich klar, dass es sich hierbei um eine Vorschau handelt.

Nachdem das Projekt mit den Übungsdaten dann erstellt waren, sah es wieder übersichtlicher aus. Ein Grund war hier sicher, dass es im Aufbau und in der Funktion eine Mischung aus Suchmaschine und Excel war. Der Unterschied zu Excel ist, dass man nicht alle Daten auf einem Screen sieht, sondern 10 Datensätze bzw. Zeilen sieht und dann von Seite zu Seite springt. Aber man kann ähnlich wie bei anderen Webseiten im Internet die Ergebnislänge einer Seite anpassen. So kann man sich bspw. auch 20 oder 50 Zeilen anzeigen lassen. Interessant ist die Funktion der Facetten. Zunächst war mir nicht klar was Facetten hier bedeuten, aber bei der Anwendung wurde es deutlich, dass diese wie Filter funktionieren. Mit Hilfe der Facette Sprache kann man sich so alle Werte dieser Spalte anzeigen lassen. Diese Werte kann man dann auch bearbeiten. Das ist vor allem nützlich, wenn man Daten bereinigen möchte und bspw. Sprachangaben standardisieren möchte, um Konsistenz zu erreichen.

In einer Übung während der Vorlesung ging es nun darum die Daten in MARCXML umzuwandeln. Mit der Anleitung war die Übung gut nachvollziehbar. Die Funktionen, die wir eingaben, wirkten zunächst recht komplex. So war mir „escape“ nicht ganz klar, aber mit der Erklärung und dem &-Zeichen habe ich es verstanden. Obwohl ich mir von Namen her schon vorstellen konnte, was die Funktionen bewirken, war es doch recht komplex. So habe ich bei „slice“ zwar verstande, dass nur ein Teil angezeigt wird, allerdings war die Funktion sehr lang und verschachtelt. Deshalb hätte ich es ohne die Erklärung im Nachhinein nicht verstanden. Diese musste ich mir allerdings in der Aufnahme nochmals in Ruhe anschauen. Das hat mir geholfen es besser zu verstehen. Was mir nun wirklich geholfen hat ist das Beispiel mit dem Subjectfield. Hier wurde zunächst gezeigt, wie man sich das row template herleitet, dass man sich quasi erst einmal in die XML Spezifikation informieren muss um so nachvollziehen zu können in welches Feld die jeweiligen Angaben kommen müssen. Im Nachhinein bin ich in der Vorlesung zwar gut mitgekommen, musste mich aber anschliessend nochmals mit dem Thema auseinandersetzen um wie beschrieben, die Funktion besser zu verstehen.