Normdaten für private Sammlungen (und kleine Kultureinrichtungen)

Seit Anfang des Jahres habe ich Wikidata für verschiedene Funktionen meiner Blogs hinzugefügt…

Zugegeben, bisher sieht man davon nicht viel, da es sich nur um Verlinkungen (an einigen wenigen Stellen in Verbindung mit Wikipedia-Artikeln in unterschiedlichen Sprachen) handelt. Aber ich hoffe, dass es nur eine Frage der Zeit ist, bis die Anwendungen hier offensichtlicher werden…

Wikidata als Normdatenquelle für private Sammler (und kleinere Kultureinrichtungen)

Wikidata, die zentrale Wissensdatenbank der Wikimedia Foundation, hat sich in den letzten Jahren zu einem unverzichtbaren Werkzeug für große Gedächtnisinstitutionen entwickelt. Doch gerade für engagierte private Sammler*innen und kleinere Kultureinrichtungen, wie lokale historische Vereine, private Museen oder Archive bietet die Nutzung von Wikidata als Normdatenquelle Vorteile.

Was sind Normdaten und was sind die Vorteile?

Normdaten stellen sicher, dass alle Informationen über eine Person, einen Ort, einer Körperschaft, ein Werk, ein Thema, oder allgemeiner, einer Entität, konsistent und eindeutig sind. Sie lösen zwei Probleme gleichzeitig: Unterschiedliche Schreibweisen, Namensvarianten, mehrere unterschiedliche Entitäten mit gleichem Namen auf der einen Seite. Die maschinelle Weiterverarbeitung und Verknüpfung auf der anderen. Als Beispiel bietet sich “Fritz Neumann” aus dem “Ric - An unknown Artist” Blog an: Auf der Suche nach der Identität war klar, dass es sich um einen Fritz Neumann handelt, nur nicht um welchen.

Die Vorteile von Wikidata für Sammler*innen und kleinere Institutionen

Infrastruktur und Pflegeaufwand

Die größte Hürde sind in der Regel die personelle Ausstattung bzw. das Budget. Dazu kommen institutionelle Beschränkungen, nicht jeder kann einfach zu den großen Normdatenvokabularen beitragen.

  • Keine zusätzlichen Kosten: Wikidata ist ein kostenloses, offenes Projekt. Es fallen keine Lizenz- oder Hosting-Gebühren an.
  • Keine institutionellen Barrieren: Jeder kann beitragen, unabhängeung von einer institutionellen Anbindung.
  • Gemeinschaftliche Pflege: Die Daten werden von einer globalen Gemeinschaft (und teilweise auch großen Partnern wie z.B. der Deutschen Nationalbibliothek oder dem Getty Research Institute) gepflegt. Sammler oder kleine Einrichtungen müssen nicht alle Daten selbst neu erstellen oder aktuell halten.
  • Skalierbarkeit: Die Datenbank wächst automatisch mit Beiträgen der gesamten Weltgemeinschaft, was gerade “Kleineren” Zugang zu einer schier unendlichen Menge an Referenzen und Identifikatoren verschafft.

Präsentation und Auffindbarkeit

Indem man die Objekte oder Personen der eigenen Sammlung mit den entsprechenden Wikidata-Elementen verknüpft, wird die Sammlung Teil des globalen Wissensnetzwerks.

  • Kontextualisierung: Die Daten von Wikidata können genutzt werden, um die eigenen Sammlungsdaten mit zusätzlichen externen Informationen (z.B. Lebensdaten und -orten) anzureichern, ohne dass diese manuell gepflegt werden müssen.
  • Mehrsprachigkeit: Wikidata ist in über 300 Sprachen verfügbar - natürlich in unterschiedlichen Ausprägungen. Dadurch lassen sich auch Verknüpfungen in andere Sprachen abbilden.
  • Suchmaschinen und Crawler: Suchmaschinen (wie Google) nutzen strukturierte Daten von Wikidata, um Informationen in sogenannten “Knowledge Panels” anzuzeigen. Verknüpfte Objekte werden dadurch deutlich besser gefunden und erscheinen prominenter in Suchergebnissen. Zusätzlich können sie Crawler (z.B. für KI-Training) unterstützen. Letzteres kann Vor- und Nachteil zugleich sein.

Interoperabilität und Zukunftssicherheit

Wikidata ist auch eine Brücke zwischen verschiedenen nationalen und internationalen Normdaten-Systemen.

  • Identifikatoren: Ein Wikidata-Element (z.B. Q21014973 für den Künstler Malte Sartorius) enthält oft Dutzende von externen Identifikatoren (GND, VIAF, LCNAF etc.). Für ihre Sammlung bedeutet das: Sie müssen nur eine Q-Nummer speichern und haben damit automatisch die Verbindung zu allen relevanten externen Datenbanken hergestellt.
  • Einfache Datenübernahme: Wikidata ist z.B. über REST und SPARQL abfragbar. Die Nutzung von Wikidata erleichtert die Übernahme von maschinenlesbaren Metadaten und kann die Teilnahme an aggregierten Portalen (wie z.B. Europeana) vorbereiten. Vorausgesetzt natürlich, ihre Werkzeuge unterstützen das.
  • Nachhaltigkeit: Als Projekt der Wikimedia Foundation (Wikipedia) genießt Wikidata eine hohe Beständigkeit und Akzeptanz, was es zu einer sicheren Wahl für die langfristige Datenstrategie macht.

Ausblick

  • Grundsätzlich wird die Menge an Links zu externen Systemen in Zukunft noch zunehmen, damit werden nach und nach auch weitere Informationen (ggf. auch zu den eigenen Objekten) zugänglich. Der Prozess wird auf drei Ebenen erfolgen: 1) Mehr Linked-Open-Data-Quellen, 2) Mehr digital verfügbare bzw. digitalisierte Objekte. 3) Reichere Metadata zu den Objekten (z.B. durch Crowdsourcing und KI-unterstützte Verfahren). Dabei sind die Objekte nur der Startpunkt, da damit auch weitere Entitäte (Personen, Körperschaften, Ort, Konzepte / Themen usw.) verbunden sein werden.
  • Daraus folgt auch, dass damit zu rechnen ist, dass “offizielle” Bestände (aus großen Bibliotheken, Museen und Archiven) vermehrt auch zu den eigenen Entitäten passen.

Fazit

Für private Sammlungen und kleinere Kultureinrichtungen bietet Wikidata eine Möglichkeit, ihre Sammlungen mit minimalem bis mittlerem Aufwand anzureichern, mit anderen Objekten zu vernetzen und somit in den globalen Kontext zu stellen. Zusätzlich ist es eine kostengünstigste Lösung, um die eigenen Daten zu normalisieren und damit die Sichtbarkeit und den (Daten-) Austausch zu fördern.

Die konkrete Implementierung hängt allerdings vom jeweiligen Workflow ab, gleiches gilt auch für die Darstellung im Web, also das Präsentationssystem. Aber hier bietet die Open Source Gemeinschaft Ergänzungen für eine Vielzahl an populären Systemen.