IIIF Proxy

Zur Verbesserung der “Ausstellbarkeit” digitaler Objekte, wie Münzen und Büchern habe ich einen Proxy für IIIF-Ressourcen geschrieben…

Die digitalen Sammlungen der Uni Göttingen speisen sich hauptsächlich aus zwei Portalen:

Beide stellen ihre Digitalisate über IIIF bereit. Leider sind die bereit gestellten Bilder aber nicht für eine ästhetisch ansprechende Zweitverwendung optimiert.

Um nun eine manuelle Nachbearbeitung und den daraus folgenden Speicheraufwand gering zu halten, habe ich einen bestehenden IIIF Server - Hymir vom MDZ - etwas erweitert, so dass er in der Lage ist sich auf einen institutionellen Server zu setzen und die von diesem ausgelieferten Bilder umzugestalten.

Um die Bildverarbeitung konfigurierbar zu halten, wird ein Feld der IIIF Image API genutzt um die Operation zu spezifizieren. Dafür bot sich das Feld quality an, der Proxy erlaubt:

  • nofold - Seitenfalz entfernen
  • transparent-background - Transparenter Hintergund
  • nofold+transparentbg - beide zusammen

Für die Bildoperationen selbst kommt OpenCV zum Einsatz, dabei wird der Hintergrund einfach mit einem Schwellwert und nur an den Rändern entfernt - also transparent gemacht. Die Erkennung der Falzist etwas komplizierter, aber auch kein Hexenwerk:

  • Erkennung von Linien (Probabilistic Hough Line Transform) im Falzbereich je nach Links- oder Rechtsseitigkeit
  • Sortierung der erkannten Linien nach Winkel und Länge um den wahrscheinlichsten Kandidaten für die Falz zu finden
  • Rotation um die erkannte Falz vertikal auszurichten

Aber hier könnte die Zuverlässigkeit noch etwas erhöht werden.

Beispiele

Die folgende Beispiele zeigen Digitalisate im jeweiligen Portal und im Viewer des Proxies. Der Viewer des Proxies erlaubt das Ändern der Hintergrundfarbe, um den Kontrast erhöhen zu können. In den Beispielen ist ein blauer Hintergrund voreingestellt.

Transparenter Hintergrund

Original Eintrag im Portal

Abbildung: Münzkabinett der Universität Göttingen, Stephan Eckardt, Archäologisches Institut Göttingen, 2014 / Lizenz: Namensnennung - Nicht kommerziell 4.0 (CC BY-NC 4.0)

Ohne Falz

Und mit transparentem Hintergrund…

Original Eintrag im Portal

Abbildung: Niedersächsische Staats- und Universitätsbibliothek Göttingen / Lizenz: Public Domain Mark 1.0 (PDM)

Das Projekt ist auf GitHub verfügbar.

Update 11.4.22

Aus zeitlichen Gründen wird das Projekt wird erstmal nicht fortgeführt, zumal das Upstream Projekt gerade nichts sehr aktiv ist…