Zur Verbesserung der “Ausstellbarkeit” digitaler Objekte, wie Münzen und Büchern habe ich einen Proxy für IIIF-Ressourcen geschrieben…
Die digitalen Sammlungen der Uni Göttingen speisen sich hauptsächlich aus zwei Portalen:
- Wissenschaftliche Sammlungen der Georg-August-Universität Göttingen
- Göttinger Digitialisierungszentrum
Beide stellen ihre Digitalisate über IIIF bereit. Leider sind die bereit gestellten Bilder aber nicht für eine ästhetisch ansprechende Zweitverwendung optimiert.
Um nun eine manuelle Nachbearbeitung und den daraus folgenden Speicheraufwand gering zu halten, habe ich einen bestehenden IIIF Server - Hymir vom MDZ - etwas erweitert, so dass er in der Lage ist sich auf einen institutionellen Server zu setzen und die von diesem ausgelieferten Bilder umzugestalten.
Um die Bildverarbeitung konfigurierbar zu halten, wird ein Feld der IIIF Image API genutzt um die Operation zu spezifizieren. Dafür bot sich das Feld quality
an, der Proxy erlaubt:
nofold
- Seitenfalz entfernentransparent-background
- Transparenter Hintergundnofold+transparentbg
- beide zusammen
Für die Bildoperationen selbst kommt OpenCV zum Einsatz, dabei wird der Hintergrund einfach mit einem Schwellwert und nur an den Rändern entfernt - also transparent gemacht. Die Erkennung der Falzist etwas komplizierter, aber auch kein Hexenwerk:
- Erkennung von Linien (Probabilistic Hough Line Transform) im Falzbereich je nach Links- oder Rechtsseitigkeit
- Sortierung der erkannten Linien nach Winkel und Länge um den wahrscheinlichsten Kandidaten für die Falz zu finden
- Rotation um die erkannte Falz vertikal auszurichten
Aber hier könnte die Zuverlässigkeit noch etwas erhöht werden.
Beispiele
Die folgende Beispiele zeigen Digitalisate im jeweiligen Portal und im Viewer des Proxies. Der Viewer des Proxies erlaubt das Ändern der Hintergrundfarbe, um den Kontrast erhöhen zu können. In den Beispielen ist ein blauer Hintergrund voreingestellt.
Transparenter Hintergrund
Ohne Falz
Und mit transparentem Hintergrund…
Das Projekt ist auf GitHub verfügbar.
Update 11.4.22
Aus zeitlichen Gründen wird das Projekt wird erstmal nicht fortgeführt, zumal das Upstream Projekt gerade nichts sehr aktiv ist…