2024 ist meine Stereoskopie-Sammlung online gegangen…
…zumindest teilweise. Einige Teile der Sammlung warten immer noch darauf digitalisiert zu werden. Während die Derivate damals noch mittels “klassischer” Computer-Vision-Algorithmen erzeugt wurden, habe ich mich aus aktuellem Anlass (dazu demnächst mehr) mich nun noch einmal mit KI dem Problem genähert.
Im ersten Schritt wurden Trainingsdaten benötigt. Die eigenen Bestände waren dafür nicht ausreichend, aber zum Glück sind die Karten in der Regel über hundert Jahre alt und daher nicht mehr dem Urheberrecht unterworfen. Verschiedene Institutionen haben entsprechende Sammlungen digitalisiert:
Die Trainingsdaten wurden mit Labels Studio ausgezeichnet und sind ebenfalls frei verfügbar.
Danach wurde ein YOLO11-Bildsegmentierungsmodell damit trainiert.
Beispiel
Die Ergebnisse für den Beitrag Empfangssaal des Maharajah von Tangore in Calcutta, Indien:
Download
Das Modell selbst ist auf Hugging Face zum Download verfügbar.


