Der hier zur Verfügung gestellte Dienst basiert auf Verfahren der optischen Zeichenerkennung. Dabei werden durch optische Analysemethoden und einen anschließenden Abgleich mit Wörterbüchern aus Bilddaten, wie Fotos oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt ermöglicht eine computergestützte Verarbeitung von Dokumenten.
Über ein Auftragsformular können Bilddaten in Form von PDF-Dateien hochgeladen werden.
Die optische Zeichenerkennung erfolgt in der Recheninfrastruktur der Plattform.
Je nach Qualität der Eingabedaten kann es zu Fehlern kommen, die korrigiert werden sollten.
Die Ausgabe dieses Dienstes erfolgt in Form von Textdateien, PDF Dateien mit hinterlegtem Text und TEI P5 konformen XML Dateien.