{% extends "base.html.j2" %} {% block page_content %}

The process...

Der hier zur Verfügung gestellte Dienst basiert auf dem Verfahren der optischen Zeichenerkennung. Dabei werden durch optische Analysemethoden und einen anschließenden Abgleich mit Wörterbüchern aus Bilddaten, wie Fotos oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt ermöglicht eine computergestützte Verarbeitung von Dokumenten.

Die Ausgabe dieses Dienstes erfolgt in Form von Textdateien, PDF Dateien mit hinterlegtem Text und TEI P5 konformen XML Dateien.

layers Eingabe von Bilddaten

Über ein Auftragsformular können Bilddaten in Form von PDF-Dateien hochgeladen werden.

layers Optische Zeichenerkennung

Die optische Zeichenerkennung erfolgt in der Recheninfrastruktur der Plattform.

layers Fehlerkorrektur

Je nach Qualität der Eingabedaten kann es zu Fehlern kommen, die korrigiert werden sollten.

layers Weiterverarbeitung

Die Textdaten können weiterverarbeitet[*] oder in dieser Form bereits genutzt[*] werden.

Submit a job

{{ create_ocr_job_form.hidden_tag() }}
title {{ create_ocr_job_form.title() }} {{ create_ocr_job_form.title.label }} {% for error in create_ocr_job_form.title.errors %} {{ error }} {% endfor %}
description {{ create_ocr_job_form.description() }} {{ create_ocr_job_form.description.label }} {% for error in create_ocr_job_form.description.errors %} {{ error }} {% endfor %}
{{ create_ocr_job_form.files.label.text }} {{ create_ocr_job_form.files(accept='application/pdf, image/tiff') }}
{% for error in create_ocr_job_form.files.errors %} {{ error }} {% endfor %}
language {{ create_ocr_job_form.language() }} {{ create_ocr_job_form.language.label }} {% for error in create_ocr_job_form.language.errors %} {{ error }} {% endfor %}
{{ create_ocr_job_form.submit(class='btn') }}
{% endblock %}