{% extends "base.html.j2" %} {% block page_content %}

The process...

Der hier zur Verfügung gestellte Dienst basiert auf dem Verfahren der optischen Zeichenerkennung. Dabei werden durch optische Analysemethoden und einen anschließenden Abgleich mit Wörterbüchern aus Bilddaten, wie Fotos oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt ermöglicht eine computergestützte Verarbeitung von Dokumenten.

Die Ausgabe dieses Dienstes erfolgt in Form von Textdateien, PDF Dateien mit hinterlegtem Text und TEI P5 konformen XML Dateien.

layersEingabe von Bilddaten

Über ein Auftragsformular können Bilddaten in Form von PDF-Dateien hochgeladen werden.

layersOptische Zeichenerkennung

Die optische Zeichenerkennung erfolgt in der Recheninfrastruktur der Plattform.

layersFehlerkorrektur

Je nach Qualität der Eingabedaten kann es zu Fehlern kommen, die korrigiert werden sollten.

layersWeiterverarbeitung

Die Textdaten können weiterverarbeitet[*] oder in dieser Form bereits genutzt[*] werden.

Submit a job

{{ new_ocr_job_form.hidden_tag() }}
title {{ new_ocr_job_form.title(data_length='32') }} {{ new_ocr_job_form.title.label }} {% for error in new_ocr_job_form.title.errors %} {{ error }} {% endfor %}
description {{ new_ocr_job_form.description(data_length='255') }} {{ new_ocr_job_form.description.label }} {% for error in new_ocr_job_form.description.errors %} {{ error }} {% endfor %}
{{ new_ocr_job_form.files.label.text }} {{ new_ocr_job_form.files(accept='application/pdf, image/tiff') }}
{% for error in new_ocr_job_form.files.errors %} {{ error }} {% endfor %}
language {{ new_ocr_job_form.language() }} {{ new_ocr_job_form.language.label }} {% for error in new_ocr_job_form.language.errors %} {{ error }} {% endfor %}
apps {{ new_ocr_job_form.version() }} {{ new_ocr_job_form.version.label }} {% for error in new_ocr_job_form.version.errors %} {{ error }} {% endfor %}

 

Binarization

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempora invidunt ut

Page split (N.a.)

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempora invidunt ut

Page rotation (N.a.)

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempora invidunt ut

{{ new_ocr_job_form.submit(class='btn') }}
{% endblock %}