mirror of
https://gitlab.ub.uni-bielefeld.de/sfb1288inf/nopaque.git
synced 2024-12-24 10:34:17 +00:00
28 lines
1.8 KiB
Plaintext
28 lines
1.8 KiB
Plaintext
<div class="col s12 m6">
|
|
<div class="card">
|
|
<div class="card-content">
|
|
<span class="card-title">File setup</span>
|
|
<p>To use the <a href="{{ url_for('services.service', service='ocr') }}">OCR</a> service offered here, the input data provided for this purpose must be available either as PDF or multipage TIFF files. However, image files are usually only available as PNG, JPEG or singlepage TIFF files. This service converts the uploaded image files into the correct file format for the <a href="{{ url_for('services.service', service='ocr') }}">OCR</a> service.</p>
|
|
</div>
|
|
</div>
|
|
</div>
|
|
|
|
<div class="col s12 m6">
|
|
<div class="card">
|
|
<div class="card-content">
|
|
<span class="card-title">Optical Character Recognition</span>
|
|
<p>Der hier zur Verfügung gestellte Dienst basiert auf dem Verfahren der optischen Zeichenerkennung. Dabei werden durch optische Analysemethoden und einen anschließenden Abgleich mit Wörterbüchern aus Bilddaten, wie Fotos oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt ermöglicht eine computergestützte Verarbeitung von Dokumenten.</p>
|
|
<p>Die Ausgabe dieses Dienstes erfolgt in Form von Textdateien, PDF Dateien mit hinterlegtem Text und <a href="https://tei-c.org/guidelines/p5/" target="_blank">TEI P5</a> konformen XML Dateien.</p>
|
|
</div>
|
|
</div>
|
|
</div>
|
|
|
|
<div class="col s12 m6">
|
|
<div class="card">
|
|
<div class="card-content">
|
|
<span class="card-title">Natural Language Processing</span>
|
|
<p>Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden können Textdateien mit weiteren Informationen angereichert werden. Auf dieser Plattform werden derzeit die im folgenden aufgeführten Textverarbeitungsroutinen in automatisierter Form zur Verfügung gestellt.</p>
|
|
</div>
|
|
</div>
|
|
</div>
|