nopaque/app/templates/main/index.html.j2
2020-02-10 13:25:15 +01:00

146 lines
4.1 KiB
Django/Jinja
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{% extends "nopaque.html.j2" %}
{% set full_width = True %}
{% set roadmap = False %}
{% block page_content %}
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Textdaten in Form von Bildern, Fotos, Scans&hellip;</p>
</div>
</div>
</div>
<div class="col s6">
<div class="card">
<div class="card-content">
<span class="card-title"><i class="material-icons left">burst_mode</i>Setup files</span>
<p>
Häufig liegen Datenbestände in verschiedenen Formaten und verstreut
vor. Da eine Verarbeitung via nopaque ein einheitliches Datenformat
vorsieht, wird dieser Dienst zur Verfügung gestellt, um etwaig
anfallende Konvertierungsprozesse durchzuführen.
</p>
<blockquote>Umgesetzt mit <i>ImageMagick</i></blockquote>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>Aus den Eingaben zusammengesetzte Multipage-TIFF-Dateien.</p>
</div>
</div>
</div>
<div class="col s12"></div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Textdaten in Form von Multipage-TIFF- oder PDF-Dateien.</p>
</div>
</div>
</div>
<div class="col s6">
<div class="card">
<div class="card-content">
<span class="card-title"><i class="material-icons left">find_in_page</i>Optical Character Recognition</span>
<p>
Durch optische Analysemethoden mit werden aus Bilddaten, wie Fotos
oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt
ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten.
</p>
<blockquote>Umgesetzt mit <i>Tesseract OCR</i></blockquote>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>
Textdateien, PDF-Dateien und TEI P5 konformen XML-Dateien.
</p>
</div>
</div>
</div>
<div class="col s12"></div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Ausschließlich Textdateien.</p>
</div>
</div>
</div>
<div class="col s6">
<div class="card">
<div class="card-content">
<span class="card-title"><i class="material-icons left">format_textdirection_l_to_r</i>Natural Language Processing</span>
<p>
Mit Hilfe computergestützter linguistischer
Datenverarbeitungsmethoden (Tokenisierung, Lemmatisierung,
Part-of-speech-Tagging und Eigennamenerkennung) werden Textdateien
mit weiteren Informationen angereichert.
</p>
<blockquote>Umgesetzt mit <i>spaCy</i></blockquote>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>Korpus Dateien im <i>verticalized text</i>-Format (XML-Dialekt).</p>
</div>
</div>
</div>
<div class="col s12"></div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Korpus Dateien und Metadaten entsprechend des BibTeX-Schemas.</p>
</div>
</div>
</div>
<div class="col s6">
<div class="card">
<div class="card-content">
<span class="card-title"><i class="material-icons left">search</i>Corpus Analysis</span>
<p>
Mittels CQP Query Language als Abfragesprache können komplexe
Suchanfragen unter Zu­hil­fe­nah­me von Metadaten und NLP-Auszeichnungen
ausgeführt werden. Ergebnisse können als Text oder in abstrakter
Darstellung ausgewertet werden.
</p>
<blockquote>Umgesetzt mit <i>IMS Open Corpus Workbench</i></blockquote>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>Export der Ergebnisse in CSV, Excel, JSON und HTML.</p>
</div>
</div>
</div>
{% endblock %}