mirror of
https://gitlab.ub.uni-bielefeld.de/sfb1288inf/nopaque.git
synced 2024-11-15 09:15:41 +00:00
69 lines
2.3 KiB
Plaintext
69 lines
2.3 KiB
Plaintext
|
{% extends "nopaque.html.j2" %}
|
|||
|
|
|||
|
{% set full_width = False %}
|
|||
|
{% set roadmap = False %}
|
|||
|
|
|||
|
{% block page_content %}
|
|||
|
<div class="col s6">
|
|||
|
<div class="card">
|
|||
|
<div class="card-content">
|
|||
|
<span class="card-title"><i class="material-icons left">burst_mode</i>Setup files</span>
|
|||
|
<p>
|
|||
|
Häufig liegen Datenbestände in verschiedenen Formaten und verstreut
|
|||
|
vor. Da eine Verarbeitung via nopaque ein einheitliches Datenformat
|
|||
|
vorsieht, wird dieser Dienst zur Verfügung gestellt, um etwaig
|
|||
|
anfallende Konvertierungsprozesse durchzuführen.
|
|||
|
</p>
|
|||
|
<blockquote>Umgesetzt mit <i>ImageMagick</i></blockquote>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
|
|||
|
<div class="col s6">
|
|||
|
<div class="card">
|
|||
|
<div class="card-content">
|
|||
|
<span class="card-title"><i class="material-icons left">find_in_page</i>Optical Character Recognition</span>
|
|||
|
<p>
|
|||
|
Durch optische Analysemethoden mit werden aus Bilddaten, wie Fotos
|
|||
|
oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt
|
|||
|
ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten.
|
|||
|
<br><br>
|
|||
|
</p>
|
|||
|
<blockquote>Umgesetzt mit <i>Tesseract OCR</i></blockquote>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
|
|||
|
<div class="col s12"></div>
|
|||
|
|
|||
|
<div class="col s6">
|
|||
|
<div class="card">
|
|||
|
<div class="card-content">
|
|||
|
<span class="card-title"><i class="material-icons left">format_textdirection_l_to_r</i>Natural Language Processing</span>
|
|||
|
<p>
|
|||
|
Mit Hilfe computergestützter linguistischer
|
|||
|
Datenverarbeitungsmethoden (Tokenisierung, Lemmatisierung,
|
|||
|
Part-of-speech-Tagging und Eigennamenerkennung) werden Textdateien
|
|||
|
mit weiteren Informationen angereichert.
|
|||
|
</p>
|
|||
|
<blockquote>Umgesetzt mit <i>spaCy</i></blockquote>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
|
|||
|
<div class="col s6">
|
|||
|
<div class="card">
|
|||
|
<div class="card-content">
|
|||
|
<span class="card-title"><i class="material-icons left">search</i>Corpus Analysis</span>
|
|||
|
<p>
|
|||
|
Mittels CQP Query Language als Abfragesprache können komplexe
|
|||
|
Suchanfragen unter Zuhilfenahme von Metadaten und NLP-Auszeichnungen
|
|||
|
ausgeführt werden. Ergebnisse können als Text oder in abstrakter
|
|||
|
Darstellung ausgewertet werden.
|
|||
|
</p>
|
|||
|
<blockquote>Umgesetzt mit <i>IMS Open Corpus Workbench</i></blockquote>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
</div>
|
|||
|
{% endblock %}
|