{% extends "nopaque.html.j2" %} {% set full_width = False %} {% set roadmap = False %} {% block page_content %} <div class="col s6"> <div class="card"> <div class="card-content"> <span class="card-title"><i class="material-icons left">burst_mode</i>Setup files</span> <p> Häufig liegen Datenbestände in verschiedenen Formaten und verstreut vor. Da eine Verarbeitung via nopaque ein einheitliches Datenformat vorsieht, wird dieser Dienst zur Verfügung gestellt, um etwaig anfallende Konvertierungsprozesse durchzuführen. </p> <blockquote>Umgesetzt mit <i>ImageMagick</i></blockquote> </div> </div> </div> <div class="col s6"> <div class="card"> <div class="card-content"> <span class="card-title"><i class="material-icons left">find_in_page</i>Optical Character Recognition</span> <p> Durch optische Analysemethoden mit werden aus Bilddaten, wie Fotos oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten. <br><br> </p> <blockquote>Umgesetzt mit <i>Tesseract OCR</i></blockquote> </div> </div> </div> <div class="col s12"></div> <div class="col s6"> <div class="card"> <div class="card-content"> <span class="card-title"><i class="material-icons left">format_textdirection_l_to_r</i>Natural Language Processing</span> <p> Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden (Tokenisierung, Lemmatisierung, Part-of-speech-Tagging und Eigennamenerkennung) werden Textdateien mit weiteren Informationen angereichert. </p> <blockquote>Umgesetzt mit <i>spaCy</i></blockquote> </div> </div> </div> <div class="col s6"> <div class="card"> <div class="card-content"> <span class="card-title"><i class="material-icons left">search</i>Corpus Analysis</span> <p> Mittels CQP Query Language als Abfragesprache können komplexe Suchanfragen unter Zuhilfenahme von Metadaten und NLP-Auszeichnungen ausgeführt werden. Ergebnisse können als Text oder in abstrakter Darstellung ausgewertet werden. </p> <blockquote>Umgesetzt mit <i>IMS Open Corpus Workbench</i></blockquote> </div> </div> </div> {% endblock %}