{% extends "nopaque.html.j2" %}

{% set full_width = False %}
{% set roadmap = False %}

{% block page_content %}
<style>
  input::placeholder {
    color: black;
    font-style: italic;
  }
</style>

<div class="col s9">
  <div class="card">
    <div class="card-content">
      <span class="card-title"><i class="material-icons left">burst_mode</i>Setup files</span>
      <p>
        Häufig liegen Datenbestände in verschiedenen Formaten und verstreut
        vor. Da eine Verarbeitung via nopaque ein einheitliches Datenformat
        vorsieht, wird dieser Dienst zur Verfügung gestellt, um etwaig
        anfallende Konvertierungsprozesse durchzuführen.
      </p>
      <div class="row">
        <div class="col s9">
          <div class="file-field input-field">
            <div class="btn">
              <span>File</span>
              <input type="file" multiple>
            </div>
            <div class="file-path-wrapper">
              <input class="file-path validate" type="text" placeholder="Bilder, Fotos, Scans&hellip;">
            </div>
          </div>
        </div>
        <div class="col s3 right-align">
          <p>&nbsp;</p>
          <button class="btn waves-effect waves-light"type="submit">Submit<i class="material-icons right">send</i></button>
        </div>
      </div>
    </div>
  </div>
</div>

<div class="col s3">
  <div class="card">
    <div class="card-content">
      <span class="card-title">Ausgabe</span>
      <p>Nach Eingabeateinamen sortierte Multipage-TIFF-Dateien.</p>
    </div>
  </div>
  <p>
    <blockquote>
      Umgesetzt mit <i>ImageMagick</i><br>
      als Docker Swarm Service
    </blockquote>
  </p>
</div>

<div class="col s12"></div>

<div class="col s9">
  <div class="card">
    <div class="card-content">
      <span class="card-title"><i class="material-icons left">find_in_page</i>Optical Character Recognition</span>
      <p>
        Durch optische Analysemethoden werden aus Bilddaten, wie Fotos oder
        Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt
        ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten.
      </p>
      <div class="row">
        <div class="col s9">
          <div class="file-field input-field">
            <div class="btn">
              <span>File</span>
              <input type="file" multiple>
            </div>
            <div class="file-path-wrapper">
              <input class="file-path validate" type="text" placeholder="Multipage-TIFF- oder PDF-Dateien">
            </div>
          </div>
        </div>
        <div class="col s3 right-align">
          <p>&nbsp;</p>
          <button class="btn waves-effect waves-light"type="submit">Submit<i class="material-icons right">send</i></button>
        </div>
      </div>
    </div>
  </div>
</div>

<div class="col s3">
  <div class="card">
    <div class="card-content">
      <span class="card-title">Ausgabe</span>
      <p>
        Textdateien, PDF-Dateien und TEI P5 konformen XML-Dateien.
      </p>
    </div>
  </div>
  <p>
    <blockquote>
      Pipelineumsetzung mit <i>Tesseract OCR</i><br>
      als Docker Swarm Service
    </blockquote>
  </p>
</div>

<div class="col s12"></div>

<div class="col s9">
  <div class="card">
    <div class="card-content">
      <span class="card-title"><i class="material-icons left">format_textdirection_l_to_r</i>Natural Language Processing</span>
      <p>
        Mit Hilfe computergestützter linguistischer
        Datenverarbeitungsmethoden (Tokenisierung, Lemmatisierung,
        Part-of-speech-Tagging und Eigennamenerkennung) werden Textdateien
        mit weiteren Informationen angereichert.
      </p>
      <div class="row">
        <div class="col s9">
          <div class="file-field input-field">
            <div class="btn">
              <span>File</span>
              <input type="file" multiple>
            </div>
            <div class="file-path-wrapper">
              <input class="file-path validate" type="text" placeholder="Textdateien">
            </div>
          </div>
        </div>
        <div class="col s3 right-align">
          <p>&nbsp;</p>
          <button class="btn waves-effect waves-light"type="submit">Submit<i class="material-icons right">send</i></button>
        </div>
      </div>
    </div>
  </div>
</div>

<div class="col s3">
  <div class="card">
    <div class="card-content">
      <span class="card-title">Ausgabe</span>
      <p>Korpusdateien im <i>verticalized text</i>-Format (XML-Dialekt).</p>
    </div>
  </div>
  <p>
    <blockquote>
      Pipelineumsetzung mit <i>spaCy</i><br>
      als Docker Swarm Service
    </blockquote>
  </p>
</div>

<div class="col s12"></div>

<div class="col s9">
  <div class="card">
    <div class="card-content">
      <span class="card-title"><i class="material-icons left">search</i>Corpus Analysis</span>
      <p>
        Mittels CQP Query Language als Abfragesprache können komplexe
        Suchanfragen unter Zu­hil­fe­nah­me von Metadaten und NLP-Auszeichnungen
        ausgeführt werden. Ergebnisse können als Text oder in abstrakter
        Darstellung ausgewertet werden.
      </p>
      <div class="input-field">
        <i class="material-icons prefix">search</i>
        <input class="search" placeholder='"fox" "jumps" "over" []* "dog"' type="search"></input>
      </div>
      <p>
        <i class="material-icons left" style="padding-left: 10px;">subdirectory_arrow_right</i>
        <span class="chip">The</span> <span class="chip">quick</span>
        <span class="chip">brown</span> <span class="chip">fox</span>
        <span class="chip">jumps</span> <span class="chip">over</span>
        <span class="chip">the</span> <span class="chip">lazy</span>
        <span class="chip">dog</span> <span class="chip">.</span>
      </p>
      <blockquote>Umgesetzt mit <i>IMS Open Corpus Workbench</i></blockquote>
    </div>
  </div>
</div>

<div class="col s3">
  <div class="card">
    <div class="card-content">
      <span class="card-title">Ausgabe</span>
      <p>Export der Ergebnisse in CSV, Excel, JSON und HTML.</p>
    </div>
  </div>
  <p>
    <blockquote>
      Umgesetzt mit <i>IMS Open Corpus Workbench</i><br>
      als Docker Container mit Socketverbindung
    </blockquote>
  </p>
</div>
{% endblock %}