From 55d7848bd3c855d38626fe7400436d47f2900a0e Mon Sep 17 00:00:00 2001 From: Patrick Jentsch Date: Mon, 17 Feb 2020 11:08:03 +0100 Subject: [PATCH] Update service pages --- .../services/corpus_analysis.html.j2 | 29 ++++++++++++++++++- app/templates/services/nlp.html.j2 | 21 +++++--------- app/templates/services/ocr.html.j2 | 20 +++++-------- app/templates/services/setup_files.html.j2 | 26 ++++------------- 4 files changed, 49 insertions(+), 47 deletions(-) diff --git a/app/templates/services/corpus_analysis.html.j2 b/app/templates/services/corpus_analysis.html.j2 index 4d9280c6..1e4e7064 100644 --- a/app/templates/services/corpus_analysis.html.j2 +++ b/app/templates/services/corpus_analysis.html.j2 @@ -5,8 +5,35 @@ {% block page_content %}
-

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore

+
+
+
+
+ layersTokenisierung +

Aufteilung eines Textes in Sätze und Wörter. Dies ist zur weiteren Verarbeitung notwendig.

+
+
 
+
+ layersLemmatisierung +

Reduktion der Flexionsformen eines Wortes auf dessen Grundform.

+
+
 
+
+ layersPart-of-speech-Tagging +

Kontext- und definitionsbezogene Zuordnung von Wörtern und Satzzeichen zu Wortarten.

+
+
 
+
+ layersEigennamenerkennung +

Identifikation von Wörtern, die eine Entitätbeschreiben, wie Firmen- und Personennamen.

+
+
+
+
+
+
+

My corpora

diff --git a/app/templates/services/nlp.html.j2 b/app/templates/services/nlp.html.j2 index 300dbba0..3040da43 100644 --- a/app/templates/services/nlp.html.j2 +++ b/app/templates/services/nlp.html.j2 @@ -4,29 +4,27 @@ {% set roadmap = True %} {% block page_content %} -
-

Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden können Textdateien mit weiteren Informationen angereichert werden. Auf dieser Plattform werden derzeit die im folgenden aufgeführten Textverarbeitungsroutinen in automatisierter Form zur Verfügung gestellt.

-
- -
+
- layersTokenisierung + layersTokenisierung

Aufteilung eines Textes in Sätze und Wörter. Dies ist zur weiteren Verarbeitung notwendig.

+
 
- layersLemmatisierung -

Reduktion der Flexionsformen eines Wortes auf dessen Grundform.

+ layersLemmatisierung +

Reduktion der Flexionsformen eines Wortes auf dessen Grundform.

 
- layersPart-of-speech-Tagging + layersPart-of-speech-Tagging

Kontext- und definitionsbezogene Zuordnung von Wörtern und Satzzeichen zu Wortarten.

+
 
- layersEigennamenerkennung + layersEigennamenerkennung

Identifikation von Wörtern, die eine Entitätbeschreiben, wie Firmen- und Personennamen.

@@ -36,9 +34,6 @@

Submit a job

-
- -
diff --git a/app/templates/services/ocr.html.j2 b/app/templates/services/ocr.html.j2 index c2732833..43910b4c 100644 --- a/app/templates/services/ocr.html.j2 +++ b/app/templates/services/ocr.html.j2 @@ -4,30 +4,27 @@ {% set roadmap = True %} {% block page_content %} -
-

Der hier zur Verfügung gestellte Dienst basiert auf dem Verfahren der optischen Zeichenerkennung. Dabei werden durch optische Analysemethoden und einen anschließenden Abgleich mit Wörterbüchern aus Bilddaten, wie Fotos oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt ermöglicht eine computergestützte Verarbeitung von Dokumenten.

-

Die Ausgabe dieses Dienstes erfolgt in Form von Textdateien, PDF Dateien mit hinterlegtem Text und TEI P5 konformen XML Dateien.

-
- -
+
- layersEingabe von Bilddaten + layersEingabe von Bilddaten

Über ein Auftragsformular können Bilddaten in Form von PDF-Dateien hochgeladen werden.

+
 
- layersOptische Zeichenerkennung + layersOptische Zeichenerkennung

Die optische Zeichenerkennung erfolgt in der Recheninfrastruktur der Plattform.

 
- layersFehlerkorrektur + layersFehlerkorrektur

Je nach Qualität der Eingabedaten kann es zu Fehlern kommen, die korrigiert werden sollten.

+
 
- layersWeiterverarbeitung + layersWeiterverarbeitung

Die Textdaten können weiterverarbeitet[*] oder in dieser Form bereits genutzt[*] werden.

@@ -37,9 +34,6 @@

Submit a job

-
- -
diff --git a/app/templates/services/setup_files.html.j2 b/app/templates/services/setup_files.html.j2 index 6f54945a..26f4e848 100644 --- a/app/templates/services/setup_files.html.j2 +++ b/app/templates/services/setup_files.html.j2 @@ -4,29 +4,18 @@ {% set roadmap = True %} {% block page_content %} -
-

To use the OCR service offered here, the input data provided for this purpose must be available either as PDF or multipage TIFF files. However, image files are usually only available as PNG, JPEG or singlepage TIFF files. This service converts the uploaded image files into the correct file format for the OCR service.

-
- -
+
-
-
- layersImage upload -

Upload your image files in PNG, JPEG oder singlepage TIFF file format with the provided formular.

-
-
+ layersImage upload +

Upload your image files in PNG, JPEG oder singlepage TIFF file format with the provided formular.

+
 
-
-
- layersMerge process -

The cloud infrastructure picks up your data and merges it into a multipage TIFF file.

-
-
+ layersMerge process +

The cloud infrastructure picks up your data and merges it into a multipage TIFF file.

@@ -35,9 +24,6 @@

Submit a job

-
- -