From fa2af2d8b90f513a7ac6ba4c8efd3a12dca99d66 Mon Sep 17 00:00:00 2001 From: Patrick Jentsch
Patrick Jentsch, Stephan Porada und Helene Schlicht
+- Häufig liegen Digitalisate textueller Foschungsdaten (Bücher, Briefe etc.) in mehreren Dateien und Formaten vor. Nopaque ermöglicht die Konvertierung und Zusammenfassung in ein einheitliches Datenformat, was eine vereinfachte Weiterverarbeitung mit weiteren Services ermöglicht. -
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.
+Speeds up your work
+All tools provided by nopaque are carefully selected to provide a complete tool suite without delaying compatibility issues.
Cloud infrastructure
+All computational work is processed within nopaques cloud infrastructure. You don't need to install any software, great right?
+User friendly
+By utilizing elements and principles of Material Design, we were able to create a framework that focuses on User Experience.
+Passt gut zum Prozess
+We have provided detailed documentation as well as specific code examples to help new users get started.
- -
Nach Eingabeateinamen sortierte Multipage-TIFF-Dateien.
--
- Umgesetzt mit ImageMagick- -
- als Docker Swarm Service -
- Durch optische Analysemethoden werden aus Bilddaten, wie Fotos oder - Scans, Textdateien erzeugt. Erst dieser Vorverarbeitungsschritt - ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten. -
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.
+File setup
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.
Optical Character Recognition
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.
+Natural Language Processing
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.
+Corpus analysis
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.
- -
- Textdateien, PDF-Dateien und TEI P5 konforme XML-Dateien. -
--
- Pipelineumsetzung mit Tesseract OCR- -
- als Docker Swarm Service -
- Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden - (Tokenisierung, Lemmatisierung, Part-of-speech-Tagging und - Eigennamenerkennung) werden Textdateien mit weiteren Informationen ausgezeichnet. -
+Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
+ person_addRegister +- -
Korpusdateien im verticalized text-Format (XML-Dialekt, Ähnelt CoNLL).
--
- Pipelineumsetzung mit spaCy- -
- als Docker Swarm Service -
- Mittels CQP Query Language können komplexe Suchanfragen unter - Zuhilfenahme von Metadaten und NLP-Auszeichnungen an eigens erstellte - Korpora gestellt werden. Ergebnisse können als Text oder in abstrakter Darstellung ausgewertet werden. -
-- The | DET - quick | ADJ - brown | ADJ - fox | PROPN - jumps | VERB - over | ADP - the | DET - lazy | ADJ - - dog | NOUN - - . | PUNCT -
-- Export der Ergebnisse in JSON. (Zunkünftig angedacht: CSV, Excel und - HTML) -
--
- Umgesetzt mit IMS Open Corpus Workbench- -
- als lokaler Docker-Container -
-
-
-
-
+ Häufig liegen Digitalisate textueller Foschungsdaten (Bücher, Briefe etc.) in mehreren Dateien und Formaten vor. Nopaque ermöglicht die Konvertierung und Zusammenfassung in ein einheitliches Datenformat, was eine vereinfachte Weiterverarbeitung mit weiteren Services ermöglicht. +
++ +
Nach Eingabeateinamen sortierte Multipage-TIFF-Dateien.
++
+ Umgesetzt mit ImageMagick+ +
+ als Docker Swarm Service +
+ Durch optische Analysemethoden werden aus Bilddaten, wie Fotos oder + Scans, Textdateien erzeugt. Erst dieser Vorverarbeitungsschritt + ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten. +
++ +
+ Textdateien, PDF-Dateien und TEI P5 konforme XML-Dateien. +
++
+ Pipelineumsetzung mit Tesseract OCR+ +
+ als Docker Swarm Service +
+ Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden + (Tokenisierung, Lemmatisierung, Part-of-speech-Tagging und + Eigennamenerkennung) werden Textdateien mit weiteren Informationen ausgezeichnet. +
++ +
Korpusdateien im verticalized text-Format (XML-Dialekt, Ähnelt CoNLL).
++
+ Pipelineumsetzung mit spaCy+ +
+ als Docker Swarm Service +
+ Mittels CQP Query Language können komplexe Suchanfragen unter + Zuhilfenahme von Metadaten und NLP-Auszeichnungen an eigens erstellte + Korpora gestellt werden. Ergebnisse können als Text oder in abstrakter Darstellung ausgewertet werden. +
++ The | DET + quick | ADJ + brown | ADJ + fox | PROPN + jumps | VERB + over | ADP + the | DET + lazy | ADJ + + dog | NOUN + + . | PUNCT +
++ Export der Ergebnisse in JSON. (Zunkünftig angedacht: CSV, Excel und + HTML) +
++
+ Umgesetzt mit IMS Open Corpus Workbench+ +
+ als lokaler Docker-Container +
+
+
+
+