Opaque | Linguistische Datenverarbeitung

Linguistische Datenverarbeitung

Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden können Textdateien mit weiteren Informationen angereichert werden. Auf dieser Plattform werden derzeit die im folgenden aufgeführten Textverarbeitungsroutinen in automatisierter Form zur Verfügung gestellt.

Tokenisierung

Aufteilung eines Textes in Sätze und Wörter. Dies ist zur weiteren Verarbeitung notwendig.

Lemmatisierung

Reduktion der Flexionsformen eines Wortes auf dessen Grundform.

Part-of-speech-Tagging

Kontext- und definitionsbezogene Zuordnung von Wörtern und Satzzeichen zu Wortarten.

Eigennamenerkennung

Identifikation von Wörtern, die eine Entität beschreiben, wie Firmen- und Personennamen.

Die Ausgabe erfolgt in Form einer verticalized text Datei (Dateiendung: .vrt). In diesem Format kann der Text einfach in Auswertungsprogramme, wie zum Beispiel der IMS Open Corpus Workbench, eingefügt werden.

Auftrag erstellen

Auftragsformular zur linguistische Datenverarbeitung von Textdateien.

Auftragsübersicht

Hier wird der aktuelle Status sämtlicher vom Benutzer erstellten Aufträge aufgelistet.

Öffnen

playlist_addLinguistische Datenverarbeitung

Linguistische Datenverarbeitung