Linguistische Datenverarbeitung

Mit Hilfe computergestützter linguistischer Datenverarbeitungsmethoden können Textdateien mit weiteren Informationen angereichert werden. Auf dieser Plattform werden derzeit die im folgenden aufgeführten Textverarbeitungsroutinen in automatisierter Form zur Verfügung gestellt.

layers Tokenisierung

Aufteilung eines Textes in Sätze und Wörter. Dies ist zur weiteren Verarbeitung notwendig.

layers Lemmatisierung

Reduktion der Flexionsformen eines Wortes auf dessen Grundform.

layers Part-of-speech-Tagging

Kontext- und definitionsbezogene Zuordnung von Wörtern und Satzzeichen zu Wortarten.

layers Eigennamenerkennung

Identifikation von Wörtern, die eine Entität beschreiben, wie Firmen- und Personennamen.

Die Ausgabe erfolgt in Form einer verticalized text Datei (Dateiendung: .vrt). In diesem Format kann der Text einfach in Auswertungsprogramme, wie zum Beispiel der IMS Open Corpus Workbench, eingefügt werden.

Auftrag erstellen

playlist_add Auftragsformular zur linguistische Datenverarbeitung von Textdateien.

Auftragsübersicht

work Hier wird der aktuelle Status sämtlicher vom Benutzer erstellten Aufträge aufgelistet.