# vre_nlp_node Dieses Repository stellt ein Dockerfile zur Erstellung eines Dockerimages zur linguistischen Datenverarbeitung (NLP) zur Verfügung. Es werden Textdateien entgegengenommen und verticalized text-Dateien ausgegeben. ## Dockerimage erstellen Die GitLab Registry stellt ein automatisch erstelltes Dockerimage zur Verfügung, das stehts die neusten Änderungen beinhaltet. Das Dockerimage kann aber auch lokal erstellt werden, dazu muss folgender Befehl ins Terminal eingegeben werden. ```bash docker build -t gitlab.ub.uni-bielefeld.de:4567/pjentsch/vre_nlp_node . ``` ## Nutzung ### Starten eines Dockercontainers ```bash docker run \ --name \ -dit \ -v /files_for_nlp:/root/files_for_nlp \ -v /files_from_nlp:/root/files_from_nlp \ gitlab.ub.uni-bielefeld.de:4567/pjentsch/vre_nlp_node ``` ### Daten zur linguistischen Datenverarbeitung in das Eingabeverzeichnis kopieren ```bash cp ... /files_for_nlp ``` ### Linguistische Datenverarbeitung starten ```bash docker exec -it ocr -i /root/files_for_nlp -o /root/files_from_nlp -l ``` Valide Angaben für `` sind: * de (Deutsch) * en (Englisch) * es (Spanish) * fr (Französisch) * pt (Portugisisch) Nach Beendigung des Vorgangs, stehen die aufbereitet Daten im Verzeichnis `/files_from_nlp` zur Verfügung.