{% extends "blog/base.html" %} {% load static %} {% block content %}

account_circle

Abgeordnete (MdBs)

Profile aller Mitglieder des Deutschen Bundestags von 1949 bis heute.

insert_drive_file

Protokolle

Liste der Plenarprotokolle von 1949 bis einschließlich 2017.

insert_comment

Reden

Übersicht über alle einzelnen Reden und Redebeiträge der Mitglieder des Bundestags von 1949 bis 2017.

trending_up

Ngram Viewer

Stellt Begriffshäufigkeiten der Reden über den Zeitram von 1949 bis 2017 dar.

Das Projekt

Das Projekt Bundesdata möchte die Bundestagsplenarprotokolle für alle Bürger und Bürgerinnen in einer strukturierten und einfachen Form zugänglich und analysierbar machen sowie interaktive Statistiken zu diesen liefern.

Für dieses Unterfangen wurden die von der Bundesregierung bereitgestellten XML-Versionen der Bundestagsplenarprotokolle automatisch mit zusätzlichen Informationen versehen und strukturiert. Mit den verschiednen Tools auf Bundesdata können die Protokolle von 1949 bis 2017 einfach durchsucht und deren Inhalte analysiert werden.

Die Tools

Politikinteressierte können z.B. recherchieren, welches Mitglied des Bundestags zu welcher Zeit der deutschen Geschichte welche Reden oder Redebeiträge im Bundestag gehalten hat. Mit Hilfe des Ngram Viewers können Begriffe im Verlauf der Zeit dargestellt werden, um geschichtliche und politische Ereignisse, die sich in der Sprache der Reden widerspiegeln, sichtbar und analysierbar zu machen.

Das Projekt ist im Rahmen einer Masterarbeit entstanden. Mehr Informationen zum Projekt, der Arbeit, der Datengrundlage sowie der automatischen Auszeichnung mit zusätzlichen Informationen und Metadaten gibt es auf der Info-Seite.

Datengrundlage

Die Ausgangsdaten, welche für das Projekt genutzt wurden, sind für alle Bürger und Bürgerinnen auf der Webseite des Bundestag frei zugänglich.

Im Rahmen einer Open Data-Initiative stellt der deutsche Bundestag alle Plenarprotokolle sowie die biografischen Daten aller Abgeordneten seit 1949 als XML-Dateien zur Verfügung.

Das Projekt Bundesdata umfasst alle XML-Protokolle der Wahlperioden 1. bis 18. und deckt somit den Zeitraum von 1949 bis 2017 ab.

Automatische Auszeichnung

Da die von derBundesregierung bereitstellen XML-Protokolle nur wenig bis keine maschinenlesbare Informationen dazu enthalten, welcher Abgeordnete oder welche Abgeordnete zu welchem Zeitpunkt einen Redebeitrag im Bundestag hatte, sind die Ausgangsdaten im Rahmen des Projekts automatisch mit weiteren Informationen angereichert und strukturiert worden. Hierfür wurde eine eigene Software entwickelt, die die öffentlich verfügbaren XML-Protokolle automatisch mit zusätzliche Metadaten auszeichnet. Diese Auszeichnung ermöglicht es die Protokolle auf der Website strukturiert darzustellen und durchsuchbar zu machen. Ebenfalls können so auch erst die N-Gramme für den Ngram Viewer berechnet werden.

Quellcode für Software und Webanwendung

Der Quellcode für die eigens entwickelte Software, welche die automatische Auszeichnung erstellt hat, kann auf GitLab eingesehen und heruntergeladen werden. Der Quellcode für die Webseite ist ebenfalls auf GitLab verfügbar.

Download der ausgezeichneten Daten

Die für das Projekt mittels der eigenen Software erstellten XML-Protokolle sowie weitere Forschungsdaten können hier heruntergeladen werden.

Fehlerquoten und Probleme der Ausgangsdaten

Die automatische Auszeichnung der Protokolle ist nicht gänzlich fehlerfrei. Somit können Fehler bei der Darstellung der Reden auf der Website auftreten. Wie hoch genau die einzelen Fehlerqouten sind, sowie weitere Informationen zum Projekt, der Arbeit, der Datengrundlage und der automatischen Auszeichnung mit zusätzlichen Informationen und Metadaten gibt es auf der Info-Seite.

{% endblock content %}