{% extends "blog/base.html" %} {% load static %} {% block content %}
Das Projekt Bundesdata möchte die Bundestagsplenarprotokolle für alle Bürger und Bürgerinnen in einer strukturierten und einfachen Form zugänglich und analysierbar machen sowie interaktive Statistiken zu diesen liefern.
Für dieses Unterfangen wurden die von der Bundesregierung bereitgestellten XML-Versionen der Bundestagsplenarprotokolle automatisch mit zusätzlichen Informationen versehen und strukturiert. Mit den verschiednen Tools auf Bundesdata können die Protokolle von 1949 bis 2017 einfach durchsucht und deren Inhalte analysiert werden.
Politikinteressierte können z.B. recherchieren, welches Mitglied des Bundestags zu welcher Zeit der deutschen Geschichte welche Reden oder Redebeiträge im Bundestag gehalten hat. Mit Hilfe des Ngram Viewers können Begriffe im Verlauf der Zeit dargestellt werden, um geschichtliche und politische Ereignisse, die sich in der Sprache der Reden widerspiegeln, sichtbar und analysierbar zu machen.
Das Projekt ist im Rahmen einer Masterarbeit entstanden. Mehr Informationen zum Projekt, der Arbeit, der Datengrundlage sowie der automatischen Auszeichnung mit zusätzlichen Informationen und Metadaten gibt es auf der Info-Seite.
Die Ausgangsdaten, welche für das Projekt genutzt wurden, sind für alle Bürger und Bürgerinnen auf der Webseite des Bundestag frei zugänglich.
Im Rahmen einer Open Data-Initiative stellt der deutsche Bundestag alle Plenarprotokolle sowie die biografischen Daten aller Abgeordneten seit 1949 als XML-Dateien zur Verfügung.
Das Projekt Bundesdata umfasst alle XML-Protokolle der Wahlperioden 1. bis 18. und deckt somit den Zeitraum von 1949 bis 2017 ab.
Da die von derBundesregierung bereitstellen XML-Protokolle nur wenig bis keine maschinenlesbare Informationen dazu enthalten, welcher Abgeordnete oder welche Abgeordnete zu welchem Zeitpunkt einen Redebeitrag im Bundestag hatte, sind die Ausgangsdaten im Rahmen des Projekts automatisch mit weiteren Informationen angereichert und strukturiert worden. Hierfür wurde eine eigene Software entwickelt, die die öffentlich verfügbaren XML-Protokolle automatisch mit zusätzliche Metadaten auszeichnet. Diese Auszeichnung ermöglicht es die Protokolle auf der Website strukturiert darzustellen und durchsuchbar zu machen. Ebenfalls können so auch erst die N-Gramme für den Ngram Viewer berechnet werden.
Die für das Projekt mittels der eigenen Software erstellten XML-Protokolle sowie weitere Forschungsdaten können hier heruntergeladen werden.
Die automatische Auszeichnung der Protokolle ist nicht gänzlich fehlerfrei. Somit können Fehler bei der Darstellung der Reden auf der Website auftreten. Wie hoch genau die einzelen Fehlerqouten sind, sowie weitere Informationen zum Projekt, der Arbeit, der Datengrundlage und der automatischen Auszeichnung mit zusätzlichen Informationen und Metadaten gibt es auf der Info-Seite.