Schlagworte: Bundestag

Nebeneinkünfte der Bundestagsabgeordneten visualisieren

Letzthin habe ich erklärt, wie man die Nebeneinkünfte der Bundestagsabgeordneten scrapen kann. Jetzt wird es Zeit diese Daten zu filtern und zu visualisieren. Leider machen es einem die angegebenen Einkommensstufen nicht gerade leicht eine eindeutige Geschichte zu finden und zu erzählen. Dazu aber später mehr.

Mein Tool der Wahl zu ersten Datenauswertung ist entweder Excel, OpenOffice oder LibreOffice. Auf der Suche nach einer Geschichte kann man schnell Daten filtern, sortieren oder visualisieren.

Eine erste Auswertung kann man über die Anzahl der Nebenkommen machen. In diesem Fall um die durchschnittliche Zahl der Nebeneinkommen pro Abgeordneten(-sitz) herauszufinden. Man sieht deutlich, welche Fraktion die meisten Nebeneinkommen hat.

nebeneinkuenfte-fraktionen
Durchschnittliche Anzahl der Nebeneinkünfte pro Sitz 

Spannend sind hierbei auch einzelne Politiker. Dr. Peter Gauweiler (CSU) und Dr. Daniela De Ridder (SPD) mit 19, beziehungsweise 13 Nebeneinkommen scheinen schwer beschäftig zu sein. Gauweiler verdient sein Geld als Anwalt in der eigenen Kanzlei und De Ridder als Beraterin im universitären Umfeld. Insgesamt haben nur ein Fünftel der Bundestagsabgeordneten ein Nebeneinkommen angegeben.

Stufenproblem: So bald man anfängt mit der Höhe der Nebeneinkünfte zu arbeiten, stößt man schnell auf ein Problem. Da nur Einkommensstufen angegeben sind, weiß man nicht genau wie viel der einzelne Abgeordnete eigentlich verdient. Es macht als Sinn, erstmal den unteren Grenzwert des Intervals für die Berechnung heranzuziehen. Für die Stufe 4, nehmen wir als ein Einkommen von 15.001 € an Damit lässt sich schon mal grob rechnen und kann sich sicher sein, dass man niemand ein zu hohes Nebeneinkommen anhängt.

Wer es nicht mehr vor Augen hat, das sind die einzelnen Einkommensstufen:

  • Stufe 1: 1.000 bis 3.500 €
  • Stufe 2: über 3.500 € bis 7.000 €
  • Stufe 3: über 7000 € bis 15.000 €
  • Stufe 4: über 15.000 € bis 30.000 €
  • Stufe 5: über 30.000 € bis 50.000 €
  • Stufe 6: über 50.000 € bis 75.000 €
  • Stufe 7: über 75.000 € bis 100.000 €
  • Stufe 8: über 100.000 € bis 150.000 €
  • Stufe 9: über 150.000 € bis 250.000 €
  • Stufe 10: über 250.000 €

Wenn wir aber mehrere Personen miteinander vergleichen wollen, reicht der untere Grenzwert nicht mehr aus. Dummerweise hat aber die Stufe 10 keinen oberen Grenzwert. Das heißt man weiß nicht, ob die Spitzenverdiener nur 250.001 € bekommen oder, überspitzt gesagt, 250.000.000 €. In meinem Diagramm habe ich versucht die nach offenen Intervalle durch einen Verlauf am oberen Ende des Balkens deutlich zu machen.

nebeneinkuenfte-topverdiener
Spitzenverdiener im Bundestag, Nebeneinkünfte in Intervallen

Auch wenn man nicht genau weiß, was Gauweiler, Stegemann, Michelbach und Harbarth tatsächlich verdienen, man kann davon ausgehen, dass es eine ganz schöne Summe ist. Ob da wohl noch Zeit für die Erfüllung des Bundestagsmandats bleibt? Hier lohnt es sich bestimmt noch mal genauer hinzuschauen.

Auch wenn man versucht die gesamten Nebeneinkünfte der einzelnen Fraktionen zu visualisieren, stößt man auf das Obergrenzenproblem. Auch hier bleibt einem nur in der Darstellung transparent zu machen, dass bei der Union das maximale Einkommen nach Oben hin offen ist.

nebeneinkuenfte-summe
Relative Nebeneinkünfte der Fraktionen pro Sitz (links) und einmal gesamt (rechts)

Das Ergebnis ist in meinen Augen eindeutig, obwohl wir nur ungefähre Intervalle angeben können. Die CDU/CSU-Fraktion hat sowohl absolut als auch relativ die höchsten Nebeneinkünfte. Ob die Nähe zur Wirtschaft gut ist, sei dahin gestellt. Für die Zukunft wäre es schön, ein noch feineres Stufenmodell zu haben. Zu dem sollte es keine Stufe 10 geben, welche nach oben hin offen ist. Im Vergleich zum vorherigen 3-Stufen-Modell ist aber auch das jetzige 10-Stufen-Modell schon eine große Verbesserung.

Interessant auch zum Weiterlesen: https://www.abgeordnetenwatch.de/blog/nebeneinkuenfte2014

Beitrag teilen:

Lobbyliste: Adressen direkt in Google Docs geocodieren

Wenn man eine Datensatz mit vielen Adressen hat, muss man diese manchmal von Hand geocodieren. Geocodieren heißt in diesem Fall, dass man jedem Ort Koordinaten zuweist.

Beispiel:
Adresse: Deutscher Bundestag, Platz der Republik 1, 11011 Berlin
Koordinaten: 51.1758057 Nord (Breitengrad = Latitude), 10.4541194 Ost (Längengrad = Longitude)

Manche Dienste (Google Fusion Tables, CartoDB usw.) bieten diesen Dienst schon von Haus aus an. Doch oftmals gibt es für nicht-zahlende Benutzer Beschränkungen. In meinem Beispiel versuche ich die Lobbyliste des Bundestags mit über 2000 Adressen zu geocodieren. Mit meinem kostenlosen CartoDB-Account könnte ich zum Beispiel nur 100 Adressen gecodieren.

Ich schreibe gerade noch eine Anleitung, wie ich das PDF in eine Tabelle umgewandelt habe. Diese werde ich in Kürze hier verfügbar machen. Soweit kann ich euch verraten: PDFs in Tabellen umzuwandeln ist kein Spaß 😉
geocode-01-data

Als ersten Schritt muss man ein Skript kopieren, dass wir später in Google Docs einfügen. Das JavaScript findet sich hier und wurde vom Kartendienstleister MapBox entwickelt. Einfach alles markieren und kopieren.

Nun muss man den Skripteditor öffnen…
geocode-03-scripteditor

… und den kompletten, bisher bestehenden Code function() {} mit dem eben kopiertem Code ersetzen. Außerdem muss man oben in der Titelzeile, wo noch Unbenannt steht, als Titel geo eintragen. Nach einem Klick auf Datei > Speichern kommt man wieder zur Tabelle zurück.
geocode-04-insertcode

Jetzt dürfte in der Menüleiste neben Hilfe noch ein weiterer Reiter Geo auftauchen. Ist das nicht der Fall, einfach die ganze Seite neu laden. Wenn der Reiter Geo jetzt auftaucht, können wir mit dem Geocodieren beginnen. Einfach im Reiter Geo > Geocode adresses auswählen. Nun muss das Skript einmalig autorisiert werden.

geocode-06-authorise

Nach der Autorisierung muss man in der Tabelle die Spalten auswählen, welche man geocodieren möchte. In unserem Fall ist das Adresse und Postleitzahl. Nun kann man nochmals auf Geo > Geocode adresses gehen. Es sollte nun das Geocodieren-Fenster aufgehen.

geocode-07-service

Unter Geocoding service kann man zwischen mapquest, yahoo und cicero auswählen – Bei mir funktionierte jedoch nur mapquest ohne API-Key. Mit einem Klick auf Geocode geht’s los. Bei mir hat das Geocodieren etwa ein dreiviertel Stunde gedauert.

geocode-08-done

Was sofort auffällt ist, dass da Geocoding-Skript der Tabelle drei neue Spalten hinzugefügt hat: geo_latitude, geo_longitude und geo_accuracy. Die ersten beiden Werte sind die Koordinaten, der dritte Wert gibt die Genauigkeit an.
geocode-09-columns

Manchmal kommt es vor das eine Adresse nicht geocodiert wurde. Bei mir war das zum Beispiel bei Adressen der Fall, bei denen ein Postfach angegeben wurde. Diese Adressen habe ich einfach noch mal geocodieren lassen, diesmal aber nur die Postleitzahl und der Ort. Die Genauigkeit der Geocodierung fällt in diesem Fall auf city, was aber für meine Visualisierungsidee vollkommen ausreicht.

Die Visualisierung habe ich in CartoDB gemacht. Wie man ein solche Cluster-Visualiserung macht, werde ich ein anderes Mal erklären.

geocode-10-visualize

Die vollständige Visualisierung findet ihr hier, den vollständigen Datensatz im Google Drive gibt es hier. Die Tabelle ist noch nicht perfekt und es fehlen noch einige Felder. Ich werde versuchen, dass noch besser hinzubekommen.

Sagt mir Bescheid wie ihr mit der Anleitung klar kommt.

Viel Spaß beim Experimentieren!

Beitrag teilen: