Grafik mit den Teilen des Programmcodes: Für die Landtagswahl in Sachsen-Anhalt werden automatisiert 218 Gemeindeartikel und 41 Wahlkreisartikel mit den Ergebnissen erstellt.
Für die Landtagswahl in Sachsen-Anhalt werden automatisiert 218 Gemeindeartikel und 41 Wahlkreisartikel mit den Ergebnissen erstellt. Bildrechte: MITTELDEUTSCHER RUNDFUNK

Landtagswahl in Sachsen-Anhalt 2021 Warum wir automatisierte Wahlberichte für Gemeinden und Wahlkreise anbieten

05. Juni 2021, 17:47 Uhr

Wie wird in Flecken Diesdorf gewählt? Welche Kandidatin, welcher Kandidat erhält das Direktmandat im Wahlkreis Merseburg für den neuen Landtag? MDR SACHSEN-ANHALT bietet zur Landtagswahl zum ersten Mal automatisierte und damit regionalisierte Wahlberichte an. Damit können wir Artikel zu Wahlergebnissen erstellen und den ganzen Abend bis zum vorläufigen Ergebnis der Wahl aktualisieren – für 218 Gemeinden und 41 Wahlkreise.

In vielen Wahlberichten zur Landtagswahl am 6. Juni wird Ihnen auf den Seiten des MDR folgender Satz begegnen: "Dieser Text wird automatisiert erstellt und redaktionell ergänzt. Grundlage sind die Veröffentlichungen der Landeswahlleiterin auf den Seiten des Statistischen Landesamtes."

Was heißt das konkret? Was wird veröffentlicht und woher kommen die Inhalte für die Beiträge? Sind bei diesen Beiträgen keine Journalistinnen und Journalisten mehr beteiligt? Im Folgenden stellen wir Ihnen unser Konzept der automatisierten Wahlergebnisberichte vor.

Im folgenden Text lesen Sie, was wir gelernt haben und warum wir den Code veröffentlichen – für uns und für andere Redaktionen, die ähnliches vorhaben.

Was automatisierte Berichte bedeuten

Wenn die Wahllokale geschlossen sind und die Auszählung der Stimmzettel beginnt, veröffentlicht die Landeswahlleiterin in Sachsen-Anhalt in regelmäßigen Abständen auf den Seiten des Statistischen Landesamtes die Zwischenstände und später die vorläufigen Ergebnisse. Diese Daten, die für Computer maschinenlesbar zu Verfügung gestellt werden, sind die Grundlage für alle Grafiken und Informationen an einem Wahlabend.

Schon jetzt arbeitet MDR SACHSEN-ANHALT mit diesen Daten. Auch bei den Landtagswahlen in Sachsen und Thüringen hat der MDR zusammen mit der Agentur 23 degrees die Ergebnisse in Karten und Diagrammen visualisiert.

Durch die Zusammenarbeit mit ida, der neuen Innovations- und Digitalagentur von MDR und von ZDF Digital, haben sich für diese Landtagswahl für die Redaktion noch einmal neue Möglichkeiten ergeben. Nun können wir die Daten der Landeswahlleiterin nicht nur für Grafiken und zur Information der Redakteurinnen und Redakteure nutzen, sondern damit auch Text erzeugen und Artikel schreiben.

Mehr Zeit für Analyse und Reportagen

Keine Journalistin, kein Journalist muss dadurch 218 Artikel zu den Gemeindeergebnissen und 41 Berichte über die Wahlkreise schreiben, die immer – so wie bei den Wahlgrafiken – ähnlich aufgebaut sind. Damit bleibt uns mehr Zeit für die Analyse, für Gespräche und Reportagen.

Und wenn man ehrlich ist, manche Aufgaben können Computer besser erledigen als Menschen – vor allem, wenn es um große Mengen an Daten und schnelle Vergleiche geht. Das machen wir uns in diesem Fall zunutze – etwa bei Vergleichen zur Wahlbeteiligung, zur vergangenen Landtagswahl oder bei deutlichen Abweichungen zum Abstimmungsverhalten der Wählerinnen und Wähler.

Mit künstlicher Intelligenz oder dem sogennannten maschinellen Lernen haben die automatisierten Wahlberichte auf den Seiten von MDR SACHSEN-ANHALT aber nichts zu tun. Es sind Texte, die auf bestimmten Regeln beruhen und sich an redaktionell geschriebenen Textbausteinen bedienen.

Zu den automatisierten Artikeln

Grafik zur Landtagswahl 2021, Gemeindeergebnisse
Mindestens 83 Abgeordnete ziehen nach der Wahl am 6. Juni 2021 in den achten Landtag in Sachsen-Anhalt ein. Bildrechte: MDR

Wie die Artikel aufgebaut sind

Die 218 Gemeindeartikel und 41 Beiträge zu den Wahlkreisen werden in unterschiedlichen Zuständen veröffentlicht – einmal vor der Wahl mit allgemeinen Informationen, ab 18 Uhr am Wahlsonntag mit ersten Auszählungen und später zum Ende der Wahlnacht, wenn alle Abstimmungsergebnisse vorliegen.

Bei den Wahlkreisartikeln ist die wichtigste Information, welche Direktkandidatin und welcher Direktkandidat gerade in den Auszählungen führt. Für die jeweiligen Politikerinnen und Politiker werden redaktionell erstellte und journalistisch bewertete Zusatzinformationen, wie derzeitige Position im Landtag oder Hintergrundinformationen zum Wahlkreis, an die entsprechende Stelle eingefügt.

Danach werden die für einzelne Wahlkreise weniger wichtigen Zweitstimmen und einige andere interessante Zusatzinformationen dargestellt. Außerdem führen wir die Gewinne und Verluste der Parteien im Verhältnis zur Wahl 2016 auf, vergleichen das Abstimmungsverhalten in der Gemeinde oder im Wahlkreis mit dem Landesergebnis und ordnen die Wahlbeteiligung ein.

Was Erst- und Zweitstimmen bedeuten

Sachsen-Anhalt hat 41 Wahlkreise. Die Bewerberinnen und Bewerber um ein Direktmandat für den Landtag werden mit der Erststimme und mit einfacher Mehrheit gewählt. Mit der Erststimme wählt man eine konkrete Person. 41 auf diesem Wege direkt gewählte Politikerinnen und Politiker ziehen in das Landesparlament ein.

Mit der Zweitstimme wird eine Partei gewählt und bestimmt, wie viele Sitze eine Partei im Landtag erhält – wie stark also eine Partei im Landtag ist. Die Abgeordneten ziehen über die Listenplätze ihrer Parteien in den Landtag ein, wenn die Partei mehr als fünf Prozent erreicht hat. Die Plätze werden so verteilt, dass sie verhältnismäßig den Zweitstimmen entsprechen. In dem neuen Landtag sind mindestens 83 Politikerinnen und Politiker vertreten.

Mehr über das Wahlsystem in Sachsen-Anhalt erfahren Sie hier auf den Seiten der Landeswahlleiterin.

Die Visualisierungen der Agentur 23 degrees ergänzen die Artikel entsprechend: Ergebnisse der Direktkandidatinnen und -kandidaten, Zweitstimmen, Gewinne und Verluste bei den Zweitstimmen.

Die Gemeindeartikel folgen der gleichen Logik – hier sind jedoch die Zweitstimmenergebnisse die relevanteren Informationen.

Die Texte werden je nach vorliegenden Daten, alle zehn bis 15 Minuten aktualisiert.

Wie wir vorgegangen sind

Die wichtigsten Elemente für die automatisierten Berichte sind: Wahldaten, Textbausteine und eine Artikelstruktur.

Die Textbausteine werden mit den Wahlergebnissen befüllt. Beispielsweise reicht es manchmal aus, die Daten der Landeswahlleiterin in einem bestimmten Satz zu ergänzen (Beispiel: "Die Wahlbeteiligung liegt bei X Prozent").

Screenshot des Skriptes für die automatisierte Wahlberichterstattung
Codezeilen in einem Skript für die automatisierte Wahlberichterstattung in Sachsen-Anhalt Bildrechte: MDR/ida

Es gibt aber auch Fälle, die mehr Vorarbeit benötigen. Im Text wird, je nachdem, ob eine Partei gewinnt oder verliert, die Satzstruktur variiert (Beispiel: "Im Vergleich zur Landtagswahl 2016 ist das ein Gewinn, ein Verlust von X Prozent").

Ein anderer Fall: Liegt der Gewinn oder Verlust über einem bestimmten Wert, wird aus Gewinn sogar ein deutlicher Gewinn. Damit können den Leserinnen und Lesern trotz Automatisierung redaktionelle Einschätzungen der Wahlergebnisse geben werden. Diese sogenannte Gewichtung wurde vorab von erfahrenen Politikjournalisten festgelegt.

In einem weiteren Entwicklungsschritt werden die Textbausteine auf grammatikalische Fehler überprüft und gegebenfalls angepasst. Die Programmierung folgt beispielsweise Fragen wie: Sind die Verben in Sätzen, in denen die Linken, Grünen oder Freien Wähler vorkommen, auch im Plural geschrieben (Beispiele: "Auf Platz zwei kommen die Grünen" und "Auf Platz zwei kommt die CDU")? Wird die weibliche Form für Direktkandidatinnen verwendet ("Der Direktkandidat XY gewinnt die meisten Erststimmen. Er kommt auf X Prozent" und "Die Direktkandidatin XY gewinnt die meisten Erststimmen. Sie kommt auf X Prozent")?

Hintergründe und Aktuelles zur Landtagswahl – unser multimediales Update

In unserem Update zur Landtagswahl in Sachsen-Anhalt geben unsere Redakteure einen Überblick über die wichtigsten politischen Entwicklungen – und ordnen sie ein.

#LTWLSA – das multimediale Update zur Landtagswahl – immer freitags per Mail in Ihrem Postfach. Hier können Sie das Update abonnieren.

Flexibel programmieren durch Trennung von Text und Struktur

Wenn diese Schritte erledigt und die Textbausteine fertig sind, werden sie in die Artikelstruktur eingebaut.

Diese Trennung von Textbausteinen und Artikelstruktur ermöglicht es, flexibel Textabschnitte zu ändern, korrigieren oder zu ersetzen. Relevant ist diese Vorgehensweise vor allem für die unterschiedlichen Auszählungs- und damit auch Artikelzustände: Vorwahl, Zwischenergebnis, vorläufiges Ergebnis.

Zum Beispiel wird am Ende des Wahlabends, wenn alle Stimmen ausgezählt sind und das vorläufige Endergebnis veröffentlicht wurde, aus: "Partei X liegt in der Gemeinde Y vorn" die finale Überschrift: "Partei X gewinnt in der Gemeinde Y".

Neben diesem Grundaufbau des Programmcodes gibt es noch viele Extrainformationen, die in redaktioneller Arbeit recherchiert, überprüft und formuliert werden. Dazu gehören zum Beispiel Informationen zu den Wahlkreisen oder zu den Politikerinnen und Politikern. Diese Information stehen an vordefinierten Stellen in dem Artikel, so dass sie automatisch und mit bestimmten Bedingungen verbunden in dem Text erscheinen.

Zum Abschluss des Prozess werden diese gesamten Daten und Informationen in das Content-Management-System des MDR, also dem Programm, in dem alle Beiträge, Fotos, Audios und Videos angelegt werden, importiert. Dadurch ist es dann möglich, dass die von einem Computerprogramm erzeugten Artikel tatsächlich auf den Seiten des MDR zu sehen sind.

Und welche Programme und Tools nutzen wir, um diese automatisierten Artikel zu erstellen? Zum einen die Programmiersprache Python, die Programmbibliothek pandas für die Datenanalyse und -aufarbeitung, Textblob_de, ein Modul zur Verarbeitung von Text sowie num2words um Zahlen in geschriebene Wörter zu verwandeln.

Wo Sie Fehler melden können

Wir haben die Datensätze und Textstrukturen vorab ausführlich mit Beispieldaten getestet. Trotzdem kann es auf Grund der Komplexität möglich sein, dass sich Fehler einschleichen. Wenn Sie einen Fehler entdeckt haben, dann freuen wir uns, wenn Sie uns einen Hinweis per Mail an data@mdr.de senden.

Martin Paul im Funkhaus von MDR SACHSEN-ANHALT
Bildrechte: MDR/Luca Deutschländer

Über Martin Paul Martin Paul ist Teil des Teams von MDR SACHSEN-ANHALT und begeistert von den Möglichkeiten und Ausdrucksformen des digitalen Journalismus - Daten und Code, Visualisierung und Video, Longread und Ticker, Social-Media und Dialog. Was ihn umtreibt? Besonders die Frage, wie man das Netz frei und offen gestalten und Teilhabe garantieren kann.

Online-Journalismus hat er im Studiengang Multimedia & Autorschaft an der Universität in Halle und bei der Mitteldeutschen Zeitung gelernt. An der Universität in Leipzig hat er Kultur- und Vergleichende Literaturwissenschaft studiert.

Natalie Widmann – Data Science, Natural Language Processing and Machine Learning practitioner
Bildrechte: Natalie Widmann

Über Natalie Widmann Natalie ist Data Scientist bei ida und fasziniert von der Schnittstelle zwischen Gesellschaft und neuen Technologien.

Sie verarbeitet, analysiert und verknüpft Daten, so dass daraus wirkliche Erkenntnisse und manchmal auch maschinelle Lernanwendungen entstehen. Mit einem Fokus auf das sogeannte Natural Language Processing macht Natalie Texte semantisch durchsuchbar oder generiert diese automatisch.

Mehr zum Thema

Die Spitzenkandidaten der sechs großen Parteien zur Landtagswahl, von links nach rechts: Eva von Angern (Die Linke), Cornelia Lüddemann (Grüne), Katja Pähle (SPD), Reiner Haseloff (CDU), Lydia Hüskens (FDP), Oliver Kirchner (AfD)
Die Spitzenkandidatinnen und -kandidaten der sechs großen Parteien zur Landtagswahl Bildrechte: MITTELDEUTSCHER RUNDFUNK

MDR/Martin Paul

Dieses Thema im Programm: MDR SACHSEN-ANHALT – Das Radio wie wir | 06. Juni 2021 | 18:00 Uhr

1 Kommentar

Rychlik am 07.06.2021

Sehr guter Trend das Rechtsextreme "nur" 20,8% bekamen. Das lässt hoffen das Mittel- bzw. Ostdeutschland noch nicht völlig verloren ist. Interessant wäre wieviel Briefwähler wie abgestimmt haben.

Mehr zur Landtagswahl in Sachsen-Anhalt