Die Gesprächspartnerin

Andrea Wolf ist Mitglied im Vorstand der Forschungsgruppe Wahlen. Das Institut führt regelmäßig Umfragen für das ZDF-„Politbarometer“ durch und erstellt Wahlprognosen für das ZDF.
Wen würden Sie wählen, wenn am Sonntag Bundestagswahl wäre? Diese und andere Fragen zur politischen Stimmung in Deutschland stellt die Forschungsgruppe Wahlen regelmäßig für die Sendung „Politbarometer“ im ZDF. Doch wie werden die Befragten eigentlich ausgewählt? Wann ist eine Umfrage repräsentativ? Und kann man statistische Fehler von tatsächlichen Veränderungen bei Zustimmungswerten unterscheiden? Darüber haben wir mit Andrea Wolf, Vorstandsmitglied der Forschungsgruppe Wahlen, gesprochen.
Übermedien: Frau Wolf, die meisten Menschen haben noch nie an einer Wahlumfrage teilgenommen. Trotzdem treffen die Umfragen der Forschungsgruppe Wahlen Aussagen über alle Wahlberechtigten. Wie geht das?
Andrea Wolf: Unser Ziel ist eine repräsentative Umfrage, es müssen also bei jeder Umfrage alle Wahlberechtigten die gleiche Chance haben, von uns befragt zu werden. Das passiert per Zufallsauswahl, die relativ aufwendig ist: Wir machen je eine Stichprobe für Festnetz- und Mobilfunknummern. Für die Festnetzstichprobe werden zufällig eingetragene Telefonnummern ausgewählt, die dann in den letzten drei Ziffern verändert werden, damit auch Anschlüsse, die nicht im Telefonbuch stehen, berücksichtigt werden. Wenn wir mit den Festnetznummern in einem Haushalt mit mehreren Personen landen, sprechen wir immer mit der Person, die als letzte Geburtstag hatte. Bei der Mobilfunkstichprobe werden Nummern zufällig generiert. Das alles ist entscheidend, damit wir hinterher sagen können: Die Umfrage ist repräsentativ.
Andrea Wolf ist Mitglied im Vorstand der Forschungsgruppe Wahlen. Das Institut führt regelmäßig Umfragen für das ZDF-„Politbarometer“ durch und erstellt Wahlprognosen für das ZDF.
Woran erkennt man denn noch, ob eine Umfrage repräsentativ ist?
Das wesentliche Kriterium ist, wie gesagt, die strenge Zufallsauswahl. Es sollten aber immer auch weitere Informationen bei der Veröffentlichung von Umfragen angegeben werden, zum Beispiel der statistische Fehlerbereich. Bei einer Umfrage unter 1.250 Befragten, wie beim „Politbarometer“, liegt der Fehlerbereich bei einem Wert von 40 Prozent für eine Partei bei plus/minus 3 Prozentpunkten, wenn sie 10 Prozent bekommt, liegt er bei plus/minus 2 Prozentpunkten. Dieser Fehlerbereich ändert sich je nachdem, wie viele Menschen befragt werden. Die Stichprobengröße sollte man also auch angeben, genauso wie den Zeitraum, in dem befragt wurde und wie die Umfrage erhoben wurde: Also online oder per Mobilfunk oder Festnetz oder mit einer Kombination daraus. Uns bei der Forschungsgruppe Wahlen ist es wichtig, dass wir die Zufallsauswahl treffen. Bei Online-Umfragen hat man diese Kontrolle nicht, die Teilnehmer und Teilnehmerinnen rekrutieren sich in der Regel selbst.
Aber nur weil ich das alles angebe und eine Zufallsauswahl treffe, sagt das doch noch nichts über die Qualität der Umfrage aus.
Für die Repräsentativität ist tatsächlich allein die Zufallsauswahl entscheidend. Aber natürlich muss eine Umfrage, um verlässliche Aussagen zu generieren, über eine bestimmte Fallzahl verfügen. In der Regel sollten es 1.000 Fälle sein, damit die Fehlerbereiche nicht zu groß sind.
Warum gibt es eigentlich Wahlumfragen?
Wir wollen eine Momentaufnahme erstellen. Wie ist die politische Stimmung gerade? Das ist interessant für alle Menschen, die sich für Politik interessieren. Aber natürlich auch für Politiker und Medien. Zur Frage „Wen würden Sie wählen, wenn am nächsten Sonntag Bundestagswahl wäre?“ veröffentlicht die Forschungsgruppe zwei Werte: die politische Stimmung und die sogenannte Projektion. Die politische Stimmung gibt die Antworten auf die Frage oben wieder und ist oft stark von aktuellen Ereignissen geprägt. Vielleicht ärgert sich der Befragte zum Zeitpunkt der Umfrage gerade über die Partei, die er normalerweise wählt, und gibt sie deshalb nicht an. Wenn er dann aber tatsächlich an der Urne steht und den Stimmzettel ausfüllt, kommt er doch ins Grübeln, weil er eine langfristige Bindung zu der Partei hat. Diese Bindungen an die Parteien und andere Aspekte wie taktische Überlegungen fließen in das Modell der Projektion ein. Die Projektionswerte zeigen, zu welchem Wahlergebnis es käme, wenn am nächsten Sonntag wirklich Bundestagswahl wäre. Das ist die wichtigste Grafik, die im „Politbarometer“ vorgestellt wird.
Die FDP hat z.B. zwischen dem „Politbarometer“ Anfang Dezember und dem Ende Dezember einen Prozentpunkt verloren. Wie aussagekräftig ist das? Könnte das nicht einfach ein statistischer Fehler sein?
Ja, das könnte sein. Diese Unsicherheit gehört zu Umfragen dazu und lässt sich nicht anders lösen. Wir können die Fehlerbereiche nur transparent machen und darauf hinweisen, aber wir können nicht ausschließen, dass es genau da vielleicht zu einem statistischen Fehler gekommen ist. Deshalb muss man bei der Interpretation geringer Veränderungen sehr vorsichtig sein.
Aber beim „Politbarometer“ werden selbst kleine Veränderungen ausgewiesen und damit betont. Dass das auch im Bereich der Fehlertoleranz liegt, steht auf der Grafik selbst nicht.
Das stimmt. Da versuchen wir, Komplexität zu reduzieren. Das Kennzeichnen von Fehlerbereichen in einer Grafik wirkt schnell überladen und in einer Fernsehgrafik kann das Publikum das in der Kürze der Zeit schwer erfassen. In unseren Newslettern und Pressemeldungen zum „Politbarometer“ sind die Fehlerbereiche jedoch immer angegeben. Manche Printmedien, wie die „Süddeutsche Zeitung“, zeigen bei den Projektionen diese Fehlerbereiche häufig mit kleinen grauen Kästchen über der Grafik an. Aber oft gibt es dazu keine grafische Erläuterung, es könnte für die meisten Rezipienten zu verwirrend sein. Deshalb reduzieren wir das bei den grafischen Darstellungen zugunsten der Hauptinformation. Auf der anderen Seite müssen wir aber damit leben, dass es diese Unschärfe gibt.
Wie wird festgelegt, welche Parteien das ZDF im „Politbarometer“ einzeln aufführt?
Die Reihenfolge entsteht durch die Stärke bei der vorangegangenen Wahl. Bei der Umfrage lesen wir die klassischen Parteien einzeln vor. Wenn jemand sagt, dass er eine andere Partei wählen würde, fragen wir nach, welche das ist. Diese Partei wird aber erst in der Projektion ausgewiesen, wenn sie mindestens drei Prozent hat, weil es darunter wegen des statistischen Fehlerbereichs keinen Sinn ergibt.
Beim letzten „Politbarometer“ hatte die Kategorie „Andere“ acht Prozent und damit mehr als jeweils FDP, Linke und BSW, die alle einzeln aufgeführt wurden. Glauben Sie nicht, dass sich dieser Teil der Wähler dadurch ignoriert fühlt?
Doch, das glaube ich schon. Ich kann es nur nicht ändern, weil wir eine genauere Aufschlüsselung eben nicht leisten können. Es gibt so viele Parteien, die bei der Bundestagswahl antreten und auch, wenn die immer nur 0,8 bis ein Prozent haben, kommt man in der Summe dann auf diese neun Prozent. Um über so kleine Parteien Aussagen treffen zu können, müssten wir sehr viel mehr Personen befragen und das sprengt jegliche Kostenrahmen.
Neben der klassischen Sonntagsfrage stellen Sie auch noch aktuelle Fragen. Zum Beispiel, ob man einen Frieden in Syrien für möglich hält oder ob man Waffenlieferungen für die Ukraine befürwortet. Wer entscheidet, welche Fragen da monatlich gestellt werden?
Die Redaktion beim ZDF überlegt sich die Themen, die für das nächste „Politbarometer“ relevant sein können. Wir als Forschungsgruppe Wahlen sind dann verantwortlich für die Formulierung der Fragen. Das ist auch sehr wichtig, weil die Fragen verständlich sein müssen für die Befragten, die ja aus allen Alters-, Bildungs- und weiteren sozialen Gruppen kommen. Die Frage muss deshalb einfach, nicht suggestiv und doch umfassend formuliert sein. Und es müssen alle Antwortmöglichkeiten abgedeckt sein.
Die Forschungsgruppe Wahlen macht nicht nur regelmäßig Umfragen zur politischen Stimmung im Land, sondern liefert auch die Hochrechnungen am Tag der Wahl. Wie werden diese Zahlen ermittelt?
Anders als bei den Umfragen unter Wahlberechtigten, befragen wir für die Prognose nur Wählerinnen und Wähler am Wahltag, die das Wahllokal verlassen und gerade ihre Stimme abgegeben haben. Für die anstehende Bundestagswahl wählen wir gut 400 Wahllokale zufällig aus und befragen je nach der Größe des Wahllokals jeden x-ten Wähler. Bei der letzten Bundestagswahl waren das ca. 40.000 Wählerinnen und Wähler, bei Landtagswahlen sind es im Schnitt ca. 16.000. Das ist eine ganz andere Fallzahl als bei den telefonischen Umfragen im Vorfeld und dementsprechend sind auch die Fehlerbereiche geringer.
Gibt es etwas im Fernsehen, Radio, in Zeitungen oder online, bei dem Sie sich immer wieder fragen: Wieso ist das so? Fragen Sie uns, dann fragen wir Leute, die sich damit auskennen! Schreiben Sie uns!
Briefwähler sind da also gar nicht dabei?
Genau, das ist eine Schwierigkeit beim Erstellen der Prognose, weil wir die Stimmen der Briefwähler schätzen müssen. Aber wir machen das schon viele Jahrzehnte und haben da gute Erfahrungswerte. Wir wissen zum Beispiel, dass die AfD ein besseres Ergebnis an der Urne hat als bei der Briefwahl. Unionsanhänger machen dagegen häufiger Briefwahl. Das hängt auch mit dem älteren Wählerklientel zusammen. All das berücksichtigen wir, wenn wir die Prognose erstellen.
Kam es schon mal vor, dass die Zahlen um 18 Uhr total daneben lagen?
Selten. Aber das passiert schon mal, wenn man bestimmte Effekte nicht richtig einschätzt und sich zum Beispiel bei den Briefwählern verschätzt hat. Es gibt auch andere Effekte, die in die Berechnungen einfließen: In den Umfragen geben zum Beispiel weniger Leute an, die AfD zu wählen, als es die Zahlen nach den Wahlen dann zeigen. Bei der letzten Bundestagswahl war unsere Prognose aber sehr gut, da hatten wir eine durchschnittliche Abweichung von 0,27 Prozentpunkten pro Partei. 2013 lag die Abweichung bei 0,45.
Woran liegt es, wenn Umfragen kurz vor der Wahl noch größere Abweichungen haben?
Manchmal gibt es gerade in den letzten Tagen vor der Wahl nochmal sehr starke Veränderungen. In Brandenburg kündigte Ministerpräsident Dietmar Woidke kurz vor der Wahl an, dass er nur im Amt bleibt, wenn die SPD stärkste Partei bleibt. Das hatte dann natürlich eine Auswirkung und unsere Umfrage in Brandenburg, die wir drei Tage vor der Wahl veröffentlicht haben, hatte eine größere durchschnittliche Abweichung, als wir es sonst gewohnt sind: Bei unserer Umfrage lag die SPD bei 27 Prozent und das Endergebnis war dann 30,9 Prozent. Das ging aber allen anderen Instituten genauso.
Warum macht man die 18-Uhr-Hochrechnungen überhaupt? Ist es nicht das sicherste und einfachste, die Wahl schlicht abzuwarten?
Man möchte einfach möglichst früh wissen, wie es ausgegangen ist. Dieser Wunsch ist so präsent, dass das ZDF sagt: Wir möchten, dass ihr diese Prognose macht.
Wie begleitet die Forschungsgruppe Wahlen die ZDF-Redaktion an einem Wahlabend?
Ein Teil unserer Mitarbeiterinnen und Mitarbeiter sitzt im Studio dabei und berät die Moderatoren der Wahlsendung direkt. Gemeinsam mit der Redaktion stimmen wir im Laufe des Nachmittags zum Beispiel ab, welche Koalitionen relevant sein werden, welche Analyse-Grafiken wir in der Wahlsendung zeigen und auf welche Informationen man verzichten kann, um die Komplexität zu reduzieren.
Haben Wahlumfragen auch einen Einfluss auf das Wahlverhalten?
Das fragen wir immer im ersten „Politbarometer“ nach einer Bundestagswahl. Über die letzten Jahrzehnte haben wir ziemlich konstant 20 Prozent, die angeben, dass Umfragen vor der Wahl für ihre Wahlentscheidung eine Rolle spielten und 80 Prozent, für die das keine Rolle gespielt hat. Das Motiv und die genaue Auswirkung erfragen wir nicht. Es ist aber naheliegend, dass Umfragen vor allem für die Gruppe der taktischen Wähler wichtig sind.
Johanna Bernklau studiert Datenjournalismus in Leipzig und war Autorin für die Medienkolumne „Das Altpapier“ beim MDR. In den Journalismus hat sie durch ein Volontariat bei der „Passauer Neuen Presse“ gefunden. 2022 und 2023 war sie Mitglied in der Jury des Grimme Online Awards. Für Übermedien betreut sie die Serie „Wieso ist das so?“. Wenn Sie ein Thema haben, dem wir mal nachgehen sollten, dann schreiben Sie Johanna Bernklau eine Mail.
Ich hätte da direkt mal einen Wunsch @Übermedien bzw. für diese Interview-Serie: Gleiches Thema, gleiche Fragen mit einer Expertin, welche wissenschaftlich unterwegs ist und nicht für oder bei einer Organisation arbeitet, die Wahlumfragen oder Konsumforschung betreibt.
Irgendwie finde ich solche Umfragen und noch mehr die Berichterstattung darüber zunehmend problematisch. Die Parteienlandschaft wird zunehmend diverser, Umfrageteilnehmer möglicherweise schwerer zu rekrutieren. Letzteres zumindest, wenn man tatsächliche Zufalls-Auswahlen machen möchte. Dazu dreht sich die Medienwelt gefühlt immer schneller. Da hätte ich die Vermutung, dass die „Stimmungslage“ der Befragten/der Bevölkerung sich auch häufiger ändert. Vielleicht auch nicht? Hier fände ich Studien interessant, die sich mit solchen oder ähnlichen Sachen beschäftigen.
Dazu kommt noch die vereinfachte – im meinen Augen häufig unterkomplexe und überspitzte – Kommunikation der Ergebnisse. Nicht nur die „Unschärfen“ werden häufig gar nicht oder nur im Kleingedruckten angegeben. Kleine aufstrebende Parteien haben es schwer. Sie sind nicht sichtbar. Oder nur dann, wenn sie schon sehr bekannte Personen als Anführer:innen haben. Auch sonst nehme ich wahr, dass man selbst bei kleinen Änderungen häufig versucht noch eine Überschrift und/oder Grafik zu erzeugen, die mehr Klicks bringt. Neulich gab es dazu ja auch schon einen Beitrag zur Befragung über die Beliebtheit von Politiker:innen.
Es fehlt die Frage zur „Wählerwanderung“ und warum diese ungenau und deshalb problematisch ist. Trotz der 10.000er-Schritte in der Grafik, die schlussendlich eine scheinbare Genauigkeit vortäuschen sollen.
Das ZDF hatte darauf früher noch verzichtet, macht aber mittlerweile leider bei dem Thema auch mit.
Ich nehme mit: Wirklich aussagefähige Umfragen, die monatliche Verläufe abbilden, sind finanziell nicht darstellbar, weil die festgestellten Änderungen zB bei der „Sonntagsfrage“ in aller Regel innerhalb der Fehlertoleranz liegen. Daher fehlt mir die Frage danach, welchen Erkenntniswert diese Umfragen bieten, die soviele Ressourcen binden.