Automatisierte Fußball-Fehler

Aus der Tiefe des Maschinenraumes

Auch Spielberichte aus den Niederungen des Amateurfußballs, also abseits von Bundesliga und Champions League, gehören seit einiger Zeit zum Standard-Repertoire in den Online-Auftritten von „Welt“, „Kicker“ und Co. – weil eben auch die unteren Ligen ein Millionenpublikum ansprechen. Es ist ein Markt, der Werbeeinnahmen verspricht und bespielt werden will.

Totale eines Fußballplatzes, links steht der Schiedsrichter in der Spielfeldmitte, rechts die Mannschaft im Kreis.
Entscheidend is‘ aufm Platz! Foto: nichtalex / CC BY 2.0 / beschnitten

Schon wenige Minuten nach Abpfiff klicken sich die Fußball-Nerds der Republik an ihren Smartphones und Laptops die Finger wund, nur um zu erfahren, wie ihr vom Fußballgott verstoßener Lieblingsclub es mal wieder in der Nachspielzeit vergeigt hat. Vor drei Wochen, am Abend des 24. April, bekamen die Fans zum Beispiel dies zu lesen:

„Der Wuppertaler SV trennte sich an diesem Mittwoch von der Zweitvertretung von Borussia Dortmund mit 0:0. Wer im Aufeinandertreffen die Nase vorn haben würde, war vorab schwer auszumachen. Die Ausgeglichenheit der beiden Mannschaften zeigte sich letztlich im Endergebnis. (…) Der Unparteiische setzte mit dem Halbzeitpfiff dem torlosen Treiben auf dem Feld vorläufig ein Ende. Nach torloser erster Halbzeit gab es auch nach Wiederanpfiff keine Treffer zu bewundern. Die Teams trennten sich am Ende mit einer Nullnummer voneinander.“

Veröffentlicht hat den Bericht unter anderem welt.de, und glaubt man ihm, gab es im altehrwürdigen Stadion am Wuppertaler Zoo den erwartbar ausgeglichenen wie zähen Kick mit einem letztlich wohl gerechten Ergebnis – und natürlich hätte es „genauso gut umgekehrt ausgehen können“ (Heribert Faßbender). Auch sprachlich ist der Text ganz solides Handwerk, inklusive der im Fußball-Journalismus üblichen Plattitüden. So weit, so unspektakulär.

„Kollege Computer“ und das „tiefe Geläuf“

Doch die Geschichte hatte ein Nachspiel – weil es kein Spiel gab, zumindest keins, das in die offizielle Wertung einging. Der Unparteiische hatte die Partie bereits nach elf Minuten abgebrochen: Hagel und Starkregen hatten das „tiefe Geläuf“ unbespielbar gemacht, und wegen des Gewitters konnte die „Unversehrtheit von Spielern und Zuschauern nicht mehr gewährleistet werden“. So formuliert es, in bestem Behördendeutsch, der zuständige Verband.

Dass wenige Minuten nach Abpfiff dennoch ein scheinbar offizieller Spielbericht veröffentlicht wurde, sorgte für Verwirrung, in Internet-Foren und natürlich im Bergischen Land, wo die leidgeplagten Anhänger des Wuppertaler SV zu Hause sind: „Immer mehr Nachrichtenredaktionen verwenden aus Kostengründen vom Computer erstellte Berichte“, klagte etwa die Redaktion von wuppertal-total.de. „Dass der Schuss auch nach hinten losgehen kann“ zeige der falsche Bericht über das abgebrochene Spiel. „Kollege Computer“ habe sich „sogar noch eine Wertung dazu einfallen“ lassen.

Mit etwas Verzögerung löschte welt.de den Text am folgenden Tag. In der Tat war es ein automatisch generierter Text – von einem Programm namens „rtr textengine“. Entwickelt wurde die Software von Sportplatz Media in Kooperation mit der Berliner Textroboter-Firma retresco.

„100% automatisch generiert“: Eigenwerbung der Sportplatz Media GmbH

Die Texte basieren nach Darstellung der Unternehmen auf „strukturierten Daten“ wie Spielberichtsbögen und anderen Liga-, Spiel- und Vereinsdaten, die von Verbänden, Vereinen und Redaktionen erstellt werden. Einer der Lieferanten ist fussball.de, ein Portal, das vom DFB betrieben wird. Kunden sind vor allem Online-Medien wie eben „Welt“ oder „Kicker“ – der über den Olympia-Verlag mit 25,1 Prozent an Sportplatz Media beteiligt ist.

Aber wie kam es zu dem Fehler? Dirk Hellmann, der bei Sportplatz Media die Abteilung Digitale Projekte leitet, sagt: „Beim Datenlieferanten fehlte im Datenpaket der Hinweis darauf, dass das Spiel abgebrochen wurde.“ Anstelle des Hinweises „Abbruch“ sei das Ergebnis „0:0“ geliefert worden. Der Fehler könne irgendwo in der Übermittlungs-Kette liegen, auch ganz am Anfang: beim Schiedsrichter, der diese Daten eingibt.

Der human factor – beziehungsweise der fehlende

„Würde der Schiedsrichter einen falschen Torschützen eingeben, würde im Text auch ein falscher Torschütze genannt werden“, sagt Hellmann. Entsprechend habe die textengine die reinen Spieldaten als Grundlage genutzt. Die fehlerhaften Daten seien dann automatisch „vertextlicht“ und vor Veröffentlichung nicht noch mal durch einen Redakteur kontrolliert worden. Der falsche Spielbericht ging dann automatisch online. Der human factor also – beziehungsweise der fehlende.

„Seit längerem experimentiert ‚Welt‘ mit computergenerierten Texten in der Fußballergebnis- und Börsenberichterstattung“, erklärt die „Welt“ auf Anfrage von Übermedien. „Tausende Artikel“ habe man bereits „computerbasiert publiziert“ – „die Zahl der dabei aufgetretenen Fehler“ sei „im Vergleich dazu kaum messbar“.

„Die Ergebnisberichterstattung läuft nach vorgegebenem Muster basierend auf einer Datenbank – da ist beim Fußball nach gegenwärtigem Stand kein Abbruch wegen Starkregens vorgesehen, da dies extrem selten passiert“, so die „Welt“. Man arbeite aber mit dem Dienstleister daran, „die computergenerierte Berichterstattung permanent zu verbessern.“

Rhetorisch eher Blutgrätsche als Tiki-Taka

Bis dahin müssen die eh schon gebeutelten Anhänger und Vereine des Amateurfußballs also mit den Kollateralschäden leben, die durch Unwetter und andere unvorhersehbare Ereignisse verursacht werden. Was sie nicht unbedingt amüsiert. In einem Forum schreibt ein Fußball-Fan:

„Ist das nicht eher traurig? In den ‚unteren‘ Spielklassen besteht die Berichterstattung oft nur aus irgendwelchen Textbausteinen. Dann sollte man es doch lieber bleiben lassen.“

Zumindest ein Teil der Fußball-Fans hat sich aber inzwischen an Texte gewöhnt, die aus der Tiefe des Maschinenraumes kommen. Rhetorisch erinnern sie oft, nun ja, eher an Blutgrätsche als an Tiki-Taka. Wie zum Beispiel dieser Bericht über das 1:6 von Rot Weiß Oberhausen gegen die U23 des 1.FC Köln:

„Hängende Köpfe bei den Platzherren von Rot-Weiß Oberhausen, die gegen den Underdog überraschend den Kürzeren zogen. (… ) Der dritte Streich des Gastes war Vincent Geimer vorbehalten (33.). (…) Die Geißböcke dominierten den Gegner zur Pause nach Belieben und gingen mit einer deutlichen Führung in die Kabine.“

Tja, wohin auch sonst? Dass der „Underdog“ ganz nebenbei auch das Maskottchen der Oberhausener ist, hat der Computer nicht im Repertoire, wohl aber (hoffentlich), wie das Spiel verlief – und natürlich, wie das Maskottchen der Kölner heißt. Je höher die Spielklasse ist, kann textengine auch noch auf historische Daten und Informationen wie die offizielle Zuschauerzahl zurückgreifen, was neben der Einordnung des Ergebnisses auch einen szenischen Einstieg ermöglicht: Der „Angstgegner“ siegt im „Hexenkessel“ – mal wieder.

„Souveräner Dreier“ mit der Textengine. Screenshot: Retresco

Das Angebot kann also durchaus als nette Ergänzung zu den Online-Statistiktools und Taktikhöllenmaschinen der modernen digitalen Fußballwelt gesehen werden. Und im überhitzten Markt scheinen die automatisch erstellten Berichte mittlerweile einen derart hohen Stellenwert zu haben, dass sie für die nötigen Klickzahlen sorgen.

Dass die Maschine (noch) kein wirkliches Sprachgefühl hat und je nach Spielverlauf relativ wahllos aus einer Handvoll vorgegebener Formulierungen und Floskeln auswählt, unterscheidet sie allerdings kaum von ihren menschlichen Kollegen. Beim so genannten Fachmagazin „Kicker“ oder dem Branchenführer „Sportbild“ sind seit Jahrzehnten Redakteure am Ball, denen keine Stanze zu peinlich ist. Stilblüten wie das durchaus doppeldeutig zu verstehende „Ein Tor würde dem Spiel gut tun“ oder „Foul ist, wenn der Schiedsrichter pfeift“ (oder der Redakteur tippt), sind eher die Regel als die Ausnahme.

Licht am Ende des Spielertunnels

Beim Fußball gibt es bekanntlich „keinen Schönheitspreis zu gewinnen“, beim Schreiben darüber wohl auch nicht. Letztlich müssen eben nicht nur die Spieler „über den Kampf zum Spiel finden“. Fußball bleibt „reine Kopfsache“ und „jedes Spiel beginnt bei Null“ – manchmal endet es auch dort. Und nicht nur „hinten brennt es lichterloh“, wie man dem „Kicker“-Bericht über das Revier-Derby Borussia Dortmund gegen den FC Schalke 04 entnehmen kann:

„Die Borussia lief gegen das Abwehrbollwerk des aufopferungsvoll kämpfenden Kontrahenten immer wieder an, sich aber ein ums andere Mal fest. (…) Favre brachte Alcacer für Delaney (56.), noch mehr Offensivdruck sollte es nun richten für die Hausherren. Doch der Schuss ging komplett nach hinten los. Erst grätschte Reus Serdar von hinten in die Parade, Zwayer zückte die Rote Karte (60.). Weil Caligiuri den fälligen Freistoß aus 25 Metern traumhaft in den Winkel verwandelte, wurde die Borussia doppelt bestraft – 3:1 (62.). (…)

(…) Irren fünf Minuten setzte dann Wolf die Krone auf, die Nerven schienen blank zu liegen: Wieder Serdar war im Mittelfeld Leidtragender eines Tacklings von hinten, folgerichtig schickte Zwayer auch den Rechtsverteidiger mit glatt „Rot“ vom Platz (65.). (…) Die Stevens-Schützlinge ließen mit dem Zwei-Tore-Vorsprung und der doppelten Überzahl im Rücken den Ball zirkulieren, wollten die Partie locker zu Ende spielen.“

Ähnlich die Analyse des 6:1 von Bayer Leverkusen über Eintracht Frankfurt:

„Bayer erwischte einen Traumstart: Brandt schickte Aranguiz links auf die Reise“ doch „Postwendend war die SGE zurück im Spiel. (…) Die Rheinländer ließen nicht locker, Frankfurt fand weiterhin überhaupt keinen Zugriff. Ein Doppelschlag sorgte für den Pausenstand.“

Das Licht am Ende des Spielertunnels sucht man hier vergeblich, denn: Rhetorisch befinden sich Mensch und Maschine längst auf Ballhöhe – mindestens. Und wenn man ehrlich ist, sind dröge Maschinentexte über Nichtspiele immer noch besser als die seit Jahrzehnten immer gleichen personalisierten Nachdreher vom Fußball-Boulevard bis zum Sportteil der „Süddeutschen“, in denen die Spiele kaum noch oder nur am Rande vorkommen. In diesem Sinne:

„Als die Meisten sich mit dem gerechten Unentschieden abgefunden hatten und mit ihren Gedanken bereits in der Kabine waren, schlugen die Hausherren eiskalt zu.“

Übrigens: Das abgebrochene Spiel in Wuppertal wurde am 8. Mai nachgeholt. Der Wuppertaler SV verlor zu Hause mit 0:3 gegen Borussia Dortmund II. Bisher wurde jedenfalls nichts Gegenteiliges automatisch überliefert.

8 Kommentare

  1. Beim Fußball geht’s noch, im Finanzbereich wird die automatisierte Form der „Berichterstattung“ deutlich schwieriger. Schlagzeile heute bei Focus Money Online: „E.on mit 5,8 Prozent Verlust im Sturzflug“ – „Das Wertpapier des Gasversorgers E.on gehörte mit einem Minus von 5,8 Prozent zu den Verlustbringern des Tages.“

    Das klingt nach „dringendst verkaufen“ – nur, dass die Textomatic die Begriffe „Hauptversammlung“ (gestern) und „Dividendenabschlag“ (heute) mit nicht einem Wort erwähnt. Das Kursverhalten ist also vollkommen normal, wird aber nicht ansatzweise eingeordnet. *Das* ist fahrlässig, dagegen ist eine automatisierte Fußballberichterstattung ein Witz…

  2. @Jena

    Wer nur aufgrund eines Artikels auf Focus money seine Aktien abstößt, sollte das mit dem Spekulieren vielleicht lieber ganz lassen.

    Insofern ist das für mich eine Ebene mit den Fussballberichten und ganz sicher nicht fahrlässig…

  3. @ichbinich

    Fahrlässig ist die Spekulation basierend auf einer einzigen Quelle ohne weitere Überprüfung sicherlich (ist zu hoffen, dass automatisierte Entscheidungssysteme in dem Bereich das auch wissen ;-) ), um meinen Standpunkt in diesem Punkt aber nachzuschärfen: Die Fußballnachberichterstattung dient m.E. (als Nicht-Fan) der Unterhaltung, die Börsenberichterstattung hingegen dezidiert nicht. Somit sind es zwei unterschiedliche Ebenen mit sehr unterschiedlicher Erwartung an die Akkuratesse der jeweiligen Berichte.

  4. Mich lässt dieser Text an das Buch „Denkmaschinen“ von Walter R. Fuchs denken. In einigen Kapiteln dieses Buchs wird Sprache (laut Ludwig Wittgenstein das „Vehikel des Denkens“) auf ihre Informationsgehalt untersucht. [*]

    In diesem Buch gibt es ein Beispiel, in dem eine Oma ihrem Enkel schreiben möchte, daß sie ihn an einem bestimmten Tag besuchen kommt, und daß sie zu einer bestimmten Zeit am Münchner Hauptbahnhof abgeholt werden möchte. Sie möchte diese Nachricht als Telegramm abschicken und deshalb möglichst wenig Worte brauchen.

    Auf der Frage nach dem Informationsgehalt dieser Nachricht wird sie (die Nachricht, nicht die Oma) immer weiter eingedampft, bis schließlich nur noch die Uhrzeit übrigbleibt. Daß es die Oma ist, die zu Besuch kommt, ergibt sich aus dem Absender. Der konkrete Tag ergibt sich aus dem Datum der Nachricht und der Tatsache, daß es ein Telegramm ist (also dringend). Daß die Oma am Hauptbahnhof ankommt, ergibt sich daraus, daß sie nichts anderes schreibt. Daß sie abgeholt werden möchte, ist selbstverständlich. Und ein Blick ins Kursbuch bestätigt, daß die (krumme) Uhrzeit zur Ankunft eines Zuges passt.

    Und so frage ich mich hier: Was ist denn der Informationsgehalt so eines automatisch generierten Spielberichts? Wenn der Algorithmus keine anderen Informationen zu dem konkreten Spiel hat als das Halbzeit- und das Endergebnis, was sollen dann die textuellen Formulierungen? Man könnte doch den Spielbericht wieder eindampfen auf das Halbzeit- und das Endergebnis und hätte keinerlei Informationsverlust. Warum druckt man statt dessen einen Prosa-Text? Nur, um Papier vollzubekommen?

    [*] http://www.2n-1.de/denkmaschinen.html
    Das von mir genannte Beispiel des Telegramms von der Oma steht auf den Seiten 70 und 71.

  5. @Daniel Rehbein

    „Wenn der Algorithmus keine anderen Informationen zu dem konkreten Spiel hat als das Halbzeit- und das Endergebnis, was sollen dann die textuellen Formulierungen?“

    Erstens sind die Leser ja Menschen und die haben typischerweise ein Bedürfnis nach Text anstelle von reinen Informationen.
    Zweitens hat der Algorithmus ja aber auch viel mehr Informationen. Z. B. dass Mannschaft 1 bisher immer gegen Mannschaft 2 verloren hat („angstgegner“), eine Mannschaft 5 Spiele in Folge gewonnen hat („hat einen Lauf“) etc.
    Außerdem gibt es teilweise auch ticker zu den einzelnen Spielen, bei denen sich der Algorithmus bedienen kann (die natürlich von Menschen gefüttert werden).

    Es gibt also einiges mehr als nur Informationen zu überliefern. Sonst bräuchte man nämlich auch nicht so einen Bericht lesen sondern kann direkt das Ergebnis nachschlagen.

  6. Kritisch wird es, wenn der Textalgorithmus Sachen dazudichtet. War das 0:0 ein packender aber torloser Fight oder nur ein müdes hin und her Gekicke? Torlosen Treiben spricht für letzteres.
    Dann doch bitte nur die reinen Ergebnisse.

  7. @Mirco

    Ja, natürlich. Aber ich weiß nicht, ob der Algorithmus das dazu dichtet oder es aus anderen Quelle zu holt (z. B. abgegebene Torschüsse o. Ä.). Wissen Sie es?
    (Die Frage stellt sich übrigens auch bei Artikeln von Menschen. Oder meinen Sie, die Redakteure schauen sich jedes Kreisligaspiel live an, von dem sie berichten?)

Einen Kommentar schreiben

Mit dem Absenden stimmen Sie zu, dass Ihre Angaben gemäß unseren Datenschutzhinweisen gespeichert werden. Ihre E-Mail-Adresse wird nicht veröffentlicht.