Auch anscheinend gute Nachrichten müssen hinterfragt werden

Klar, gute Nachrichten kann in Zeiten der Krise jede und jeder gebrauchen. Blöd nur, wenn Medien vor lauter Freude über mögliche Lichtblicke im täglichen Nachrichtenstrom grundlegende Handwerksregeln vergessen. Umso mehr, da doch gerade in allen Redaktionen betont wird, wie sehr man endlich wieder als einordnende und seriös recherchierende Instanz glänzen würde.

Am Donnerstag veröffentlichte der schwäbische Automobilzulieferer Bosch eine Pressemitteilung, in der er einen neuen Covid19-Schnelltest anpreist:

„Mit dem in nur sechs Wochen entwickelten Schnelltest lässt sich bei Patienten eine Infektion mit dem Coronavirus SARS-CoV-2 in unter zweieinhalb Stunden – von der Entnahme der Probe bis zum Ergebnis – feststellen.“

Schließlich sei Zeit im Kampf gegen den Corona-Virus einer der entscheidenden Faktoren, wird Volkmar Denner, Vorsitzender der Bosch-Geschäftsführung in der Mitteilung zitiert; derzeit müssten Patienten mit Wartezeiten von ein bis zwei Tagen rechnen. Der Bosch-Test liefere zudem Ergebnisse mit einer Genauigkeit von 95 Prozent. Wenn das mal nicht toll klingt.

Schlicht die Pressemitteilung wiedergegeben

Leider ist Zeit auch im Kampf um Aufmerksamkeit einer der entscheidenden Faktoren. Entsprechend ließen die ersten ausführlichen Berichte nicht lange auf sich warten. Wer darin aber auf eine Einordnung hoffte, wurde enttäuscht. Ein Großteil der Artikel beschränkte sich auf eine umgeschriebene Wiedergabe der Pressemitteilung.

Die Meldung der FAZ zum Covid19-Schnelltest von Bosch
Screenshot: FAZ

Besonders frappierend die Beiträge der „Welt“ und der „FAZ“, die mit AutorInnenbildern ihrer KorrespondentInnen eine Eigenleistung suggerierten, die schlicht nicht gegeben ist. Bei der „Welt“ schreibt der Korrespondent für Automobilwirtschaft. Der schreibt doch immer über Bosch, mag man sich gedacht haben – dabei geht es hier ja um ein medizinisch-wissenschaftliches Thema.

Was heißt 95 Prozent Genauigkeit?

Warum ist das alles unter Umständen problematisch? Weil vor allem die kolportierte Genauigkeit von 95 Prozent Journalisten eigentlich aufhorchen lassen sollte. Denn bei diagnostischen Verfahren gibt es mehrere Parameter, die für die Bewertung ihrer Brauchbarkeit zu betrachten sind. In diesem Fall handelt es sich vor allem um die Sensitivität und die Spezifität.

Die Sensitivität gibt grob gesagt an, wie viele Kranke ein Test richtigerweise als krank identifiziert.

Die Spezifität wiederum gibt den Anteil der Gesunden an, die korrekt als gesund angezeigt wurden – und zeigt somit auch, wie viele fälschlich als krank ausgewiesen werden.

Ein Beispiel: Bei einer für Laien erst einmal gut klingenden Sensitivität von 95 Prozent und einer Spezifität von 85 Prozent sähe das Ergebnis einer fiktiven Testmethode also so aus: Von 100.000 Kranken würde der Test 5.000 übersehen. Von 100.000 Gesunden würden zudem 15.000 fälschlicherweise als krank angezeigt.

Das sollte klar machen: Erst diese beiden Werte in Kombination mit anderen Parametern wie Anwendungsszenario und Häufigkeit einer Krankheit in den voraussichtlichen Testgruppen (Prävalenz) lassen eine Bewertung zu.

Der Brustkrebs-Test der Uni Heidelberg

Wissen könnte man das spätestens seitdem die Uniklinik Heidelberg einen Skandal um einen vermeintlich sensationellen Test zur Früherkennung von Brustkrebs ausbaden muss. Auch hier hatten die Forscher vollmundig gute Sensitivätsraten verkündet – später kam heraus, dass die Spezifität allerdings nur um die 50 Prozent lag. Viel zu wenig.

Nun lassen sich die Anforderungen der Onkologie im Detail nicht mit denen der Virologie vergleichen, wichtig bleiben die Angaben aber allemal: „Um einen diagnostischen Test seriös bewerten zu können, braucht es in jedem Fall auch Informationen zur Spezifität der Methode“, sagt Hartmut Hengel, Virologie-Professor an der Uniklinik Freiburg und Präsident der Gesellschaft für Virologie, zu Übermedien.

Das Problem: Auf Anfrage teilt ein Bosch-Sprecher zwar mit, dass es sich bei der angegebenen Genauigkeit von 95 Prozent um die Sensitivität handele, auf die Frage nach der Spezifität kann er aber keine Angaben machen.

Die dpa fragt nach

Bis auf die Deutsche Presse-Agentur (dpa) hatte aber offenbar kein Medium entsprechende Nachfragen gestellt.

Das führte immerhin dazu, dass diese Information dank dpa bei einigen weiteren Medien auftauchte. Aber auch hier fehlte die Einordnung, was das für die Bewertung eines neuen Testverfahrens eigentlich aussagt.

Es ist nun kein neues Problem, dass außerhalb der Wissenschaftsressorts bisweilen nur mangelnde Kenntnisse über den Umgang mit wissenschaftlichen Ergebnissen, Statistiken oder Daten existieren. Nicht umsonst mehren sich die Stimmen, dass dieser Bereich endlich auch flächendeckend in die journalistische Ausbildung aufgenommen werden sollte.

Und selbst wenn gerade niemand aus den Fachressorts greifbar gewesen sein sollte, sollte journalistische Sorgfaltspflicht zumindest zum Reflex gehören. Die Einordnung einer unabhängigen Expertin kann immer vor Veröffentlichung eingeholt werden. Doch danach suchte man hier vergeblich. Auch ein paar Nachfragen beim Absender der Pressemitteilung wären ja nicht schlecht gewesen.

Der „Stern“ hakt nach

Wissenschaftsredakteurin Ilona Kriesl vom „Stern“ tat schließlich genau das und lieferte so – Überraschung! – ein Stück voller wichtiger Zusatzinfos, die eben nur eine eigene Recherche ergeben. So räumte eine Bosch-Sprecherin gegenüber Kriesl ein, dass die Testkartuschen noch gar nicht zugelassen seien. Man rechne aber damit, dass das ab April der Fall sei.

In der Pressemitteilung selbst war das noch im selbstbewussten Indikativ formuliert worden: „Der neu entwickelte Test wird ab April in Deutschland erhältlich sein.“ Zudem nannte ein Vertreter der Kassenärztlichen Bundesvereinigung gegenüber Kriesl weitere wichtige Aspekte, um den neuen Test beurteilen zu können.

Damit hier kein falscher Eindruck entsteht: Gut möglich, dass der neue Bosch-Test eine hervorragende Spezifität aufweist und toll funktioniert. Doch die Pressemitteilung und der derzeitige Informationsstand lassen eine seriöse Beurteilung schlicht nicht zu.

Eine journalistische Berichterstattung muss solche Lücken benennen und einordnen, gerade wenn es in einer Zeiten einer Pandemie um derart sensible Nachrichten geht, die möglicherweise bei Leserinnen und Lesern auf besonders hohes Interesse stoßen – und mit denen Hoffnungen verbunden werden. Auch gute Nachrichten müssen hinterfragt werden.

Nachtrag, 28.3.2020. Wir haben die Definition von Spezifität im Text noch etwas präzisiert.

30 Kommentare

  1. Auch ich bin kein Wissenschaftsjournalist und hätte die PM nicht seriös einordnen bzw. Bewerten können. Insofern danke für die Fachbegriffe, die in anderen Branchen unter „false positives“ laufen. Aber ein Frage tauchte bei mir sofort auf: Warum Bosch? Warum verfügt ein Elektro- und Automobilkonzern über eine virologische Expertise, die andere nicht haben? Allein aus persönlichem Schiss, irgendeinen Quatsch unter meinem Namen zu veröffentlichen, hätte ich einen Experten gefragt. Oder glaubt irgendjemand, dass die TUI plötzlich ein wirksames Medikament gegen Prostatakrebs entwickelt hat?

  2. Na klar.
    Liegt doch auf der Hand: wer „common rail“ für Diesel entwickelt, kann auch Viren Schnelltest. Und die Schwaben sowieso. Die können alles….

  3. @Volker:
    Bosch Health Care Solutions ist eine 100-prozentige Tochter und Teil der Bosch-Gruppe. Die beschäftigen sich schon auch im Alltagsgeschäft mit diesen Themen.

  4. „Die Spezifität wiederum zeigt, wie viele Gesunde ein Test fälschlicherweise als krank ausweist, also falschen Alarm schlägt.“
    Nicht umgekehrt?
    Dann würden bei 85% Spezifität und 100.000 Gesunden 85.000 fälschlicherweise als krank diagnostiziert.

  5. @Mycroft
    Die Prozentangabe der Spezifität gibt an, bei wie vielen Gesunden der gesunde Zustand korrekt erfasst wurde. Daraus lässt sich dann auch umgehend ablesen, in wie vielen Fällen das nicht geklappt hat. Die von Ihnen zitierte Passage ist insofern ein bisschen zweideutig, lässt sich aber denke ich durch den Kontext dennoch verstehen.

  6. @Mycroft
    Wie Ritter der Nacht schon schrieb, ist das inhaltlich korrekt, aber von mir vielleicht leider etwas verkürzt formuliert worden. Ganz präzise würde es lauten: „Die Prozentangabe der Spezifität zeigt den Anteil der Gesunden, die auch korrekt als gesund identifiziert wurden und damit eben gleichzeitig (!) auch, wie viele Gesunde fälschlicherweise als krank angezeigt werden, bzw. wie oft der Test falschen Alarm schlägt.“ Danke für den Hinweis.

  7. Im Zuge einer Internetdiskussion hab ich mich die letzten Tage auch mit dem Thema beschäftigt und muss leider sagen da hat sich ein gefährlicher Fehler im Artikel eingeschlichen.
    Die Spezifität beschreibt nicht „falsch-positiv“ sondern „richtig-negativ“. Aber auch

    Ein gute Erklärung und vielleicht allgemein hilfreiche Handreichung für Journalisten: https://www.lgl.bayern.de/publikationen/doc/gbe2_epidemiologie_gesundheitsberichterstattung.pdf

  8. @Klaus
    Wie oben schon bei#7 geschrieben: Es stimmt, dass das nicht gut formuliert wurde – auch wenn ich mit „zeigen“ eben meinte, dass man tatsächlich daran auch ablesen kann, wie oft ein Test falschen Alarm schlägt. Wenn auch im Umkehrschluss. (Wie es gemeint war, sieht man ja an dem korrekten Fallbeispiel.) Aber der Einwand ist trotzdem berechtigt, ich werde das verbessern, vielen Dank.

  9. Es ist tatsächlich ein ziemlich schwierig zu berichtendes Thema, es kaum Berichte, die das gut machen. Wir haben uns beim journalistischen Medien-Doktor-Projekt länger mit der Berichterstattung über solche diagnostische Tests beschäftigt. Hier gibt es einen ausführlicheren Artikel für JournalistInnen, der das mit der Sensitivität und der Spezifität erklärt.

    Das Yin und Yang medizinisch-diagnostischer Tests
    http://www.medien-doktor.de/mediate/mediate/das-yin-und-yang-medizinisch-diagnostischer-tests/

    In Kürze veröffentlichen wir auch eine Checkliste, die den KollegInnen helfen kann, worauf es bei der Recherche ankommt.

  10. Aufhorchen muss man auch bei diesem Claim:
    „Mit einem einzigen Vivalytic-Analysegerät können nach Angaben von Bosch Healthcare Solutions bis zu zehn Tests innerhalb von 24 Stunden durchgeführt werden.“
    Man stelle sich ein Krankenhaus vor, dass am Tag 10 Patienten in der Notaufnahme testen kann. Und die anderen 990, die am selben Tag dort auftauchen? Oder soll das Krankenhaus 100 von den Geräten aufstellen. Solange die Technik nicht vernünftig skalierbar ist, ist sie für den Massenanfall an (potentiell) infizierten nicht geeignet.

  11. Dass „kein Medium“ nachgefragt hätte, ist völlig falsch. Auf hrInfo (Hessischer Rundfunk) hatte eine Reporterin es genau richtig eingeordnet und klar gesagt, dass dieser Bosch-Test in der jetzigen Situation vermutlich kein großer Durchbruch sein wird. Es gibt also durchaus Journalisten (gerade bei den Öffentlich Rechtlichen), die ordentlich recherchieren!

  12. @3: ein Dankeschön für die Aufklärung!
    Mir lag mein gut gepflegtes Vorurteil zum Schwäbischen näher, als eine sachliche Auseinandsetzung.
    Ein Attribut wie „…Bosch-Tochterunternehmen Bosch Healthcare Solutions“ im Originalartikel wäre hilfreich für eine ernstere Einordnung gewesen.

  13. die FAZ Online fällt mir immer wieder mit Artikeln auf bei Covid19, die wie die unkritische Wiedergabe von Pressemitteilungen klingen.
    Da wird überhaupt keine Nachfrage betrieben oder gar Einordnung.
    Zum Test von Bosch habe ich mich dann von Twitter-Nutzern aufklären lassen, dass das vielleicht für die Zukunft ein toller Test ist, aber während einer Epidemie/Pandemie kaum hilfreich ist

  14. Guter Artikel.
    Ich würde mir wünschen, dass so kritische Anmerkungen und Fragen wie zu der PM von Bosch in großen Medien auch einmal zu einer PM vom Robert-Koch-Institut kämen.
    Beispielsweise könnte man zu der schnell wachsenden Zahl von positiven Corona-Tests, die fälschlich oft gleich noch mit einer „Neuinfizierten“- oder „Fall“-Zahl gleichgesetzt wird, fragen, wie schnell im selben Zeitraum die Gesamtzahl der Tests gewachsen ist.
    Auch diese Frage wird offenbar leider nur in kleinen Publikationen gestellt und beantwortet.

  15. @Andreas Müller
    „Beispielsweise könnte man zu der schnell wachsenden Zahl von positiven Corona-Tests, die fälschlich oft gleich noch mit einer „Neuinfizierten“- oder „Fall“-Zahl gleichgesetzt wird, fragen, wie schnell im selben Zeitraum die Gesamtzahl der Tests gewachsen ist.
    Auch diese Frage wird offenbar leider nur in kleinen Publikationen gestellt und beantwortet.“

    Hab mir den Link gerade angesehen. Das Problem das ich da sehe ist das es den Narrativ „wir finden SARS-CoV2 nur weil wir danach testen“ nachplappert. Dafür bekommt Prof. Bhakdi gerade schon (vermutlich berechtigte) Schelte.
    Von daher: Kritisch Hinterfragen gerne. Aber mit entsprechender Einordnung. Und erhöhter Vorsicht vor Kurz- und Fehlschlüssen!

  16. @#19: Das RKI bezeichnet die eigenen ahlen als Fallzahlen, nicht als Infiziertenzahlen, und betont in so ziemlich jeder Pressekonferenz, dass diese Zahlen die amtlich gemeldeten Fälle sind, die systembedingt nie die Zahl der Infizierten sein kann.
    Auch ist es wenig hilfreich, die (den Zuwachs der) Gesamtzahl der Tests zu betrachten, da diese nicht randomisiert sind, sondern gezielt bei Verdachtsfällen und deren Umfeld eingesetzt werden. Ich bin zwar auch dafür, dass es endlich eine randomisierte Studie geben sollte, um diese Frage zu beantworten, aber in Zeiten, in denen noch nicht die Testkapazitäten für alle systemrelevanten Berufler vorhanden sind, ist das auch eine Gerechtigkeitsfrage. Im übrigen halte ich die „Publikation“ für sehr fragwürdig, unter Anderem weil auf diese Punkte nicht auch mal eingegangen wird (als Journalistische Frage: Gibt es Entlastendes?), 2. weil hier immer wieder darauf hingewiesen wird, dass das RKI nicht mit den/dem Autoren reden wollte oder spät reagierte, das ist RTL2-Niveau (Auskunftsverweigerung != Schuldeingeständnis).

  17. @22
    Es hilft nichts, was das RKI wie bezeichnet, wenn „große“ Zeitungen am nächsten Tag schreiben:
    „Trotzdem steigen die Zahlen der Neuinfizierten weiter“.
    Hier werden Vermutungen und Zahlen, die das so nicht belegen können, munter gemischt. Kaum jemand erklärt den Leuten, dass drei Mal mehr positive Tests bei drei Mal mehr Tests insgesamt auch mit einer abgeschlossenen, also konstanten Verbreitung des Virus kompatibel wären. Wenn man zusätzlich noch schreibt, dass 500 Menschen „an“ statt „mit“ dem Virus gestorben sind, ist die Täuschung perfekt gemacht. Es lassen sich auch Belege verlinken, dass das RKI tatsächlich „mit“ zählt, wenn es „Corona-Tote“ berichtet. Nur die Süddeutsche und andere „Qualitäts“-Medien interessiert das herzlich wenig.
    Gleichzeitig üben „Faktenchecker“ an Außenseiter-Experten und -Medien die hohe Kunst der Haarspaltung, während sie sich für solche groben Fehler niemals interessieren.

  18. @23: Diese Punkte sind allesamt valide und nachvollziebar. Ich denke hier müssen die Medienhäuser auch mal die eigenen Qualitätssicherung prüfen. Ist aber auch schwierig, wenn ein vormaliges Nischenthema (Virologie) plötzlich alles andere dominiert. Ihr erster Kommentar war da nicht so eindeutig in der Fragestellung, man hätte den auch als Kritik am RKI auffassen können – und noch weniger ist es die verlinkte Quelle. Die halte ich insgesamt immer noch für sehr tendenziös und nicht geeignet als Positivbeispiel.

  19. Es ist bemerkenswert, daß wir über die Bewertung von solchen Statistiken überhaupt noch diskutieren müssen. Es ist doch noch gar nicht so lange her, da wurden genau die gleichen Diskussionen um die Gesichtserkennung im Zuge der testweise Videoüberwachung am Bahnhof Berlin Südkreuz diskutiert.

    Da ging es auch darum, daß die Prozentwerte erst mal ganz toll klingen, bei näherer Betrachtung sich aber eine große Zahl von Personen ergibt, die bei flächendeckendem Einsatz dieser Technik wegen Fehlalarmen kontrolliert werden müsste.

    Es wurde auch diskutiert über KI-gestützte Erkennung von auffälligem Verhalten, um damit als Verkehrsknotenpunkten Terroristen zu erkennen. Und es ergab sich: Die treffsicherste KI ist diejenige, die gar nichts macht, sondern einfach bei jedem Menschen angibt, daß er kein Terrorist ist. Der Anteil der Terroristen an der Gesamtbevölkerung ist derart gering, daß die KI mit diesem Ansatz eine unglaublich geringe Fehlerquote hat.

    Was wir da erst vor ein paar Monaten über Gesichtserkennung und Terrorismus diskutiert haben, gilt doch für die Erkennung einer Corona-Infektion genauso:

    Ich kann einen einfachen Corona-Test erstellen, indem ich einfach bei jedem Menschen behaupte, daß er nicht infiziert ist. Und mein super-duper Corona-Test hat damit eine wahnsinnig hohe Treffsicherheit: Wir haben in Deutschland eine Bevölkerung von rund 80.000.000 Menschen. Derzeit (31.03.2020) gibt es knapp 70.000 bestätigte Corona-Infektionen. Es sind bisher also weniger als 0,1% der Bevölkerung infiziert. Mein super-duper Corona-Test hätte also eine Treffsicherheit von über 99,9%, und zudem ist er auch noch total einfach und gibt ohne Wartezeit ein Ergebnis aus. Gegen meinen super-duper Corona-Test kann Bosch Healthcare einpacken!

    P.S.: https://xkcd.com/937/

  20. @Daniel Rehbein das Problem ist nur, dass eine Menge Menschen (und auch einige JournalistInnen) gar nicht erkennen, dass es bei der Gesichtserkennung und dem Test auf Corona (oder dem Check am Flughafen auf metallische Gegenstände) um dieselbe Sache geht.

  21. Hier ein Artikel, der in die gleiche Bresche schlägt: „Gesundheitsschutz ist kein Grundrecht, Freiheit schon.“
    https://www.cr-online.de/blog/2020/04/01/warum-wir-unsere-freiheit-jetzt-einfordern-muessen/

    „Aber wer schaut schon auf die vielen Graphen von vor zwei Wochen, als uns prognostiziert wurde, es sei mathematisch erwiesen, dass in Deutschland dieselbe Entwicklung eintreten würde wie in Norditalien? Dass sich düstere Prognosen von gestern nicht verwirklicht haben, scheint niemanden zu interessieren.“

    Er verpackt die implizite Aussage „Die Prognosen sind nicht eingetroffen (mit Schlussfolgerung: also die Maßnahmen falsch)“ auch geschickt in einer rhetorischen Frage; die Aussage selbst bezieht sich dann auf „düstere Prognosen von gestern“. Vermute, er weiß recht genau, wann eine Aussage rechtlich nicht haltbar ist.

    Gerade jetzt sind belastbare Zahlen zum Rückgang der Infektionsquote umso wichtiger, damit nicht dort die Phantasie blüht, wo das Wissen fehlt.

  22. Sprachkritik:

    „Auch anscheinend gute Nachrichten müssen hinterfragt werden“

    Es wird ja häufig das schöne Wort „anscheinend“ durch das ewige „scheinbar“ ersetzt, was meistens einfach falsch ist. Hier liegt anscheinend (!) ein umgekehrter Fehler vor. Wenn ich die gute Nachricht hinterfragen muss und sie sich als nicht so gut herausstellt, dann ist sie doch nur scheinbar gut, oder?

  23. Ich habe mal über den Tellerrand geguckt:
    https://www.independent.ie/world-news/coronavirus/irish-developed-kit-confirms-infection-in-15-minutes-39046582.html
    Meldung ist vom 16.03
    https://nypost.com/2020/03/15/ireland-shuts-down-all-pubs-over-coronavirus-outbreak/
    Es gibt Leute,die einen zeitlichen Zusammenhang zwischen Pubschliessungen und der Entwicklung des Tests sehen….
    so rein motivationstechnisch ;-)
    und jetzt ein Gedicht
    https://www.irishcentral.com/news/coronavirus-lockdown-poem

Einen Kommentar schreiben

Mit dem Absenden stimmen Sie zu, dass Ihre Angaben gemäß unseren Datenschutzhinweisen gespeichert werden. Ihre E-Mail-Adresse wird nicht veröffentlicht.