Medizinisches Wissen: Was sagt ein positives Testergebnis aus?

Bild: pixy.org/CC0

Eine kurze Lektion vom deutschen Statistik-Papst, Beispiel Mammografie (Brustkrebsuntersuchung).

Gesundheit ist ein hohes Gut, für manche vielleicht sogar das höchste. Denn wer möchte schon lange leben, wenn das ein Dahinsiechen wäre? Dementsprechend finden wir auch in der medialen Welt täglich Gesundheitsinformationen. Nicht allen tut das gut: Sie erfahren Krankheitssymptome, über die sie lesen, am eigenen Leib oder der eigenen Psyche. Oder sie werden zumindest verunsichert. Und oft heißt es: Je früher man etwas entdeckt, desto besser die Heilungschancen.

Ein Gang zum Hausarzt oder zur Fachärztin soll Klarheit schaffen. Die biomedizinische Forschung und Anwendung verspricht Sicherheit mit den Methoden der „harten Naturwissenschaft“. Doch in der Wissenschaft des Lebendigen, in den Lebenswissenschaften, ist etwas selten ganz schwarz oder weiß – oder in Begriffen der binären Logik: null oder eins. Deshalb sind statistische Verfahren meist unverzichtbar. Diese sollte man besser verstehen, wenn man sie anwendet und ihre Ergebnisse verbreitet.

Der im Untertitel genannte „Statistik-Papst“ bin natürlich nicht ich, sondern der (inzwischen emeritierte) Psychologieprofessor und frühere Max-Planck-Direktor Gerd Gigerenzer (Jg. 1947). Er plädiert nicht nur für mehr theoretische Kenntnisse in seinem Fachgebiet, sondern beschäftigt sich schon seit Jahrzehnten mit häufigen Missverständnissen statistischen Wissens. Hier im Blog ging es schon früher um seine „Unstatistik des Monats“, zum Beispiel bei der Übertreibung von Risiken des Alkoholkonsums.

Beispiel Mammografie

Für einen neuen Aufsatz hat er sich die Kommunikation von Krankheitsrisiken bei Krebsuntersuchungen genauer angeschaut. Und das folgende Beispiel hat er, auf der Grundlage echter Daten, auch in der medizinischen Fortbildung erprobt. Wenn Sie nicht gleich die richtige Antwort wissen, ist das nicht der Weltuntergang: Die meisten Gynäkologinnen und Gynäkologen kamen vor Gigerenzers Kurs auch nicht auf die richtige Antwort.

Schauen wir uns das konkrete Beispiel an:

  • Die Wahrscheinlichkeit, dass eine Frau Brustkrebs hat, beträgt 1 Prozent. (Das nennt man auch „Prävalenz“.)
  • Wenn eine Frau Brustkrebs hat, dann ist die Wahrscheinlichkeit eines positiven Tests 90 Prozent. (Sensitivität des Tests)
  • Wenn eine Frau keinen Brustkrebs hat, dann ist die Wahrscheinlichkeit eines positiven Tests 9 Prozent. (Falsch-Positiv-Rate des Tests)

Jetzt die Frage: Frau F bekommt nach einer Untersuchung beim Gynäkologen ein positives Mammografie-Ergebnis. Wie groß ist die Wahrscheinlichkeit, dass sie wirklich Brustkrebs hat? (Auflösung unten)

  1. 90 Prozent
  2. 81 Prozent
  3. 9 Prozent
  4. 1 Prozent

Bedingte Wahrscheinlichkeiten

Der häufigste Fallstrick dürfte die Sache mit der Sensitivität des Tests sein, also mit der hier genannten Wahrscheinlichkeit von 90 Prozent. Tatsächlich wählten in einem (allerdings nicht repräsentativen) Versuch Gigerenzers mit 160 Gynäkologen und Gynäkologinnen knapp die Hälfte diese – falsche – Alternative. Auf die Alternativen 2, 3 und 4 entfielen 13, 21 und 19 Prozent der Stimmen.

Aber warum ist Alternative 1 falsch? Dafür sollte man sich keine Prozente anschauen, sondern konkrete Zahlen: Stellen wir uns 1000 Frauen vor, die eine Mammografie vornehmen lassen. Laut der Prävalenz haben 1 Prozent beziehungsweise 10 von ihnen Brustkrebs. Wegen der Sensitivität von 90 Prozent bekommen neun von ihnen ein korrekt-positives und die verbleibende zehnte ein falsch-negatives Ergebnis.

Jetzt wissen wir aber auch, dass von den Frauen ohne Brustkrebs 9 Prozent, also in diesem Beispiel 89, ein falsch-positives Ergebnis bekommen. Von den 1000 Frauen haben wir also 9 + 89 = 98 mit einem positiven Mammografie-Ergebnis. Doch von denen stimmt das nur bei 9 von 98 und ist es falsch bei den restlichen 89.

Bei Frau F wissen wir ja nicht, ob sie wirklich Brustkrebs hat oder nicht. Darüber sollte die Mammografie gerade Aufschluss geben. Mit dem positiven Test wissen wir aber nur, dass sie in die Gruppe der 98 fällt. Da von denen „nur“ 9 wirklich Brustkrebs haben, ist das richtige Ergebnis auf die Frage: 9:98 = 9,2 Prozent, also (gerundet) Alternative 3.

Finanzielle Interessen

Gigerenzer geht in seinem Artikel noch etwas weiter: Er verweist darauf, dass die Fortbildung für die Ärztinnen und Ärzte oft von biomedizinischen Firmen organisiert wird – in Luxushotels an Luxusorten. Damit hätten sie Kontrolle darüber, was diese Fachleute lernen. Das Folgende sagt, wohlgemerkt, kein Verschwörungsdenker, sondern einer der angesehensten Psychologen und Wissenschaftler Deutschlands:

„Innerhalb von zwei Jahren schulte ich insgesamt etwa 1.000 Ärzte. Dabei erfuhr ich, dass der Großteil der ärztlichen Fortbildung von der Industrie finanziert und organisiert wird. Einige Ärzteorganisationen bieten zwar eigene Kurse an, können aber mit den Vorteilen großer Pharmaunternehmen nicht mithalten, die Ärzte und manchmal sogar deren Partner in Luxushotels an attraktiven Reisezielen einfliegen lassen – alle Kosten inklusive. Diese Investition lohnt sich: Millionen von Ärzten wissen das, was die Industrie will, dass sie wissen.“ (Gigerenzer, 2026, S. 367)

Ein Schelm, wer hierin ein Geschäftsmodell sieht: Gerade verunsicherten Patientinnen und Patienten wird somit vielleicht vermittelt, dass sie für ein längeres und gesünderes Leben immer mehr und immer früher testen lassen müssen. Vergessen wir nicht, dass es auf dem Gesundheitsmarkt Jahr für Jahr um viele Milliarden geht!

Eine andere Auswertung von Krebsuntersuchungen in Gigerenzers Artikel deutet aber darauf hin, dass eine frühere Diagnose oft nicht das Leben verlängert. Am ehesten scheinen noch Darmkrebsuntersuchungen mit der Sigmoidoskopie (einer direkten Untersuchung des Dickdarms) zu nützen – doch selbst dann geht es um eine Lebensverlängerung von im Mittel nur 100 Tagen.

Fazit

Das Thema ist natürlich komplexer, als ich es hier in einem kurzen Blogartikel beleuchten kann. Die gute Nachricht ist immerhin, dass durch die Tests niemand früher stirbt. Aber die Patientinnen und Patienten bezahlen dann mitunter einen psychologischen Preis: durch Unsicherheit, Angst und eventuell unangenehmen Untersuchungen. Zum Beispiel ist bekannt, dass der Antigen-Test auf Prostatakrebs in der Praxis oft irrelevant ist. Denn die Betroffenen alten Männer sterben oft an einer anderen Ursache, bevor ihre Prostata ernsthafte Probleme bereitet. Der Profit bestimmter Akteure auf der anderen Seite ist dahingegen sicher.

Ich nehme mitnichten den Standpunkt ein, nicht mehr zum Arzt zu gehen oder sich nicht mehr genauer untersuchen zu lassen! Aber mit dem richtigen Verständnis, an das uns Gerd Gigerenzer mit seiner Forschung seit Jahrzehnten immer wieder erinnert, wird der Gesundheitskult unserer Zeit doch etwas relativiert. Selbst ein positives Testergebnis kann – wie im genannten Beispiel – sogar in der Mehrheit der Fälle negativ sein, also auf keine Krankheit hindeuten. Wenn man das richtig kommuniziert, kann man vielen Patientinnen und Patienten potenziell helfen.

Eine auch für Laien einfach zu merkende Schlussfolgerung ist zudem: Man sollte sich von relativen Angaben (z.B. 50 Prozent mehr, Verdopplung) nicht in die Irre führen lassen. Eine Angabe der konkreten Zahlen ist oft viel aussagekräftiger. Auch im Beispiel hier muss man keine Statistikkenntnisse haben, um zu verstehen, dass bei 1000 getesteten Frauen und 98 positiven Ergebnissen nur 9 dieser 98 wirklich Brustkrebs haben. Und auch im Wissenschafts- und Medizinjournalismus kann man sich das hinter die Ohren schreiben, sowie nicht zuletzt in der medizinischen Ausbildung.

 

Quellen:

  • Gigerenzer, G. (2026, im Erscheinen). Risk communication: Truth and trickery about cancer screening. In T. Reimer, L. van Swol, & A. Florack (Eds.), The Routledge handbook of communication and social cognition (pp. 367-387).
  • Eine ähnliche, doch ältere Arbeit: Krämer, W., & Gigerenzer, G. (2005). How to confuse with statistics or: The use and misuse of conditional probabilities. Statistical Science, 223-230.

Der Artikel wurde zuerst auf dem Blog „Menschen-Bilder“ des Autors veröffentlicht. Zuletzt erschien von ihm das BuchPerspektiven aus der Depressions-Epidemie. Was Depressionen sind und wie man sie behandelt“.

Stephan Schleim

Stephan Schleim ist studierter Philosoph und promovierter Kognitionswissenschaftler. Seit 2009 ist er an der Universität Groningen in den Niederlanden tätig, zurzeit als Assoziierter Professor für Theorie und Geschichte der Psychologie. Sein Schwerpunkt liegt in der Erforschung von Wissenschaftsproduktion und –kommunikation. Schleim ist Autor mehrerer Bücher zu Neurowissenschaften, Psychologie und Philosophie.
Bild: Elsbeth Hoekstra
Mehr Beiträge von Stephan Schleim →

Ähnliche Beiträge:

4 Kommentare

  1. wenn ich zum Arzt gehe, und einen entsprechenden positiven Befund bekomme, dann ist das ganze für mich kein statistisches Problem mehr, sondern ein höchst individuelles, sehr konkretes. Ab da habe ich mich dem Befund zu stellen, unabhängig von einem möglicherweise falsch positiven Befund. Auch die statistische Überlebenszeit ist ab einem echt positiven Befund irrelevant, sondern hängt vom konkreten Krankheitsbild ab, Statistik hin oder her. Dagegen ist die Statistik allerdings für den Mediziner relevant.

    1. Wenn statistisch validiert ein Test das Leben nachweislich NICHT verlängert, dann mag man dazu neigen solche Tests nicht zu bezahlen oder gar zu verbieten. Es könnte jedoch sein, dass ein Patient eine Mutter hatte, die an Krebs verstarb und daher jedes ihrer Kinder genetisch eine hohe Wahrscheinlichkeit besitzt ebenfalls an Krebs zu versterben. Macht ein Kind einen solchen Test mit positivem Ausgang und folgt der Schnippel-Empfehlung, so könnte sich seine Lebenserwartung an die nicht genetisch Vorbelasteter annähern.
      Damit ist das Testen dann sinnvoll wenn bei Vorbelastung eine Lebensverlängerung durch die befolgte Behandlung nachgewiesen ist.
      Ist doch logisch!

  2. Die böse, böse Pharmaindustrie – da verkauft sie doch tatsächlich Tests, bei den denen von 1000 Testpersonen nur 9,2 erfahren, dass sie eine Krankheit haben, von der sie vorher nichts wußten. So wenig? Und Außerdem die ganze Testerei beunruhigt die Leute auch noch und wer weiß, ob und wie viele von den neun Personen wirklich gerettet werden? Da muss der Staat aber unbedingt einschreiten – weg damit, raus aus dem Leistungsverzeichnis der Krankenkassen! Darmspiegelung: raus aus dem Leistungsverzeichnis, vaginaler Ultraschall: raus (ach nein – der wurde ja schon gestrichen), Sicherlich gibt es noch einiges mehr, mit dem man der bösen Pharmaindustrie den Gewinn schmälern könnte.
    Liebe Leute lernt es endlich: Wenn wir den Leistungskatalog der Krankenkassen kürzen, schränken wir nicht die Dienstleistungen für unsere sauer verdienten Krankenkassenbeiträge ein, nein: wir zeigen der Pharmaindustrie, wo der Hammer hängt!

  3. Das ist pure Demagogie im Rahmen der im Westen laufenden eugenischen Kampagne zur Opferung / fahrlässiger oder vorsätzlicher Tötung von „Alten, Schwachen, Kranken“.

    Die Aussage der Prävalenz: 100 von 1000 Frauen entwickeln im Laufe ihres Lebens einen bösartigen Tumor im Brustgewebe.

    Die Angabe zur Sensitivität der Mammographie ist erklärungsbedürftig. Ich habe keine Lust, das anstelle von Herrn Schleim zu recherchieren und zu wägen, der die verdammte Pflicht gehabt hätte, das zu tun, nenne also nur die mir bekannten Parameter.
    – Die Physik der Röntgenologie garantiert die Erkennung eines bösartigen Tumors ab einer bestimmten Größe.
    – Sie garantiert aber nicht Differentialdiagnose zu gutartigen Tumoren und anderen Wucherungen, v.a. Zysten. (obwohl sie in vielen Fällen gute Hinweise dazu gibt)
    – Für die Differentialdiagnose gibt es die Biopsie.

    Zwischenergebnis: Der diagnostische Wert eines mammographischen Screenings unabhängig von Tastbefunden ist folglich gegeben in der Quote radiologisch unerkannter bösartiger Tumore in diesem Stadium, gewichtet mit der jeweiligen statistischen Metastasierung der verschiedenen Tumorarten in demselben.

    Der diagnostische Wert ist freilich nur die halbe Miete, die andere Hälfte ist die Erfolgsquote von Heilbehandlungen. Die liegt offiziell jetzt zwischen 80 und 90%. Ein vollständiges statistisches Bild erhält folglich nur, wer die Zahl der Tumore, die ohne Screening unerkannt geblieben wären, mit der therapeutischen Erfolgsquote der zugehörigen Stadien gewichtet.

    Bei dem illustrativ erwähnten PSA – Test liegen die Verhältnisse völlig anders, weil der überhaupt keine Kenngröße eines bösartigen Tumors liefert. Er liefert eine Kenngröße über eine verbreitete Begleiterscheinung raumgreifender Vorgänge in der Prostata, und das nicht einmal ausschließlich.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert