06.08.2020
Was habe ich da gerade gelesen: "Wer positiv getestet wurde, hat eine deutlich höhere Wahrscheinlichkeit auch positiv zu sein, als ein negativ Getester tatsächlich negativ zu sein."
Das kann und darf ich nicht unwidersprochen stehen lassen. Wer das behauptet, hat in Wahrscheinlichkeitsrechung nicht aufgepasst oder das Fach nie gehabt.
Nehmen wir an, ich werde auf der Straße zufällig für einen Test ausgewählt. Das Testergebnis kommt zurück und sagt "positiv". Wie groß ist jetzt die Wahrscheinlichkeit, dass ich tatsächlich positiv bin?
Oder ich werde zufällig ausgewählt und das Test-Ergebnis ist "negativ". Wie groß ist jetzt die Wahrscheinlichkeit, dass ich tatsächlich negativ bin?
Die erste Wahrscheinlichkeit soll größer als die zweite sein???
In der Terminologie der Wahrscheinlichkeitsrechnung sind das bedingte Wahrscheinlichkeiten. Ausrechnen kann man die häufig nach der Bayesschen Formel, auch "Satz von Bayes" genannt. Für die, die das genauer wissen wollen: Bei wikipedia unter "Satz von Bayes" ist das meines Erachtens gut erklärt. Aber ein kleines bisschen mathematisch ist es schon.
Bayessche Formel
P(A|B) = P(B|A) * P(A) / P(B)
Im Falle, dass der Test "positiv" meldet, wäre
P(A|B) Die bedingte Wahrscheinlichkeit, dass jemand infiziert ist, unter der Bedingung, dass der Test positiv war.
Das ist der Wert, der mich eigentlich interessiert. Wie wahrscheinlich ist es, dass ich tatsächlich infiziert bin?
P(B|A) Die bedingte Wahrscheinlichkeit, dass der Test positiv ist, unter der Bedingung, dass der Getestete infiziert ist.
Das ist die Sensitivität des Tests, z. B. 0,95 (= 95%). Die fehlenden 0,05 (= 5%) sind die Falsch-Negativen.
P(A) ist die Wahrscheinlichkeit, dass jemand infiziert ist, ohne jede Bedingung, also ohne Test.
Also Anzahl aktuell Infizierter in Deutschland geteilt durch Anzahl Einwohner
Das ist die Prävalenz.
P(B) ist die Wahrscheinlichkeit, dass ein Test positiv ist, ohne Bedingung.
Also, wenn alle ~80 Millionen getestet würden, wieviele positive Tests gäbe es. Diese Anzahl geteilt durch ~80 Mio.
Wieviel das ist, ist nicht unmittelbar klar, können wir aber ausrechen, wenn wir zusätzlich zur Prävalenz und der Sensitivität auch noch die Spezifität wissen. (Das ist die Stelle im Wikipedia-Artikel, an der von "Anwendung des Gesetzes der totalen Wahrscheinlichkeit" gesprochen wird.)
P(A) wird auch als A-Priori-Wahrscheinlichkeit bezeichnet (Wahrscheinlichkeit vor dem Test).
P(A|B) wird auch als A-Posteriori-Wahrscheinlichkeit bezeichnet (Wahrscheinlichkeit nach dem Test).
So, und jetzt hatte ich befürchtet, ich müsste auch noch was vorrechen. Aber nein, das Rechenbeispiel 2 aus dem Wikipedia-Artikel passt fast perfekt auf unsere Situation. Ich muss das Ergebnis nur ein bisschen zusammenfassen. In dem Beispiel wird angenommen:
Prävalenz 20 pro 100.000
Sensitivität 95%, d. h. 5% Falsch-Negative
Spezifität 99%, d. h. 1% Falsch-Positive
Und jetzt ratet mal, wie groß die Wahrscheinlichkeit ist, dass ich nach einem positiven Test tatsächlich infiziert bin. Vielleicht irgendwas im Bereich von 95% oder 99%?
Nein, es sind 1,86% (gerundet).
Nun kann ich natürlich auch analog ausrechnen, wie groß die Wahrscheinlichkeit ist, dass ich tatsächlich nicht-infiziert bin, wenn der Test "negativ" sagt. Steht nicht in Wikipedia, aber das Ergebnis ist 99,999% (auch gerundet).
Wer möchte mir jetzt erklären, dass 1,86% deutlich mehr seien als 99,999%?
Jetzt kann ich mir nicht verkneifen, noch einen Absatz aus Wikipedia zu zitieren:
"Ohne Training in der Interpretation statistischer Aussagen werden Risiken oft falsch eingeschätzt oder vermittelt. Der Psychologe Gerd Gigerenzer spricht von Zahlenanalphabetismus im Umgang mit Unsicherheit und plädiert für eine breit angelegte didaktische Offensive."
Statt selbst zu rechnen, kann man heutzutage natürlich auch Bayes-Rechner im Internet finden. Leider werden da öfter andere Begriffe verwendet. Einen, mit dem die Rechnung einfach nachzuvollziehen sein sollte, habe ich auf http://psych.fullerton.edu/mbirnbaum/bayes/BayesCalc.htm gefunden. Hier die beiden Rechnungen im Vergleich:

Ganz kurze Erläuterung: Prozentwerte sind in der Wahrscheinlichkeitsrechnung eher unüblich, die sind mehr fürs breite Publikum. Und in der englischen Schreibweise wird anstelle des Kommas ein Punkt verwendet. 1% entspricht daher 0.01, 99% entspricht daher 0.99
Tut mir leid, wenn dieser Beitrag etwas schroff daher kommt, aber ich hatte mir an anderer Stelle schon mal viel Mühe gegeben, das zu erläutern. Wenn das jemand nicht versteht, ist das ja OK, aber ...
Der Grund für diese Phänomen ist die niedrige Prävalenz! Und das Phänomen selbst ist der Grund dafür, dass Massen-Tests keinen Sinn machen! Ich empfehle, wenigstens den Abschnitt "Bedeutung des Ergebnisses" zu Rechenbeispiel 2 aus dem Wikipedia-Artikel durchzulesen.
Liebe Grüße
Uwe