Methodenvergleich in der Medizin

Oft interessiert die Mediziner die Zuverlässigkeit und Reproduzierbarkeit einer Diagnose. Die Beurteilung kann dabei durch einen Bewerter (Messverfahren) in wiederholter Form erfolgen und wird dann als Intra-Rater bezeichnet oder die Beurteilung eines Merkmals erfolgt durch mehrere Bewerter (Messverfahren). Hier spricht man von Inter-Rater. Die Methode der Beurteilung der Übereinstimmung hängt von den jeweiligen Verteilungseigenschaften ab.

Bei nominal verteilten Daten wird abgezählt und die Rate der Übereinstimmung bewertet (Cohen-Koeffizient) Bei Ordinalen-Daten werden die gewichteten Übereinstimmungen ausgezählt (gewichteter Cohen-Koeffizient). Bei metrischen(stetigen) Daten werden die Differenzen beurteilt (Bland-Altman-Methode oder auch Tukey Mean Difference).

Hier in diesem fiktiven Beispiel aus der Zahnmedizin wird die Sondiertiefe mit zwei unterschiedlichen Methoden (A und C) bestimmt. A ist dabei die klassische Methode und C die Bestimmung mittels einer neu entwickelten Sonde. In der Grafik unten werden drei Visualisierungen dargestellt: Links sehen Sie ein Streudiagramm mit der Regressionsgeraden, in der Mitte ein BA-Plot über die Differenzen, und rechts der BA-Plot über die Prozentuale Differenz.
Wir erwarten dass beide Verfahren die gleichen Ergebnisse liefern.

Die Idee hinter der Bland-Altman-Methode ist dass der wahre Messwert des Patienten unbekannt ist, aber durch beide Methoden mit einer unbekannte Präzession gemessen wird – also quasi der Mittelwert aus den beiden Messungen. Wenn ich jetzt diesen Mittelwert gegen die Differenz der Messwerte auftrage, kann ich ablesen, wie groß die die Variabilität der Messungen ist und ob diese Variabilität über den gesamten Messbereich konstant ist.

Aus der Abbildung des Streudiagramms ist erkenntlich, dass die beiden Messungen linear verlaufen, es gibt also keine Sprünge oder abrupten Veränderungen. Der BA-Plot über die Differenz zeigt dass im Bereich von 0.5mm bis 1.5mm die Streuung gleichmäßig verteilt ist und im Bereich von 2.0mm ist auffallend die Differenzen schief verteilt ist, dadurch erkennen wir das die Methode C höhere Sondiertiefe misst.
Die durchschnittliche Differenz beträgt 0.72mm (d = [39.12, 39.12]), d.H. die Sondiertiefe ist bei Methode C kleiner.
Im BA-Plot mit den Prozentuale Differenzen ist gut ersichtlich, dass bei kleinen Sondiertiefen bis 0.5mmm große Abweichungen bestehen, die durchschnittliche Abweichung liegt bei 60%.

Bland-Altman-Methode Bias

Notation:
d … Bland-Altman-Methode Bias
s … systematische Abweichung Messfehle
LOA Standardabweichung der Differenz (Limits of agreement)
d+-1.96 Intervall von 95% (es wird eine Normalverteilung unterstellt)

Literatur:
[1] Vergleich von Messmethoden, Grouven, Bender, Ziegler, Lange, DMW Nr. 24 www.thieme-connect.com/products/ejournals/issue/10.1055/s-002-6753
[2] Understanding Bland Altman analysis, Davide Giavarina, Biochemia medica 2015;25(2) 141-51 doi: 10.11613/BM.2015.015

Anmerkung zu den Daten:
Es wurde folgender R-Code zur Erstellung der Daten verwendet:

# set.seed(0815)
A = rnorm( 100, 100, 50 )
C = A + rnorm(100, -5, 20)

 

Comments are closed.