T-Test oder ANOVA

Beim Verfassen von wissenschaftlichen Arbeiten stellt sich oft die Frage welcher der Tests jetzt der richtige ist? T-Test? ANOVA? Und wenn der T-Test der Richtige ist, welcher davon? Die Antwort ist dabei recht einfach. Im Zweifel haben wir immer ein Generalized Linear Model (GLM).
T-Test und ANOVA unterscheiden sich nicht (Voraussetzung wenn df=1 gilt). In diesen Fall sind F-Wert und T-Wert dieselben Zahlen F=T². Die (lineare) Regressionsanalyse ist quasi die Verallgemeinerung der (Mittelwert)-Analyse und liefert exakt die gleichen Ergebnisse wie die ANOVA. Der Unterschied ist, dass die Regression mehr Informationen liefert.
Aber Achtung, die statistische Hypothese ist verschieden.(ANOVA: H0:μ1=…=μn; Regression H0:β1=β2=0 wobei yi=β0+β1xi+…)
Hier ein kleines Beispiel mit den Daten aus dem SPSS-Buch von Bühl Seite 300. Hier testen wir die Senkung des systolischen Blutdrucks vom Ausgangswert zum Wert nach einem Monat.

Tab 1: UV = Zeit
Item  Ausgangswert  nach 1 Monat Differenz cohens’d T.test
syst.Blutdruck 172 (13) 156 (15) 15 [12, 18] 1.06 T(343)=9.87, p<.001
Welch Two Sample t-test

Mit dem Welch Two Sample T-Test erhalten wir T(343)=9.87, p<.001, mit der ANOVA F(1, 346)=97.34, p<.001. Wobei hier gilt T²=F also 9.87² = 97.34. Die Regressionsanalyse liefert exakt dasselbe Ergebnis.

Tab 2: AV: syst.Blutdruck Obs: 348
Quelle B SE statistic p
(Intercept) 170.00 1.10 156.19 <.001
Zeit[T.nach 1 Monat] -15.00 1.56  -9.87 <.001
Model: gaussian

Jetzt interessiert vielleicht noch warum wir überhaupt noch zwischen T-Test und ANOVA unterscheiden wird. Hier ist die Antwort simpel – es geht um Didaktik der T-Test ist in einer Vorlesung einfach zu erklären und händisch leicht nachzurechnen und schließlich benötigen wir noch Prüfungsfragen. Für die Praxis ist das Generalisierte Lineare Modell meist das informativere Werkzeug.

Anmerkung die Berechnungen habe ich mit R erstellt

##-- T-Test Buehl Seite 282
GetData(hyper)

DF <- data.frame(syst.Blutdruck= c(hyper$rrs0, hyper$rrs1), Zeit=gl(2, nrow(hyper), labels = c("Ausgangswert", "nach 1 Monat"))) t.test(syst.Blutdruck~Zeit, DF, var.equal=TRUE) aov(syst.Blutdruck~Zeit, DF) lm(syst.Blutdruck~Zeit, DF) ##-- wenn wir ungleiche Varianz-voraussetzten t.test(syst.Blutdruck~Zeit, DF, var.equal=FALSE) require(nlme) summary(gls(syst.Blutdruck~Zeit, DF, weights=varIdent(form = ~ 1 | Zeit))

Literatur:
Achim Buehl, (2014), SPss 22 Einfuehrung in die moderne Datenanalyse, 14. aktualisierte Auflage, Pearson

 

Comments are closed.