Analyse von wiederholten Messungen

Viele Studienansätze liefern wiederholte Messungen eines bestimmten Merkmals an verschiedenen Zeitpunkten.  Die Auswertung  und Berechnung mit SPSS  gelingt einem meist irgendwie, aber spätestens der Output wird für erstmalige SPSS- Anwender kaum zu deuten sein (vgl. Bühl, S 409). Hier gibt es “Multivariate Tests”, “Test der Innersubjekteffekte”, “Tests der Zwischensubjekteffekte” usw. und überall gibt es signifikante Werte.

Um all die Tabellen zu deuten bedarf es eines statistischen Hintergrundwissens daher beschreibe ich hier ein fiktives  Beispiel für eine Datenreihe mit Messwiederholung.

Die Messwerte sind die Beobachtung von zwei Patienten-Gruppen Kontrollgruppe und Untersuchungsgruppe. Bei den Patienten handelt es sich um Intensivpatienten, beim  Messwert um die Restmenge an Mageninhalt der  über die Zeit beobachtet wird.

Messwiederholung

Abb1: Profildiagramm zu den Daten im Beispiel

Bei der Betrachtung von Messwiederholungen sind zwei wesentliche Eigenschaften von Interesse der Gipfelwert und das Wachstum.  In der Abbildung wird deutlich, dass die Patientengruppe mit der Therapie einen andern Verlauf in der Restmenge aufweist als die Kontrollgruppe.  Start und Endwert sind nicht sehr unterschiedlich, das Maximum ist deutlich unterschiedlich und bei der Kontrollgruppe zeigt sich ein deutlich ausgeprägter Gipfelwert.

Auswerten mit Excel

Der Verlauf eines Gipfelwerts lässt sich bereits mit  MS-Excel  auswerten.  Mit den Bordmitteln von Excel lassen sich Minimum,  Maximum,  Regressionskoefizienten und AUC (Fläche unter der Kurve) berechnen und mit einem T-Test auf Signifikanz prüfen.  Den T-Test gibt es bei Excel über die Analysefunktionen.  Das Excel Beispiel dazu  habe ich hier. (Die zugrunde liegenden Formeln finden sich bei Sachs 2009  Seite 545).

Aus den vorliegenden Ergebnisse lässt sich ableiten: Der Startwert unterscheidet sich nicht signifikant.  Der Maximalwert(p=0,007) und die Fläche (p0,032)  unter der Kurve sind signifikant verschieden. Zum Zeitpunkt der letzten Messung kann aus den Daten kein Unterschied belegt werden.

Tab1:  Wiederholte Messung in zwei Gruppen (Untersuchungsgruppe mit Therapie Kontrollgruppe ohne Therapie) zu 5 verschiedenen Zeitpunkten angegeben. In der Tabelle sind Mittelwerte, T-Wert und Signifikanz. Auswertung mit MS- Excel

Therapie Ja Therapie Nein T-Wert p-Wert
Max 569 843 -2,88 0,007
AUC 1451 1897 -2,22 0,032
REGR -62 -30 -1,22 0,230
Startwert 446 547 -1,11 0,273
Endwert 199 293 -1,56 0,125

Als erste Betrachtung ist diese Auswertung mit Excel durchaus hinreichend für weitergehende Analysen ist es notwendig sich genauer Gedanken über Verteilung der Daten und der zugrunde liegenden Hypothesen zu machen.

Auswerten mit SPSS

Der traditionelle Ansatz für die Analyse von Messwiederholungen ist die Varianzanalyse (ANOVA) die drei spezielle Fragestellungen prüft: die Wechselwirkung zwischen den Gruppen und der Zeit, der Effekt durch den Studienfaktor und der Effekt durch die Wiederholung (Zeit). Mit MS-Excel ist eine solche Auswertung schon recht aufwändig, daher ist es besser mit einer Statistik-Software weiterzuarbeiten.

Wichtige Voraussetzung ist, das die Messwerte angenähert der Normalverteilung entsprechen und das die so genannte Sphärizität gegeben ist (Sphärizität bedeutet das die Differenzen zwischen den Faktorstufen gleich sind).  Weiter  muss man sich Gedanken über das zugrunde liegende Modell machen (Modell I für  feste Effekte, Modell II für  zufällige Effekte oder  Modell III für gemischte Effekte). Wenn die Daten mit SPSS ausgewertet werden,  braucht man sich scheinbar um die zugrunde liegenden Modelle und Voraussetzungen keine Gedanken zu machen.  Da SPSS standardmäßig alles berechnet was eventuell von Nutzen sein könnte und es dem kundigen Nutzer überlässt die relevanten Zahlen zu finden.

Zunächst wird eine Berechnung zum Faktor Zeit und zu den Wechselwirkungen ausgegeben (Multivariate Tests – Methode des allgemeinen linearen Modells) dabei gilt die “Pillai-Spur” als robustester Test.  Es wird ein höchst signifikanter Einfluss der Zeit Festgestellt, die Wechselwirkung mit der Zeit ist hingegen nicht signifikant (Zeit p<0,0001  Zeit:Therapie p=0,385).  Es folgt der Mauchly-Test auf  Sphärizität, er prüft ob die Voraussetzung der Sphärizität gegeben sind. In unserem Beispiel ist der Wert Signifikant (p<0,0001) das bedeutet die Voraussetzung ist nicht gegeben. Daher werden die Ergebnisse in der Tabelle “Tests der Innersubjekteffekte”  (Methode nach Fischer) die Zeile “Greenhouse-Geisser” entnommen. Es ergeben sich ähnliche Ergebnisse wie bei der “Pillai-Spur” (Zeit p<0,0001  Zeit:Therapie p=0,263). Es folgt die Berechnung der Nicht-Messwiederholungsfaktoren (Tests der Zwischensubjekteffekte). Es ergibt sich ein nicht signifikanter Einfluss der Therapie (p=0,073). (Vergl. Bühl 2005)

Tab2:  Multivariate Tests

Effekt Wert F Hypothese df Fehler df Signifikanz
Zeit Pillai-Spur 0,411 7,3 4 42 0,000
Wilks-Lambda 0,589 7,3 4 42 0,000
Hotelling-Spur 0,699 7,3 4 42 0,000
Größte char Wurzel nach Roy 0,699 7,3 4 42 0,000
Zeit* Therapie Pillai-Spur 0,092 1,1 4 42 0,385
Wilks-Lambda 0,908 1,1 4 42 0,385
Hotelling-Spur 0,102 1,1 4 42 0,385
Größte char Wurzel nach Roy 0,102 1,1 4 42 0,385

Tab3:  Mauchly-Test auf Sphärizität prüft ob die Voraussetzung der Sphärizität gegeben ist.

Innersubjekteffekt Mauchly-W Chi-Quadrat df Signifikanz
ZEIT 0,298 53 9 0,000

Tab4: Tests der Innersubjekteffekte

Quelle Quadratsumme vom Typ II df Mittel der Quadrate F Signifikanz
Zeit Sphärizität angenommen 2526380 4,0 631595 7,9 0,000
Greenhouse-Geisser 2526380 3,1 825275 7,9 0,000
Huynh-Feldt 2526380 3,4 746785 7,9 0,000
Untergrenze 2526380 1,0 2526380 7,9 0,007
Zeit* Therapie Sphärizität angenommen 426332 4,0 106583 1,3 0,256
Greenhouse-Geisser 426332 3,1 139267 1,3 0,263
Huynh-Feldt 426332 3,4 126022 1,3 0,261
Untergrenze 426332 1,0 426332 1,3 0,253
Fehler(Zeit) Sphärizität angenommen 14306507 180,0 79481
Greenhouse-Geisser 14306507 137,8 103854
Huynh-Feldt 14306507 152,2 93976
Untergrenze 14306507 45,0 317922

Tab5: Tests der Zwischensubjekteffekte

Quelle Quadratsumme vom Typ II df Mittel der Quadrate F Signifikanz
Intercept 38701552 1 38701552 263,6 0,000
Therapie 493543 1 493543 3,4 0,073
Fehler 6607055 45 146823

Auswerten mit R

Wenn die Auswertung mit R berechnet wird, schaut das Ergebnis kompakter und übersichtlicher aus. Allerdings muss man sich “vorher” Gedanken machen, welche Zusammenhänge wichtig sind. Eine gute Anleitung dazu gibt es hier R and Analysis of Variance und hier  Katholieke Universiteit Leuven, weiterführende Aspekte (Post-Hoc Tests)  beschreibt  Paul Gribble in seinem Blogbeitrag  Repeated Measures ANOVA using R.
Ich habe den traditionellen Ansatz mit einem F-Test gewählt den R-Code dazu gibt es hier zum Ausprobieren dabei habe ich mich weitgehend  an Sachs 2009 Seite 547 angelehnt. Die Berechnungen sind identisch mit denen von SPSS da die gleichen Rechenschritte zugrunde liegen, der Einfluss der Zeit ist signifikant (p<0,0001) die Wechselwirkung hingegen ist nicht signifikant (p=0,257) und er Einfluss der Therapie ist nicht Signifikant (p=0,073).

Tab 6: Auswertung mit R aov(formula = Messwert ~ Therapie * Zeit + Error(Proband))

Error: Proband
Df Sum Sq Mean Sq F value Pr(>F)
Therapie 1 493543 493543 3,36 0,073
Residuals 45 6607055 146823

Tab7: Zwischensubjekteffekte

Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Zeit 4 2526380 631595 7,95 0,000
Therapie:Zeit 4 426332 106583 1,34 0,257
Residuals 180 14306507 79481

Interpretation der Ergebnisse

Die Interpretation der Ergebnisse geht von der Hypothese aus: “Es besteht keine Wechselwirkung zwischen Therapie (Studienfaktor) und der Zeit. Laut den Ergebnissen der Varianzanalyse besteht keine Wechselwirkung mit der Therapie. Im Profildiagramm (Abb. 1) und in der Berechnung der Maximalwerte und der Fläche unter der Kurve (AUC, area under curve) zeichnet sich aber ein messbarer Effekt der Therapie ab.  Die Daten im Beispiel zeigen deutlich das manchmal einfachere Methoden besser geeignet sind Daten zu beschreiben.

Wenn in Bezug auf die Auswertung von Messwiederholungen Fragen offen sind, können Sie sich gerne an mich wenden hier der Link zum Kontaktformular.

Literatur:

[1] Sachs, Lothar ;und Jürgen Hedderich; A ngewandte Statistik : Methodensammlung mit R; Berlin : Springer Berlin, 2009 Angewandte Statistik: Methodensammlung mit R

[2]  Bühl, Achim und Peter Zöfel; SPSS 12. Einführung in die moderne Datenanalyse unter Windows. 9. Auflage. München u.a., Pearson Studium, 2005 SPSS 18 (ehemals PASW): Einführung in die moderne Datenanalyse
[3] Everitt, Brian and Hothorn Torsten; A Handbbook of Statistical Analyses Using R,Chapman & Hall; 2006 (Chapter 10 Analysing Longitudinal Data)

Tagged with:
 

Office 2007 Tabelle als Bild kopieren

Wer schon mal Tabellen, die in Excel erstellt sind und formatiert hat, ist oft enttäuscht über das Ergebnis wenn die Tabelle in Word hinüber kopiert wird. Um Tabellen so zu kopieren wie sie in Excel erstellt wurden, hat Microsoft die Funktion “kopieren als Bild” bereitgestellt. Die Funktion ist aber leider sehr versteckt und nicht nur ich habe lange danach gesucht.
Beim Weblog Peltier Technical Services habe ich dazu eine Anleitung mit Bildern gefunden
A Belated Review of Excel 2007

Excel: Tabelle als Bild kopieren

Tagged with:
 

Kreuztabellen mit Excel

Kreuztabellen und Kontingenzanalyse sind eine sehr häufige Methoden um nominal skalierte Variablen zu untersuchen. Typische Beispiele sind Zusammenhänge zwischen Einkommen, Beruf, Geschlecht, usw. Mit MS- Excel lassen sich solche Zusammenhänge am einfachsten mit Pivot-Tabellen untersuchen und tabellarisch und grafisch darstellen.
Pivot-Tabellen scheinen, wenn man noch nie mit ihnen gearbeitet hat, auf den ersten Blick etwas kompliziert zu sein, sind aber nach kurzer “Eingewöhnungszeit” recht praktisch.

Als fiktives Beispiel untersuche ich hier den Zusammenhang: Haben Manager ein höheres Herzinfarktrisiko als Hilfsarbeiter.

Als erstes braucht man eine Urliste mit den Daten man kann dabei die Merkmale Ausschreiben oder als Zahlen Kodieren.

Urliste Pivot Assistent Pivot

Um die Pivot-Tabelle zu erstellen genügt es den Cursor (Mauszeiger) in die Datenzeile zu bringen und über Daten -> Pivot Tabellen die Funktion Aufzurufen und sofort auf Fertig stellen klicken.
Danach brauch man die entsprechenden Felder nur mehr mit der Maus in die Bereiche Datenfelder, Spaltenfelder,und Zielfelder zu ziehen. Das geht nach einigen probieren recht intuitiv selbst wenn es am Anfang nicht so ausschauen sollte. Eine ausführliche Beschreibung mit vielen Screenshots findet man unter Pivot-Tabellen in Excel (hrz.uni-dortmund.de).

Update leider funktioniert dieser Link nicht mehr hier ein alternativer Link.

Pivot Tabelle

Weiterführende Links
www.faes.de: tiefer gehende Einführung in Kreuz- oder Kontingenztabelle mit Beispielen in Open Office und MS Excel
www.hrz.uni-dortmund.de Pivot Tabellen

Tagged with:
 

Semantisches Differential

Bei dem semantischen Differential oder Profildiagramm handelt es sich um eine mehrdimensionale Methode, bei der emotionale Reaktionen auf Assoziationen erhoben werden.
Die Assoziationsstärke wird dabei mit einer Ratingsskala verknüpft. Ein semantisches Differential (Polaritätsprofils) ist im Grunde eine eine zweipolige Ratingskala (bipolare Ratingskala).

semantisches Differential
Die Methode ist weit verbreitetet in der Image- und Stereotypenforschung. Die Auswertung erfolgt meist nur mit graphischen Methoden, wobei üblicherweise die am positivsten ausgeprägten Merkmale links stehen. In den Graphen können mehrere Linien eingetragen werden wie zB. unterschiedliche Gruppen. Die Graphen in Excel zu erstellen ist gar nicht so trivial, meine Methode ist ein XY Chart zu Erstellen und die Achsenbeschriftung als unsichtbare Linien zu realisieren.
Eine Anleitung für die Achsenbeschriftungen kann man bei Vertical Category Axis finden. Hilfreich ist auch das Add-Ins XY Chart Labeler mit dem man komfortabel seine Labels erstellen kann.

Statistisch wird ein Semantisches Differential mit Hilfe von Korrelationsrechnungen bestimmt. Die jeweiligen Dimensionen lassen sich mit einer Faktorenanalyse untersuchen (Vergl. Borz, Döring S.185).

Literatur: Bortz J, Döring N; Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler; Springer; 2006
Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler

Eigenschaftsprofil

Histogramme mit Excel

Excel kennt zwei Verfahren um Histogramme zu erstellen: Das Erstens ist sie ‘händisch’ zu erstellen, das Zweiten Verfahren ist sie mittels der Analyse- Funktion zu erstellen.

Histogramme und somit Häufigkeiten sind eine gern genutzte Methode um Daten zu verdichten, es wird dabei zwischen absolute Häufigkeit, relative Häufigkeit und kumulative Häufigkeit unterschieden.

Die absolute Häufigkeit gibt an, wie viele Merkmalsträger zu einer bestimmten Merkmalsausprägung in einem Datensatz existieren. Bei der relativen Häufigkeiteng handelt es sich um die absolute Häufigkeit dividiert durch die Anzahl der Objekte in der Grundgesamtheit, sie wird oft in Prozentwerten angegeben. Als kumulative Häufigkeit bezeichnet man die Summenhäufigkeit und eine Summe aller Häufigkeiten bis zu einer bestimmten Merkmalsausprägung.
(Vergl.Wikipedia: Häufigkeiten)

Beispiel: In einem Krankenhaus wurden die Krankentage aller Mitarbeiter über den Zeitrahmen von einem Jahr erfasst.

1 1 2 2 1 3
1 4 1 3 3 7
7 1 2 7 14 0
1 0 0 0 0 0
0 1 2 4 5 14
0 0 0 0 0 0
1 2 3 4 5 6
3 3 3 3 3 3
5 1 2 27 1 0

Urliste

Um in Excel die Häufigkeit zu berechnen, muss im ersten Schritt die Urliste sortiert werden
Urliste Sortieren

Im zweiter Schritt werden die Klassengrenzen definiert. (Ziel der Klassengrenzen ist die Daten zu reduzieren, damit sie übersichtlicher darzustellen sind.)

Im dritter Schritt ist die Excel Funktion Häufigkeit auszuwählen. Bei Daten die sortierte Liste angeben und bei Klassen die gewählten Klassen angeben. Auf Ok klicken.

Häufigkeit
Der vierte Schritt ist ganz wichtig, aber nicht ganz trivial. Excel behandelt Häufigkeiten als Matrixfunktion und die müssen mit einer Tastenkombination aktiviert werden.
Dazu muss die Zelle mit der Funktion und der Bereich darunter (wo die Werte ausgegeben werden) markiert werden und mit der Taste F2 “aktivieren”.

Wichtig: die Eingabe muss mit STRG + UMSCHALT + EINGABE abgeschlossen werden.
F2

Jetzt kann über die Diagrammoptionen ein Balkendiagramm ausgeben und ein Histogramm erstellt werden.

Einfacher geht es aber, wenn man das Add- Ins Analyse- Funktion “Histogramm” verwendet. Diese Add-Ins Analyse Funktion muss vorab in Excel erst installiert werden, ist aber Inhalt von Microsoft Office Paket. Schritt 1 und Schritt 2 bleiben wie oben beschrieben gleich, dann über die Add-Ins die Histogrammfunktion auswählen und den Eingabebereich die sortierte Liste einfügen und den Klassenbereich die Klassengrenzen angeben. Ebenfalls mit OK bestätigen und es wird die Häufigkeiten mit dem Histogramm erstellt.
Add Ins
Bei der Tabelle werden Häufigkeit Kumuliert % 0 Häufigkeit Kumuliert % , das Diagramm muss allerdings noch formatiert werden.

Histogramm
Mehr Info gibt es bei learn-line.nrw.de.

Wenn in Bezug auf die Auswertung von Kreuztabellen Fragen offen sind, können Sie sich gerne an mich wenden hier der Link zum Kontaktformular.

Tagged with: