Semantisches Differential

Bei dem semantischen Differential oder Profildiagramm handelt es sich um eine mehrdimensionale Methode, bei der emotionale Reaktionen auf Assoziationen erhoben werden.
Die Assoziationsstärke wird dabei mit einer Ratingsskala verknüpft. Ein semantisches Differential (Polaritätsprofils) ist im Grunde eine eine zweipolige Ratingskala (bipolare Ratingskala).

semantisches Differential
Die Methode ist weit verbreitetet in der Image- und Stereotypenforschung. Die Auswertung erfolgt meist nur mit graphischen Methoden, wobei üblicherweise die am positivsten ausgeprägten Merkmale links stehen. In den Graphen können mehrere Linien eingetragen werden wie zB. unterschiedliche Gruppen. Die Graphen in Excel zu erstellen ist gar nicht so trivial, meine Methode ist ein XY Chart zu Erstellen und die Achsenbeschriftung als unsichtbare Linien zu realisieren.
Eine Anleitung für die Achsenbeschriftungen kann man bei Vertical Category Axis finden. Hilfreich ist auch das Add-Ins XY Chart Labeler mit dem man komfortabel seine Labels erstellen kann.

Statistisch wird ein Semantisches Differential mit Hilfe von Korrelationsrechnungen bestimmt. Die jeweiligen Dimensionen lassen sich mit einer Faktorenanalyse untersuchen (Vergl. Borz, Döring S.185).

Literatur: Bortz J, Döring N; Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler; Springer; 2006
Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler

Eigenschaftsprofil

Histogramme mit Excel

Excel kennt zwei Verfahren um Histogramme zu erstellen: Das Erstens ist sie ‘händisch’ zu erstellen, das Zweiten Verfahren ist sie mittels der Analyse- Funktion zu erstellen.

Histogramme und somit Häufigkeiten sind eine gern genutzte Methode um Daten zu verdichten, es wird dabei zwischen absolute Häufigkeit, relative Häufigkeit und kumulative Häufigkeit unterschieden.

Die absolute Häufigkeit gibt an, wie viele Merkmalsträger zu einer bestimmten Merkmalsausprägung in einem Datensatz existieren. Bei der relativen Häufigkeiteng handelt es sich um die absolute Häufigkeit dividiert durch die Anzahl der Objekte in der Grundgesamtheit, sie wird oft in Prozentwerten angegeben. Als kumulative Häufigkeit bezeichnet man die Summenhäufigkeit und eine Summe aller Häufigkeiten bis zu einer bestimmten Merkmalsausprägung.
(Vergl.Wikipedia: Häufigkeiten)

Beispiel: In einem Krankenhaus wurden die Krankentage aller Mitarbeiter über den Zeitrahmen von einem Jahr erfasst.

1 1 2 2 1 3
1 4 1 3 3 7
7 1 2 7 14 0
1 0 0 0 0 0
0 1 2 4 5 14
0 0 0 0 0 0
1 2 3 4 5 6
3 3 3 3 3 3
5 1 2 27 1 0

Urliste

Um in Excel die Häufigkeit zu berechnen, muss im ersten Schritt die Urliste sortiert werden
Urliste Sortieren

Im zweiter Schritt werden die Klassengrenzen definiert. (Ziel der Klassengrenzen ist die Daten zu reduzieren, damit sie übersichtlicher darzustellen sind.)

Im dritter Schritt ist die Excel Funktion Häufigkeit auszuwählen. Bei Daten die sortierte Liste angeben und bei Klassen die gewählten Klassen angeben. Auf Ok klicken.

Häufigkeit
Der vierte Schritt ist ganz wichtig, aber nicht ganz trivial. Excel behandelt Häufigkeiten als Matrixfunktion und die müssen mit einer Tastenkombination aktiviert werden.
Dazu muss die Zelle mit der Funktion und der Bereich darunter (wo die Werte ausgegeben werden) markiert werden und mit der Taste F2 “aktivieren”.

Wichtig: die Eingabe muss mit STRG + UMSCHALT + EINGABE abgeschlossen werden.
F2

Jetzt kann über die Diagrammoptionen ein Balkendiagramm ausgeben und ein Histogramm erstellt werden.

Einfacher geht es aber, wenn man das Add- Ins Analyse- Funktion “Histogramm” verwendet. Diese Add-Ins Analyse Funktion muss vorab in Excel erst installiert werden, ist aber Inhalt von Microsoft Office Paket. Schritt 1 und Schritt 2 bleiben wie oben beschrieben gleich, dann über die Add-Ins die Histogrammfunktion auswählen und den Eingabebereich die sortierte Liste einfügen und den Klassenbereich die Klassengrenzen angeben. Ebenfalls mit OK bestätigen und es wird die Häufigkeiten mit dem Histogramm erstellt.
Add Ins
Bei der Tabelle werden Häufigkeit Kumuliert % 0 Häufigkeit Kumuliert % , das Diagramm muss allerdings noch formatiert werden.

Histogramm
Mehr Info gibt es bei learn-line.nrw.de.

Wenn in Bezug auf die Auswertung von Kreuztabellen Fragen offen sind, können Sie sich gerne an mich wenden hier der Link zum Kontaktformular.

Tagged with:
 

Mixed-Mode in der Online-Marktforschung

Im Zuge der G.O.R. 07 habe ich ja am Workshop von Holger Geissler (D.G.O.F.) teilgenommen, hier kommt eine kurze Zusammenfassung.

Unter Mixed Mode sind die Variation der Erhebungsmethoden im Zuge einer Messung zu verstehen.
Das einfachste Beispiel für Mixed Mode ist ein Reminder in Form einer Postkarte, die man einem Online-Access-Panel Teilnehmer zwecks Erhöhung der Stchprobenausschöpfung zusendet. Aus Anwendersicht ist Mixed Mode also das Mischen verschiedener Befragungsvarianten.

Der Grund warum verschiedene Modes verwendet werden, kann eine bessere Repräsentativität (Erreichbarkeit der Zielgruppe) sein oder eine bessere Ökonomie (Kosten Minimieren) oder eine Erhöhung der Validität der Daten.
Die Vorteile von Mixed Mode liegen also klar auf der Hand, will man eine repräsentative Umfrage bei einer heterogenen Gruppe ökonomisch durchführen, wird man auf verschiedene Modi zurückgreiden. Zum Beispiel die Rentner und Hausfrauen telefonisch befragen, Studierende online und eventuell eine spezielle Gruppe Face-to-Face.
Die Frage die sich aufdrängt ist, können Methodeneffekte auftreten.
Durch die Zusammensetzung der Stichprobe, durch Ortseffekte, Settingeffekte (anonym vs. persönlich), Effekte der Stimulusdarbietung (schriftlich-visuell vs akustisch) oder durch Skaleneffekte.

Stichprobeneffekte
Verschiedene Modes besitzen unterschiedliche Stichprobenzusammensetzung die zu unterschiedlichen Ergebnissen führen kann. Diese Ergebnisse müssen interpretiert werden und der “wahre” Wert kann nicht erklärt werden.
Wenn die Stichproben strukturell vergleichbar sind sind die Unterschiede in den Ergebnissen eher gering. Die Varianzen können aber, auf Grund von unsymetrischen Messfehlern, voneinander abweichen was Optimierungsproblem der unterschiedlichen Modie führen kann.

Settingeffekte
Bei Face-to-Face oder Telefon- Umfragen übt die Interviewer “Druck” auf den Befragten aus z.B. Zeitdruck der Interviewer kann die Zeit zum Nachdenken begrenzen. Ein weiterer Effekt ist der Zustimmungseffekt (Acquiescence) Befragte stimmen, bei persönlichen Verfahren, Fragen eher zu bejahen als sie zu verneinen. (Sie antworten also bei Ja/Nein Fragen eher mit Ja.) Lösungsansatz ist eine Variation der Fragen und wenn möglich ein “umdrehen” der Items.
– X bietet viele interessante Produkte.
– X bietet wenige interessante Produkte.

Kultureffekte
Kultureffekte sind vielschichtig. Das fängt bei der Übersetzung an und endet mit der Frage was kann ich wo und wie fragen.
Grundsätzlich gibt es unterschiedliche Antwortstile in verschiedenen Kulturen (z.B. Tendenz zu extremen Antworten).
Auch bei scheinbar kulturell vergleichbaren Gruppen wie z.B. die Westösterreicher (Tirol, Salzburg, Kärnten) mit Ostösterreichern (Wien) kann man feststellen dass bei einem CATI Interview mit einem Wiener Interviewer ein Westösterreicher tendenziell ablehnender reagiert.
Lösungsansatz: Bewertung im Kontext des jeweiligen Landes oder Marktsegmentes und unter Berücksichtigung von möglichen Kutureffekten.
Bei “weichen” Fragen ist auf die relativen Ergebnisse / Unterschiede bei “harten” Fragen auf absolute Werten zu fokussieren.


Probleme der Modes in der Zukunft

Es ist zu erwarten dass telefonische Befragungen durch die zunehmende Menge an Befragungen, zuhnemend bei der Bevölkerung auf Ablehnung stoßen wird. durch die Zunahme am Mobilfunkanschlüssen wird zudem die Gruppe reduziert.
Bei den Onlinbefragungen zeichnet sich ein ähnliches Bild ab, die Inflation an Befragungen führt zunehmend zu einer Frustration der Panelteilnehmer. Die Zunahme von Spam erschwert zunehmend die Rekrutierung per Email.
Bei der Postalischen Befragung ist durch die tägliche Werbeflut auch ein Akzeptanzproblem zu erwarten. Die Bevölkerung ist nicht mehr in der Lage Werbung und Befragungen zu unterscheiden. Das ergibt ein riesiges Problem für die Befragungen in der Zukunft, da sich die Werbewirtschaft und Marktforschungsinstitute zunehmend den Markt übersättigen.

Zusammenfassend ist zu Mixed Mode zu sagen, dass das Forschungsfeld der gemischten Methoden noch viel Forschungsspielraum offen lässt und zunehmend als Forschungsfeld an Bedeutung gewinnt.

Der Workshop mit dem Referenten Hr. Holger Geissler war hoch interessant, sehr professional und für mich ein Highlight auf der diesjährigen G.O.R.

Quelle: Passagen des Textes wurden sinngemäß aus den Workshopunterlagen und dem Workshop von Holger Geissler (G.O.R. 2007) entnommen.

 

Exakter Fisher-Test

In der letzten Zeit ist öfter die Frage, nach dem F-Wert und welcher signifikante Wert den der richtige Wert ist, an mich herangetragen worden. Also gleich vorweg, ein F-Wert hat mehr etwas mit Mikrobiologie zu tun als mit Statistik. Es gibt einen F-Test der grob gesagt die Varianzen testet und den Exakter Fisher-Test der wie ein Chi²-Test zu interpretieren ist und eine F-Verteilung … und…und…
Man soll sich bloß nicht verwirren lassen “Exakt” ist ein mathematischer Terminus und bedeutet das Gegenteil von Approximativ, also schon bei kleinen Stichprobengrössen “richtig” (vergl. www.reiter1.com/Glossar). Und Ronald Aylmer Fisher war ein Bedeutender Statistiker der vielen Tests seinen Namen gab.

Der Exakter Fisher-Test wird immer dann verwendet, wenn man eine 2×2 Kreuztabelle vorliegen hat bei der die Beobachtung (Zellenhäufigkeit) sehr gering ist, so als Faustregel wird ein Wert von unter 5 angegeben. (Oder exakter; wenn Erwartungswerte kleiner 5 auftreten.)
Der “Exakte Fisher-Test” liefert uns als Ergebnis eine “bedingte Wahrscheinlichkeit”.
Es können zwei p-Werten errechnet werden. Exakte Signifikanz (1-seitig): Die einseitige Wahrscheinlichkeit wird benutzt, wenn getestet werden soll, ob die Merkmale sich gegenseitig negativ beeinflussen. (Manche Programme berechnen hier zwei Werte einen “Links” und einen “Rechs” ist aber exakt das gleiche wie 1-seitig). Exakte Signifikanz (2-seitig): Der zweiseitige Test ist anzuwenden, wenn eine allgemeine Abhängigkeit nachgewiesen werden soll (vergl. Øyvind Langsrud). In den meisten Fragestellungen ist der 2-seitig anzuwenden, aber es kommt immer auf die Fragestellung an.
Berechnen kann man den Test mit fast allen Statistikprogrammen oder auch Online bei www.matforsk.no. Unter SPSS findet sich der Test unter -> Analysieren -> Deskriptive Statistiken -> Kreuztabellen wenn man die Option Chi² auswählt (Wird nur bei 2×2 Tabellen berechnet).

Mit Gnu R Lässt sich der Exakter Fisher-Test so berechnen:

x <- matrix(c(37,3,45,15),2,2) # Erstellung der Kreuztabelle
dimnames(x) <- list(c("Maenner", "Frauen"), c("Ja", "Nein"))

fisher.test(x) # Ausfuehren des Exakter Fisher-Test
chisq.test(x) # Ausfuehren des Exakter Chi-Quadrat-Test

Weiter Optionen
"two.sided", "greater" or "less".
fisher.test(x, alternative = "two.sided")
Mehr zur Syntax in Gnu R gibt es bei www.maths.lth.se

Gnu R Fischer Test

Tagged with:
 

Bessere Grafiken

Mike Dickison beschreibt in seinem Blog Pictures of Numbers wie man Grafiken verständlicher gestalten kann.
Seine Ratschläge sind:
Die Achsen sind in der Form zu beschriften, dass nach Möglichkeit alle Information beim Graphen stehen. Zur bessern Lesbarkeit soll die Beschriftung, im Falle vertikalen Achsen, so gedreht werden, dass der Leser sie ohne Verrenkungen lesen kann. Vermeiden soll man in jedem Fall logarithmische Einheiten, weil diese Einheiten für den Leser sehr schwer zu interpretieren sind.

Bei nicht dezimalen Einheiten wie zum Beispiel Winkel, soll nicht auf dezimale Einheiten umgerechnet werden. Auch bei Datum und Monatsangaben soll auf eine dezimale Darstellung verzichtet werden.

Bessere Grafiken
Quelle: Better Axes www.giantflightlessbirds.com/numberpix/2006/06/better_axes.html

Werbung

Tagged with:
 

Können Zahlen lügen

Quarks & Co (WRD) beschäftigte sich in einer Sendung vom 17.10 mit Zahlen und Statistik. Für alle die die Sendung verpasst haben oder diejenigen die keinen Fernseher besitzen, hat der WRD das Thema im Internet aufbereitet.

Mit Zahlen lügen Quarks & Co taucht ein in die Welt der Zahlen und erklärt, wie man mit ihnen lügen kann … und warum ein Ganzes nicht immer aus 100 Prozent besteht.

Es werden unter anderem Themen wie: “Was macht eigentlich das Statistische Bundesamt?” oder “Tödliche Zahlen: Medizinstatistiken” aufbereitet. Überaus interessant ist der Beitrag “Die schlechtesten Grafiken der Welt” darin werden verschiedene Grafiken aus Printmedien unter die Lupe genommen.
Die Sendung gibt es als VideoPodcast zum Herunterladen und alle verwendeten Quellen stehen als Links auf der Seite von www.quarks.de zur Verfügung.

Gefunden via Lernpfade.

 

Fragebogen gestalten

Um sich die Arbeit des Layoutens eines Fragebogens zu erleichtern gibt es viele Wege. Eine Möglichkeit ist man verwendet Grafstat, ein durchaus mächtiges Tool um Fragebögen (auch Onlineumfragen) zu gestalten und einfache Auswertungen zu erstellen. Oder man verwendet eine Word- Dokumentenvorlage. Eine solche habe ich auf der Seite www.gesis.org gefunden.

 

Analysefunktionen von Excel

Mit Ms- Excel lassen sich gut einfache Statistiken erstellen. Um den vollen Funktionsumfang zu nutzen, muss die Analyse-Funktionen erst einmal als Add-Ins installiert werden. Das geht über Extras => Add-Ins => Analyse-Funktionen. Nach der Installation wählt der Anwender die Analyse-Funktionen und klickt auf Ok.
Nach dem Instalieren findet ist unter Extras den Menüpunkt Analyse-Funktionen zu finden.
Folgende Analyse-Funktionen stehen zur Verfügung.

  • Einfaktorielle ANOVA
  • Zweifaktorielle ANOVA ohne Messwiederholung
  • Zweifaktorielle ANOVA mit Messwiederholung
  • Korrelation
  • Kovarianz
  • Populationskenngrössen
  • Exponentielles Glätten
  • F-Test
  • Fourier Analyse
  • Histogramm
  • Gleitender Mittelwert
  • Zufallsgenerator
  • Rang und Quantil
  • Regression
  • Ziehung von Stichproben
  • t-Test: Gepaarte Stichproben
  • t-Test: Gleiche Varianzen
  • t-Test: Ungleiche Varianzen
  • Z-Test

Sehr gut aufbereitete Veranschaulichungsbeispiele befinden sich in der Exceldatei von Thomas Reiter.

 

Korrelationskoeffizient

Es gibt sehr viele verschiedene Korrelationsmaße, vorallem in der Psychologie werden StudentInnen mit dem Begriff konfrontiert. Was bedeutet nun eigentlich der Begriff eine ’signifikante Korrelation’?
Nehmen wir das als Beispiel die Pisastudie aus dem Jahr 2000.

Die statistische Prüfung des Zusammenhangs zwischen Leseleistung und kulturellen Aktivitäten ergab innerhalb der Länder eine signifikante Korrelation von r = 0,23. Aus den Ergebnissen der Mehrebenen-Analysen darf jedoch angenommen werden, dass beide Variablen, kulturelle Aktivitäten und Lese-Kompetenz sehr stark mit sozioökonomischem Status (u.a. Bildungsstand der Eltern) konfundiert sind.
Quelle: www.pisa-austria.at http://www.pisa-austria.at/pisa2000/international/kap4/kap4_lang.htm

Bei Korrelationsanalysen geht es um den Zusammenhang zwischen den Variablen. Mit der Maßzahl Korrelationskoeffizient wird die Stärke des Zusammenhangs bestimmt. Dieser Koeffizient wird meist mit r bezeichnet und kann Werte zwischen -1 und +1 annehmen. [vergl SPSS Version 12 - Achim Bühl / Peter Zöfel]

  • bis 0,2 => sehr geringe Korrelation
  • bis 0,5 => geringe Korrelation
  • bis 0,7 => mittlere Korrelation
  • bis 0,9 => hohe Korrelation
  • über 0,9 => sehr hohe Korrelation

Im zitierten Beispiel haben wir also eine geringe Korrelation zwischen Leseleistung und kulturellen Aktivitäten die signifikant sind. Im Beispiel ist die Signifikanz allerdings von geringer praktischer Aussagekraft. Studien mit großer Fallzahl führen aufgrund der hohen statistischen Power oft zu hoch signifikanten Ergebnissen. [vergl wikipedia.org]
In der Pisa-Studie wurde alles korrekt beschrieben, trotzdem werden fachlich fremde Personen die Aussagen über die Studie in die Richtung deuten, dass ein Zusammenhang zwischen Lese-Kompetenz und sozioökomischen Status besteht. Signifikante Korrelation wird meiner Erfahrung von nicht Statistikern oftmals als starker Zusammenhang interpretiert.

Berechnung von Korrelationen
Korrelation können mit Excel oder OpenOffice berechnet werden:
BESTIMMTHEITSMASS(Y_Werte;X_Werte)Liefert das Quadrat des Pearsonschen Korrelationskoeffizienten
KORREL(Y_Werte;X_Werte) Liefert den Korrelationskoeffizient zweier Reihen von
mit OpenOffice lässt sich auch PEARSON der Pearsonschen Produktmoment-Korrelationskoeffizient berechnen. PEARSON(Y_Werte;X_Werte)
Weitere statistische Tipps & Tricks zu Microsoft Excel findet man auf www.uni-tuebingen.de. (Update: leider existiert diese Seite nicht mehr)

Regressionsgerade mit Excel und Open Office berechnen:
STEIGUNG(Y_Werte;X_Werte) und ACHSENABSCHNITT(Y_Werte;X_Werte)
mit Excel geht das aber auch komfortabler, indem man ein sich ein x-y Diagramm erstellt und sich die Regressionsgerade anzeigen lässt und eine Gleichung anfordert. Siehe Anleitung an einem Beispiel aus der Chemie der Uni Regensburg.
Vertiefende Information zum Thema Korrelationskoeffizient findet man im Glossar von Thomas Reiter auf www.reiter1.com.
Etwas ausführlicher Information speziell für Psychologen gibt es auf der Seite www.sgipt.org.

 

Pisa 2000

Die PISA-Studie ist nicht nur aus bildungspolitischer Sicht eine hochinteressante Studie, sondern auch aus statistischer Sicht interessant.

“Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden. Der Satz »Mit Statistik kann man alles beweisen« gilt nur für die Bequemen, die keine Lust haben, genau hinzusehen.” Elisabeth Noelle-Neumann

Auf der Homepage www.emilea.de sind im Zuge eines online Statistik-Kurses Einblicke in die PISA-Studie dargestellt.Es findet eine methodenkritische Betrachtung der ersten PISA-Erhebung von 2000 statt. Dabei stehen insbesondere die verwendeten Statistikmethoden im Vordergrund. Sie sollen Interessierten anhand von weiteren Ausführungen näher gebracht werden. Prof. Dr. Claus Möbus

Eine mathematisch u.- statistische tiefergehende Betrachtung der PISA-Studie finden Interessierte auf der Seite von www.pisa2000.de dort gibt es eine statistisch-methodische Evaluation der PISA-Studie (Dissertation) von Frank Gaeth der sehr detailiert die statistische Seite der PISA-Studie beleuchtet.