Odds Ratio und relatives Risiko

Besonders in der Medizin ist der Vergleich zweier Häufigkeiten wichtig. Eine beispielhafte Fragestellung dazu ist: Ist ein neues Medikament oder eine neue Operationstechnik erfolgversprechend? Dabei wird eine Kontrollgruppe mit einer Experimentalgruppe verglichen und untersucht ob für die Untersuchungsgruppe ein Nutzen oder ein Schaden entsteht. Dieser Nutzen bzw. Schaden wird als “relatives Risiko” bezeichnet, das Chancen-Verhältnis eines Nutzens/Schaden wird als Odds Ratio bezeichnet.

Zur Veranschaulichung habe ich hier ein konstruiertes Beispiel. In einer Landesweiten Studie wird die Wirkung eines Luftschadstoffs auf das Auftreten eine bestimmten Krankheit untersucht. Dazu werden in unterschiedlichen Gebieten mit bekannten durchschnittlichen Konzentrationen  eines Luftschadstoffs Erhebungen über das Auftreten einer bestimmten Krankheit durchgeführt.

Tabelle 1: Beispieldaten

Schadstoffkonzentration
Personen >0,1 mg/m³ 4 mg/m³ 14 mg/m³ 23 mg/m³ 64 mg/m³ 121 mg/m³
krank 15 14 16 29 30 25
nicht krank 1575 1367 945 1284 1379 967

Das Gebiet mit einer Konzentration von >0,1 mg/³ sei dabei die Kontrollgruppe. Die Risiko-Maße errechnen sich wir folgt.

(1) Erkrankungsrate bei Exponierten (4 mg/m³): 14/(1367+14) = 0,010
(2) Erkrankungsrate Kontrollgruppe:            15/(1575+15) = 0,009
(3) Relative Risiko:          (14/(1367+14))/(15/(1575+15)) = 1,075
(4) Odds-Ratio:                         (14/15)*(1575/1367) = 1,075

Das Erkrankungsrisiko ist bei einer Konzentration 4 mg/m³ nicht größer als bei Nicht-Exponierten. Eine Zusammenfassung der anderen Werte ist in der Tabelle 2 aufgelistet.  (Das sich die Werte Relatives Risiko und Odds Ratio ähnlich sind ist reiner Zufall und durch runden auf eine Kommastelle bedingt.)

Tabelle 2:  Zusammenfassung der Risiko-Maße  (Erkrankungsrate Kontrollgruppe 0,9%)

Konzentration Erkrankungsrate Relatives Risiko Odds-Ratio Exposition
4 mg/m³ 1,0% 1,1 1,1 kein Effekt
14 mg/m³ 1,7% 1,9 1,9 Schaden
23 mg/m³ 2,2% 2,5 2,5 Schaden
64 mg/m³ 2,1% 2,4 2,4 starker Schaden
121 mg/m³ 2,5% 2,9 2,9 starker Schaden

Aus der Analyse des Odds-Ratio lässt sich ableiten, dass ab einer Konzentration von 14 mg/m³ eine Beeinträchtigung zu erwarten ist. Ob das Ergebnis signifikant ist, lässt sich durch die Risiko-Maße noch nicht beurteilen, dazu müssten noch die Konfidenzintervalle der Odds-Ratio berechnet werden. Eine  Berechnung der 95%-Konfidenzintervalle  kann z.B. mit SPSS über Kreuztabellen angefordert werden oder mit R, mittels der Funktion oddsratio(), die im dem Paket library(vcd) enthalten ist, ausgeführt werden. Die sich abzeichnende Zunahme der Erkrankungsrate kann mit dem Cochran-Armitage Test geprüft werden.

Tabelle 1: Relatives Risiko und Exposition entnommen  Sachs 2009 Seite 569

relatives Risiko Exposition
≤ 0,3 starker Nutzen
0,4 – 0,8 Nutzen
0,9 – 1,1 kein Effekt
1,2 – 2,5 Schaden
2,6 starker Schaden

Literatur:

[1] Sachs, Lothar; und Jürgen Hedderich; A ngewandte Statistik : Methodensammlung mit R; Berlin : Springer Berlin, 2009 Angewandte Statistik: Methodensammlung mit R

Tagged with:
 

Kano-Modell

Die Kundenzufriedenheitsanalyse mit der Kano-Methode ist eine leider viel zu wenig beachtete Befragungsmethode.
Das Kano-Modell wurde von Noriaki Kano in den 70ern für die Firma Konica (Minolta Kameras) entwickelt. Die Marketingabteilung stellte damals fest, dass Kunden bei einer direkten Befragung nur geringfügige Änderungen am Produkt wünschten. Ein tief greifendes Verständnis der unausgesprochenen Bedürfnisse des Kunden konnte nicht abgeleitet werden.
Kano entwickelte daraufhin eine Methode die Wünsche und Erwartungen von Kunden zu erfassen.

Das Kano-Modell unterscheidet fünf Ebenen der Qualität:
Basis-Merkmale, selbstverständlich Eigenschaft (Must-be)
Leistungs-Merkmale, bewusste Eigenschaften (One-dimensional)
Begeisterungs-Merkmale, nutzen stiftende Merkmale (Attractive)
Unerhebliche Merkmale (Indifferent)
Rückweisungs-Merkmale (Reverse)

Der so genannte Kano-Fragebogen besteht aus zwei hypothetischen Fragen, die funktionale Frage und die dysfunktionale Frage. Für die Beantwortung steht eine sechsteilige Antwortskala bzw. eine dreiteilige modifizierte Antwortskala zur Verfügung.
Die funktionale Frage bezieht sich auf vorhandene Attribute eines Produkts
und die dysfunktionale Frage auf die Nicht-Existenz des Attributs.

Beispiel:
Das Geschäft ist leicht zu finden. Was denken Sie darüber?
• Das würde mich sehr freuen
• Das setze ich voraus
• Das ist mir egal

Das Geschäft ist nicht leicht zu finden. Was denken Sie darüber?
• Das ist mir egal
• Das könnte ich in Kauf nehmen
• Das würde mich sehr stören

Die Datenerhebung ist die eigentliche Herausforderung eines Kano-Umfrageprojektes. Durch den Aufbau der Fragen ist die Befragung sehr monoton und verlangt viel Einsatz vom Befragten. Es ist daher für den Erfolg der Untersuchung wichtig seine Untersuchungsgruppe genau zu kennen und Anweisungen zum richtigen Ausfüllen in Form von Beispielen dem Fragebogen beizulegen.

Die Datenanalyse der Kano-Methode erfolgt über Auswertung nach Häufigkeiten dazu existieren Auswertungsregeln. Technisch werden die Häufigkeiten mittels der Auswertungstabelle kodiert. Bei wenigen Daten empfiehlt es sich die Kodierung händisch zu erfassen. Bei großen Datenmengen mit Excel oder Open Office über Formeln (wenn dann Bezüge) mit SPSS geht es über Umcodieren der Variablen. Am eleganteste geht es mit der Statistik-Software R.

Category Strength ist eine Maßzahl die die angibt ob eine Anforderung nur in eine Kategorie gehört.

Total Strength als zweite Maßzahl gibt an wie hoch der Anteil an bedeutenden Produktmerkmalen ist.

Eine detaillierte Datenanalyse stellen die Kundenzufriedenheitskoeffizienten dar (CS+ Zufriedenheits-Koeffizient und CS- Un-Zufriedenheits-Koeffizient ).

Der Wertebereich reicht von eins bis null (CS+) und von null bis minus eins (CS-). Werte ab 0,5 bzw.-0,5 werden als bedeutsam betrachtet.

Self-Stated Importance (Fong-Test) Signifikanz der Zuordnung

auswertung-kano
Beispiel Auswertung Kano-Methode

kano-zufriedenheit
Beispiel Grafik Kano-Methode Zufriedenheitsfaktoren


Literatur:
[1] Elmar Sauerwein; Das Kano-Modell der Kundenzufriedenheit; 2000 Das Kano- Modell der Kundenzufriedenheit.

[2] Wikipedia; Kano-Modell; http://de.wikipedia.org/wiki/Kano-Modell

[3] Jörg A. Holzing; Die Kano-Theorie der Kundenzufriedenheitsmessung; 2008 Die Kano-Theorie der Kundenzufriedenheitsmessung: Eine theoretische und empirische Überprüfung

Beratung:
Wenn Sie eine Professionelle Auswertung Ihrer Daten benötigen können Sie mich gerne kontaktieren.
DI Wolfgang Peter Data Engineering & Statistics www.statistik-peter.at

Marktforschungs- Wiki

Seit kurzem gibt es ein interessantes Marktforschungs-Wiki. Das Wiki beschäftigt sich mit Marktforschung und Datenanalyse. Das Projekt ist derzeit im Aufbau begriffen, es existieren bereits mehr als 80 Artikel die Themen reichen von “Alternativhypothese” bis “zweifaktorielle Varianzanalyse”. Gründer und Administrator des offenen Wiki ist Christian Reinboth ein freiberuflicher Berater für Markt- und Meinungsforschung. Mein erster Eindruck von der Seite ist sehr positiv, angenehm auch das auf die Umsetzung mit SPSS eingegangen wird.

Tagged with:
 

Methodenbaukasten

Im Rahmen des Projekts MethodenBaukasten werden Video- und Audiovorträge zu verschiedenen sozial- und wirtschaftswissenschaftlicher Fachbereiche zur Verfügung gestellten. Die Inhalte dürfen zu Lehrzwecken frei genutzt werden.
Beispiele: Online-Befragungen (Univ.-Prof. Dr. Bernad Batinic), Bivariate Zusammenhänge (Dr. Markus Appel)

Johannes Kepler Universität Linz elearning.jku.at

 

Semantisches Differential

Bei dem semantischen Differential oder Profildiagramm handelt es sich um eine mehrdimensionale Methode, bei der emotionale Reaktionen auf Assoziationen erhoben werden.
Die Assoziationsstärke wird dabei mit einer Ratingsskala verknüpft. Ein semantisches Differential (Polaritätsprofils) ist im Grunde eine eine zweipolige Ratingskala (bipolare Ratingskala).

semantisches Differential
Die Methode ist weit verbreitetet in der Image- und Stereotypenforschung. Die Auswertung erfolgt meist nur mit graphischen Methoden, wobei üblicherweise die am positivsten ausgeprägten Merkmale links stehen. In den Graphen können mehrere Linien eingetragen werden wie zB. unterschiedliche Gruppen. Die Graphen in Excel zu erstellen ist gar nicht so trivial, meine Methode ist ein XY Chart zu Erstellen und die Achsenbeschriftung als unsichtbare Linien zu realisieren.
Eine Anleitung für die Achsenbeschriftungen kann man bei Vertical Category Axis finden. Hilfreich ist auch das Add-Ins XY Chart Labeler mit dem man komfortabel seine Labels erstellen kann.

Statistisch wird ein Semantisches Differential mit Hilfe von Korrelationsrechnungen bestimmt. Die jeweiligen Dimensionen lassen sich mit einer Faktorenanalyse untersuchen (Vergl. Borz, Döring S.185).

Literatur: Bortz J, Döring N; Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler; Springer; 2006
Forschungsmethoden und Evaluation: für Human- und Sozialwissenschaftler

Eigenschaftsprofil

Mixed-Mode in der Online-Marktforschung

Im Zuge der G.O.R. 07 habe ich ja am Workshop von Holger Geissler (D.G.O.F.) teilgenommen, hier kommt eine kurze Zusammenfassung.

Unter Mixed Mode sind die Variation der Erhebungsmethoden im Zuge einer Messung zu verstehen.
Das einfachste Beispiel für Mixed Mode ist ein Reminder in Form einer Postkarte, die man einem Online-Access-Panel Teilnehmer zwecks Erhöhung der Stchprobenausschöpfung zusendet. Aus Anwendersicht ist Mixed Mode also das Mischen verschiedener Befragungsvarianten.

Der Grund warum verschiedene Modes verwendet werden, kann eine bessere Repräsentativität (Erreichbarkeit der Zielgruppe) sein oder eine bessere Ökonomie (Kosten Minimieren) oder eine Erhöhung der Validität der Daten.
Die Vorteile von Mixed Mode liegen also klar auf der Hand, will man eine repräsentative Umfrage bei einer heterogenen Gruppe ökonomisch durchführen, wird man auf verschiedene Modi zurückgreiden. Zum Beispiel die Rentner und Hausfrauen telefonisch befragen, Studierende online und eventuell eine spezielle Gruppe Face-to-Face.
Die Frage die sich aufdrängt ist, können Methodeneffekte auftreten.
Durch die Zusammensetzung der Stichprobe, durch Ortseffekte, Settingeffekte (anonym vs. persönlich), Effekte der Stimulusdarbietung (schriftlich-visuell vs akustisch) oder durch Skaleneffekte.

Stichprobeneffekte
Verschiedene Modes besitzen unterschiedliche Stichprobenzusammensetzung die zu unterschiedlichen Ergebnissen führen kann. Diese Ergebnisse müssen interpretiert werden und der “wahre” Wert kann nicht erklärt werden.
Wenn die Stichproben strukturell vergleichbar sind sind die Unterschiede in den Ergebnissen eher gering. Die Varianzen können aber, auf Grund von unsymetrischen Messfehlern, voneinander abweichen was Optimierungsproblem der unterschiedlichen Modie führen kann.

Settingeffekte
Bei Face-to-Face oder Telefon- Umfragen übt die Interviewer “Druck” auf den Befragten aus z.B. Zeitdruck der Interviewer kann die Zeit zum Nachdenken begrenzen. Ein weiterer Effekt ist der Zustimmungseffekt (Acquiescence) Befragte stimmen, bei persönlichen Verfahren, Fragen eher zu bejahen als sie zu verneinen. (Sie antworten also bei Ja/Nein Fragen eher mit Ja.) Lösungsansatz ist eine Variation der Fragen und wenn möglich ein “umdrehen” der Items.
– X bietet viele interessante Produkte.
– X bietet wenige interessante Produkte.

Kultureffekte
Kultureffekte sind vielschichtig. Das fängt bei der Übersetzung an und endet mit der Frage was kann ich wo und wie fragen.
Grundsätzlich gibt es unterschiedliche Antwortstile in verschiedenen Kulturen (z.B. Tendenz zu extremen Antworten).
Auch bei scheinbar kulturell vergleichbaren Gruppen wie z.B. die Westösterreicher (Tirol, Salzburg, Kärnten) mit Ostösterreichern (Wien) kann man feststellen dass bei einem CATI Interview mit einem Wiener Interviewer ein Westösterreicher tendenziell ablehnender reagiert.
Lösungsansatz: Bewertung im Kontext des jeweiligen Landes oder Marktsegmentes und unter Berücksichtigung von möglichen Kutureffekten.
Bei “weichen” Fragen ist auf die relativen Ergebnisse / Unterschiede bei “harten” Fragen auf absolute Werten zu fokussieren.


Probleme der Modes in der Zukunft

Es ist zu erwarten dass telefonische Befragungen durch die zunehmende Menge an Befragungen, zuhnemend bei der Bevölkerung auf Ablehnung stoßen wird. durch die Zunahme am Mobilfunkanschlüssen wird zudem die Gruppe reduziert.
Bei den Onlinbefragungen zeichnet sich ein ähnliches Bild ab, die Inflation an Befragungen führt zunehmend zu einer Frustration der Panelteilnehmer. Die Zunahme von Spam erschwert zunehmend die Rekrutierung per Email.
Bei der Postalischen Befragung ist durch die tägliche Werbeflut auch ein Akzeptanzproblem zu erwarten. Die Bevölkerung ist nicht mehr in der Lage Werbung und Befragungen zu unterscheiden. Das ergibt ein riesiges Problem für die Befragungen in der Zukunft, da sich die Werbewirtschaft und Marktforschungsinstitute zunehmend den Markt übersättigen.

Zusammenfassend ist zu Mixed Mode zu sagen, dass das Forschungsfeld der gemischten Methoden noch viel Forschungsspielraum offen lässt und zunehmend als Forschungsfeld an Bedeutung gewinnt.

Der Workshop mit dem Referenten Hr. Holger Geissler war hoch interessant, sehr professional und für mich ein Highlight auf der diesjährigen G.O.R.

Quelle: Passagen des Textes wurden sinngemäß aus den Workshopunterlagen und dem Workshop von Holger Geissler (G.O.R. 2007) entnommen.