Data manipulation with dplyr

Das Tutorial Data manipulation with dplyr mit Hadley Wickham
ist auf der UseR! 2015 in Aalborg für mich das erste Highlight.

Tutorial UseR! 2015 in Aalborg Dänemark

Tutorial UseR! 2015 in Aalborg Dänemark

Ich denke, da werden gerade mit den Keynotes noch einige weitere Highlights folgen. Neben sehr netten Leuten, mit denen ich mich schon unterhalten konnte, ist auch das Wetter sehr schön hier in Dänemark.

Tagged with:
 

R-Conference 2015

Ich freue mich schon auf die R-Konferenz in Aalborg Ende Juni.
Am 30. Juni startet die diesjährige R-Konferenz in Aalborg mit den Tutorials, wo ich auch teilnehmen werde.

Aalborg.

Bis 3 Juli findet die Konferenz statt, bei der ich dieses mal dabei sein kann.
Die Reise ist gebucht und ich freue mich darauf viele tolle neue Inputs zu bekommen und nette Menschen kennen zu lernen bzw. wieder zu treffen.

Tagged with:
 

geplante Konferenzen 2009

Zwei Konferenzen sind im Arbeitsjahr 2009 schon eingeplant.
1. die R Conference in Rennes vom 8. bis 10 Juli in Rennes
und 2. die GOR 09 welche dieses Jahr Anfang April in Wien stattfindet.

 

useR! 2008

Kaum bin ich zurück von der UseR2008 in Dortmund gibt es auf der Seite www.r-project.org schon die Vorankündigung für die useR! 2009 in Rennes (08-10 Juli 2009).

Beeindruckend auf der useR 2008 war für mich die internationale Entwickler-Community kennen zulernen und deren spannende Vorträge zu hören. Besonders hilfreich war der Beitrag von Duncan Murdoch “Package Development in Windows”, weil kleine Tipps nicht in der Literatur zu finden ist.

Von den vielen Sessions mit den unterschiedlichen Themenbereichen von “Applied Statistics & Biostatistics” bis zu “Visualization & Graphics” konnte ich leider nur eine begrenzte Anzahl besuchen, da mehrere Sessions parallel liefen.

Von den vielen Eindrücken möchte ich einzelne Thesen zu R festhalten. Graham J. Williams (Australian Taxation Office) beschreibt in seinem Vortrag “Deploying Data Mining in Government” R als die Konkurrenz zu den kommerziellen Produkten wie SPSS, SAS, Stata, S, u.a. Kommerzielle Produkte suggerieren, dass mit einem Klick Daten analysiert werden, das stimmt seiner Meinung nur bedingt. Sein Credo lautet: “investiert in die Mitarbeiter und nicht in die Software und dabei ist R die beste Wahl”. Auf Grund des universitären Hintergrundes ist die Software methodisch abgesichert und die Tatsache das R unter einer GNU-Lizenz veröffentlicht ist, garantiert eine Vielfalt an Modulen. Die “großen” Statistik Programme wie SPSS haben bereits erkannt, das R in Zukunft an Bedeutung gewinnen wird und bieten mittlerweile Schnittstellen zu R.

Eines der großen Schwachstellen von R die Speicherlimtierung war ein anderer Themenschwerpunkten, der vor allem die Bioinformatiker beschäftigt. Eine Lösung scheint derzeit noch keine in Sicht einzelne Ansätze wie die Virtualisierung von Speicher wurde in mehreren Vorträgen diskutiert.

Zum Thema “User Interfaces” gab es von Rudolf Dutter von der Uni Wien einen für mich spannenden Vortrag “A Graphical User Interface for Environmental Statistics”. Dieses Userinterface (DAS+R) könnte ich mir gut, mit ein paar kleinen Änderungen, für den Einsatz beim Kunden vorstellen. Es gab noch weitere interessante Ansätze zu Userinterfaces meiner Meinung nach sind die meisten eher der Kategorie Experiment zu zuorden. Interssanter ist der Ansatz die Integration von R in Excel vom Vortragenden Erich Neuwirth “R meets the Workplace – Embedding R into Excel and making it more accessible”. Diesen Vortrag habe ich aber leider nicht gesehen, weil ein ebenfalls interessanter Bioinformatikvortrag parallel lief. RExcel – Using R from within Excel

 

GOR 2008

Ich habe heute den Frühbucherbonus ausgenützt und mich für die nächste GORin Hamburg angemeldet.

Interessant finde ich die angekündigten Workshops, leider gibt es noch keine Inhaltsbeschreibungen, um schon eine Auswahl treffen zu können.

Ich freue mich schon, wieder interessante Vorträge und nette Leute kennenzulernen.
Dann bis zur GOR.

 

Mixed-Mode in der Online-Marktforschung

Im Zuge der G.O.R. 07 habe ich ja am Workshop von Holger Geissler (D.G.O.F.) teilgenommen, hier kommt eine kurze Zusammenfassung.

Unter Mixed Mode sind die Variation der Erhebungsmethoden im Zuge einer Messung zu verstehen.
Das einfachste Beispiel für Mixed Mode ist ein Reminder in Form einer Postkarte, die man einem Online-Access-Panel Teilnehmer zwecks Erhöhung der Stchprobenausschöpfung zusendet. Aus Anwendersicht ist Mixed Mode also das Mischen verschiedener Befragungsvarianten.

Der Grund warum verschiedene Modes verwendet werden, kann eine bessere Repräsentativität (Erreichbarkeit der Zielgruppe) sein oder eine bessere Ökonomie (Kosten Minimieren) oder eine Erhöhung der Validität der Daten.
Die Vorteile von Mixed Mode liegen also klar auf der Hand, will man eine repräsentative Umfrage bei einer heterogenen Gruppe ökonomisch durchführen, wird man auf verschiedene Modi zurückgreiden. Zum Beispiel die Rentner und Hausfrauen telefonisch befragen, Studierende online und eventuell eine spezielle Gruppe Face-to-Face.
Die Frage die sich aufdrängt ist, können Methodeneffekte auftreten.
Durch die Zusammensetzung der Stichprobe, durch Ortseffekte, Settingeffekte (anonym vs. persönlich), Effekte der Stimulusdarbietung (schriftlich-visuell vs akustisch) oder durch Skaleneffekte.

Stichprobeneffekte
Verschiedene Modes besitzen unterschiedliche Stichprobenzusammensetzung die zu unterschiedlichen Ergebnissen führen kann. Diese Ergebnisse müssen interpretiert werden und der “wahre” Wert kann nicht erklärt werden.
Wenn die Stichproben strukturell vergleichbar sind sind die Unterschiede in den Ergebnissen eher gering. Die Varianzen können aber, auf Grund von unsymetrischen Messfehlern, voneinander abweichen was Optimierungsproblem der unterschiedlichen Modie führen kann.

Settingeffekte
Bei Face-to-Face oder Telefon- Umfragen übt die Interviewer “Druck” auf den Befragten aus z.B. Zeitdruck der Interviewer kann die Zeit zum Nachdenken begrenzen. Ein weiterer Effekt ist der Zustimmungseffekt (Acquiescence) Befragte stimmen, bei persönlichen Verfahren, Fragen eher zu bejahen als sie zu verneinen. (Sie antworten also bei Ja/Nein Fragen eher mit Ja.) Lösungsansatz ist eine Variation der Fragen und wenn möglich ein “umdrehen” der Items.
– X bietet viele interessante Produkte.
– X bietet wenige interessante Produkte.

Kultureffekte
Kultureffekte sind vielschichtig. Das fängt bei der Übersetzung an und endet mit der Frage was kann ich wo und wie fragen.
Grundsätzlich gibt es unterschiedliche Antwortstile in verschiedenen Kulturen (z.B. Tendenz zu extremen Antworten).
Auch bei scheinbar kulturell vergleichbaren Gruppen wie z.B. die Westösterreicher (Tirol, Salzburg, Kärnten) mit Ostösterreichern (Wien) kann man feststellen dass bei einem CATI Interview mit einem Wiener Interviewer ein Westösterreicher tendenziell ablehnender reagiert.
Lösungsansatz: Bewertung im Kontext des jeweiligen Landes oder Marktsegmentes und unter Berücksichtigung von möglichen Kutureffekten.
Bei “weichen” Fragen ist auf die relativen Ergebnisse / Unterschiede bei “harten” Fragen auf absolute Werten zu fokussieren.


Probleme der Modes in der Zukunft

Es ist zu erwarten dass telefonische Befragungen durch die zunehmende Menge an Befragungen, zuhnemend bei der Bevölkerung auf Ablehnung stoßen wird. durch die Zunahme am Mobilfunkanschlüssen wird zudem die Gruppe reduziert.
Bei den Onlinbefragungen zeichnet sich ein ähnliches Bild ab, die Inflation an Befragungen führt zunehmend zu einer Frustration der Panelteilnehmer. Die Zunahme von Spam erschwert zunehmend die Rekrutierung per Email.
Bei der Postalischen Befragung ist durch die tägliche Werbeflut auch ein Akzeptanzproblem zu erwarten. Die Bevölkerung ist nicht mehr in der Lage Werbung und Befragungen zu unterscheiden. Das ergibt ein riesiges Problem für die Befragungen in der Zukunft, da sich die Werbewirtschaft und Marktforschungsinstitute zunehmend den Markt übersättigen.

Zusammenfassend ist zu Mixed Mode zu sagen, dass das Forschungsfeld der gemischten Methoden noch viel Forschungsspielraum offen lässt und zunehmend als Forschungsfeld an Bedeutung gewinnt.

Der Workshop mit dem Referenten Hr. Holger Geissler war hoch interessant, sehr professional und für mich ein Highlight auf der diesjährigen G.O.R.

Quelle: Passagen des Textes wurden sinngemäß aus den Workshopunterlagen und dem Workshop von Holger Geissler (G.O.R. 2007) entnommen.

 

G.O.R. 07

Am Montag den 26.03 startete für mich die G.O.R. mit dem Workshop (Mixed-Mode in der Online-Marktforschung) von Holger Geissler Psychonomics AG. Der Workshop wird in einem gesonderten Beitrag aufgearbeitet.
Am Dienstag eröffnete Bernad Batinic von der Universität Linz am Mediencampus offiziell die Veranstaltung mit einer Vorstellung der wichtigsten Persönlichkeiten der Online Forschung und empfahl dem Publikum Gespräche mit den Experten zu führen.
Jeweils vier Vortragsserien fanden parallel statt. Da die Organisation im Vergleich zu der Veranstaltung in Bielefeld 2006 etwas ins Strudeln gekommen ist und das Programm umgestellt wurde, es auch keine “fixen” Zeiten für die einzelnen Vorträge gab, habe ich einige interessante Vorträge leider verpasst.
Besucht habe ich die Sessions “Weblogs and Effects”, Tools for the Analysis of Online Networkes and Online Groups”.

Die G.O.R. Party war wieder ein hervorragender Ort, um sich in einer relaxen Atmosphäre, fachlich auszutauschen. (Ärgerlich nur dass viele Teilnehmer hungrig ins Bett gehen mussten, weil in Bielefeld ein großes leckeres Buffet aufgetischt wurde, auf dieses wir heuer vergeblich warteten).
Am Mittwoch habe ich mir die interessante Panel Diskussion “The End of Traditional News Journalism” angeschaut.

Fotos zur G-O.R. findet man auf psychonomics_flickr’ s photos (Holger Geißler)

G.O.R.
ein Ausschnitt aus dem offiziellen Fragebogen zur G.O.R. 2007

Blogs die sich mit der G.O.R Beschäftigen
>> om Sein << G.O.R. 07 – Nachlese
Halem Verlag Blog Neue Reihe zur Online-Forschung
wahlforschung.blog.de GOR 2007 – Rückblick
Bamblog Zurück von der GOR
Journalismus 2.0 GOR, Tag 1
Sozlog GOR 2007 – Internet Metrik und geringe theoretische Durchdringung
VICO News Blog Ausgezeichnetes Feedback zur Klimastudie auf der G.O.R
Neuigkeiten von Martin Welker GOR 07 in Leipzig

 

G.O.R.

Morgen beginnt die General Online Research GOR in Leipzig mit Workshops. Auch heuer bin ich wieder auf der Konferenz und werde morgen am Workshop: Mixed-Mode in Online Market Research teilnehmen.

Einige interessante Vorträge habe ich mir schon herausgesucht welche ich besuchen möchte. Dazu gehören: Skalierung und Meßverfahren, Zivilgesellschaft und Internet, Nutzerteilnahmen in Onlinegruppen und Onlinenetzwerke.

Ich freue mich schon auf die Inputs und werde euch von der GOR berichten.

 

G.O.R.

Die General Online Resarch 2006 findet dieses Jahr in Bielefeld statt.
Am 20. März startet die G.O.R. mit verschiedene Workshops und dauert bis zum 22. März.
Dieses Jahr zähle ich auch zu den Teilnehmern und für den Workshop Internet Surveys von Bernard Batinic und Timo Gnambs habe ich mich angemeldet und bin gespannt, was ich neues lernen werde.