Daten für den Journalisten…

und natürlich dadurch Information für die Leser so beschreibt es ein sehr interessanter Artikel in der Zeit: “Daten sind der Treibstoff des Journalismus”. Seit kurzer Zeit werden von Qualitätsmedien immer mehr Datenbanken angelegt, die zu aktuellen Ereignissen Hintergrunddaten liefern. Journalisten sollten nicht nur Geschichten schreiben sondern auch einen Datenjournalismus betreiben.

Nach Adrian Holovatys Meinung

sollten sich Zeitungen und andere Medien nicht nur auf Geschichten konzentrieren. Sie sollten viel mehr Informationen unter dem Aspekt betrachten, wie ihr Inhalt sich in strukturierter Form, also in Datenbanken, ablegen lässt. Dann, so Holovaty, könnte aus Geschichten auf Dauer ein Mehrwert abgeschöpft werden.

Ein Beispiel von Datenvisualisierung und Bereitstellung der The New York Times R&D Lab has built a tool that explores the life stories take in the social space.
Die aktuelle Technik ermöglicht sehr schöne Visualisierungen mit dynamischen dargestellten Zeitläufen.

Ein Screenshot aus der Visualisierung von Daten http://www.niemanlab.org/2011/04/the-new-york-times-rd-lab-has-built-a-tool-that-explores-the-life-stories-take-in-the-social-space/

Hier kommt auch es aber sowohl auf die Qualität der Aufbereitung an, denn mitunter ist viel Chartjunk in den Zeitungen zu finden. Wo in sehr hübschen 3-D Grafiken kaum Information zu finden ist. Den Begriff Chartjunk bedeutet “Grafikmüll” oder “Diagrammschmutz” und wurde von Edward R. Tufte geprägt. Er beschäftigt sich schon seit langen mit der Visualisierung von Daten.

 

Facebook

Da ich schon oft gefragt wurde, gibt es jetzt auch eine Seite in Facebook. Wobei die Beschäftigung mit statistischen Themen auch weiter hier am Blog erfolgen. Aber die Feedbacks können gerne auf Facebook hinterlassen werden.

 

Ehrliche Antworten auf persönliche Fragen

sind immer ein Thema bei Umfragen. Die Menschen antworten oft nach der sozialen Erwünschtheit. Im unten angeführten Beispiel geht es um Afrika, aber auch bei uns gibt es ebenfalls solche heiklen Themen. Eines davon ist das Einkommen in Umfragen, die Armen machen sich mitunter aus Scham reicher und die Reichen machen sich ärmer. Auch bei Migranten und Asylwerbern wo eigene unangenehme Erfahrungen im Umgang mit den Behörden aus dem Herkunftsländern dahinterstecken, entsprechen die Antworten oftmals der sozialen Erwünschtheit oder die Befragung wird sogar abgebrochen. Bei einem Abbruch kann neben der Angst zuviel persönliches preiszugeben auch dahinterstecken, dass bei nicht gut deutsch sprechenden Menschen die Fragen zu kompliziert sind und nicht verstanden werden.

Beim Science Blog gibt es einen Bericht über eine Alternative bei den Antworten der Befragten in Bezug auf HIV in Äthiopien und damit der voreheliche Sex. Ein heikles Thema in Dorfgemeinschaften, wo dieses Thema noch dazu Tabu ist und schnell hat der Nachbar, die Eltern etwas gehört, was sie nicht wissen sollen.

http://www.scienceblogs.de/geograffitico/2010/12/bei-schwierigen-fragen-hilft-lochern.php

Die Erklärung zur Funktion der Lochkarte ist am Scienceblogs.de zu finden.

In den Kommentaren wird auch die Alternative mit einem Kartenspielsatz vorgeschlagen, aber wie der Kommentar vom Autor Jürgen Schönstein so schön zusammenfasst: “…- aber für die Zwecke dieser Umfragen scheint dieses Problem nicht ganz so viel auszumachen. Wichtiger ist, dass die Befragten nichts sagen müssen, das dann von jemandem in der Nähe mitgehört werden kann.”

Tagged with:
 

Fragebogen – Telefonbefragung

Da steckt doch einiges an Wahrheit dahinter ….
einfach anschauen und für den nächsten Fragebogen inspirieren lassen. 😉

Gunkl über Statistik

 

Writing Scientific English – Buchtipp

Vor kurzem ist mir ein äußerst hilfreiches Büchlein in die Hände gefallen. Darin sind Tipps und Hilfestellungen zu finden, wie ein englisches Abstract oder eine ganze Arbeit geschrieben werden kann. Speziell wird in diesem Buch auf wissenschaftliche Daten, Grafiken und Tests eingegangen.
Hilfreich sind vor allem die Übungsaufgaben mit Lösungen wie z.B. die Beschriftung von Datentabellen und die korrekte Beschreibung von Tabellen.
Das Buch ist in erster Linie für das englische wissenschaftliche Schreiben, jedoch lassen sich die Tipps auch für in deutsch geschriebene Abstracts und Arbeiten verwenden. Der Autor Tim Skern ist ein Biologe und Praktiker der selbst schon auf Englisch naturwissenschaftliche Artikel verfasste.

Tim Skern
Writing Scientific English
A Workbook
Facultas Verlag 2009
ISBN 978-3-8252-3112-5


 

Auswahlverfahren

Die ausgewogene Stichprobe.

Gefunden via: http://statistikberatung.blogspot.com/

 

Neue Version Minitab 16

Das Statistikpaket Minitab ist eine Software die viel im Qualitätsmanagement verwendet wird (Stichwort Six Sigma). Das Programm beherrscht sowohl die statistischen Standardverfahren als auch Verfahren zur statistischen Prozesskontrolle. Die neue Version soll laut Hersteller um 70 Funktionen erweitert worden sein.
Eine Demoversion zum evaluieren der Software gibt es auf der Seite des Herstellers.

Tagged with:
 

SPSS Webinar

Am 28. September 2010 ist es zu spät. Um 10:30 Uhr bietet SPSS ein “Webinar” (ein Seminar, das über das World Wide Web gehalten wird) zu den Neuerungen in IBM SPSS Statistics 19 an. Die Anmeldung ist kostenlos Informationen dazu gibt es auf der deutschen Homepage von SPSS.

Tagged with:
 

Nichtlineare Regression

In naturwissenschaftlich- technischen Anwendungen stellt sich oft das Problem, die Beziehungen von zwei Variablen in optimaler Weise zu beschreiben. Wird ein nicht -linearer Zusammenhang vermutet, stehen mehre Verfahren zur Verfügung.
Ein Verfahren ist die Annäherung der Funktion durch ein Polynom (z.B. y = ax² + bx + c). Mit dem Verfahren lassen sich zwar die Messpunkte gut anpassen, es besteht aber immer die Gefahr, dass die Messpunkte zwar auf der Kurve liegen aber die Kurve nicht den naturwissenschaftlichen  Zusammenhang beschreibt.
Ist die grundlegende Kenntnis über die zugrunde liegenden Zusammenhänge vorhanden, ist es oft möglich nicht lineare Ausgangsprobleme auf lineare zurückzuführen. Dabei müssen die Parameter der Funktion in linearer Form dargestellt werden. Zum Beispiel die Entladung eines Kondensators u(t) = u0*exp(-t/R*C) lässt sich in die Form ln(u) = ln(u0) – t/R*C bringen.

Tabelle 1 Gemessene Werte Entladung eines Kondensators( u=Spannung, t= Zeit, u0=Anfangsspannung, R = Widerstand, C= Kapazität)

t 1 4 7 10 15
u 80 45 25 14 5

Entladung eines Kondensators

Mit den Daten aus dem Beispiel lassen sich die Parameter über eine Lineare Regression mit RC= 5, 6 s und u0= 99 V bestimmen.  Weiter unten dazu der R-Code.

#-- Gemessene Werte Entladung eines Kondensators

#-- u=Spannung, t= Zeit, u0=Anfangsspannung, R = Widerstand, C= Kapazität
#-- u(t) = u0*exp(-t/R*C)
#-- ln(u) = ln(u0) - t/R*C
t <- c(1,4,7,10,15);  u <- c(80,45,25,14,5)
x<-t; y<-log(u)
#-- lineare Regression

summary(fit<-lm( y ~ x ))
#-- Rücktransformation der Parameter
(u0<-exp(coef(fit)[1]))
(RC<- -1/coef(fit)[2])

In Fällen, in denen keine Linearisierung existiert oder wenn durch die Linearisierung die Voraussetzungen der Regressionsrechnung verletzt werden, kann durch geeigneter Iterationsverfahren schrittweise eine Lösung bestimmt werden. Mehr dazu folgt bald  in einem weiterführenden Blogeintrag.

Literatur:

Papula,  L., Mathematik für Ingenieure und Naturwissenschaftler Band3, 3 Auflage, Viewegs, 1999

Tagged with:
 

Test auf linearen Trend bei relativen Häufigkeiten

Erfolgt eine Zunahme der relativen Häufigkeit in einer Kreuztabelle mit zwei Kategorien gleichmäßig, dann ist unter Umständen der Trend (Anstieg) von besonderen Interesse. Um das zu veranschaulichen, nehme ich wieder mein Beispiel aus dem Beitrag “Odds Ratio und relatives Risiko” auf. Bei dem die Wirkung eines Luftschadstoffs auf eine Krankheit untersucht wird.

Trend bei relativen Häufigkeiten

Der Cochran-Armitage Test prüft eine als linear ansteigend gedachte Häufigkeit mit Hilfe der Chi²-Statistik (vergl.  Sachs, Seite 599). Der Test ist vom Rechenaufwand eher einfach und kann durchaus von  Hand oder mit Excel bewerkstelligt werden. Die Formel dafür findet man bei Wikipedia Cochran-Armitage_test_for_trend. Wie der Test mit R umgesetzt werden kann hat Matthew Markus auf Posterous beschrieben matthewmarkus.

Cochran Armitage Test Wert
Chi²-Trend 14,93
Sig 2-Seitig <0,001

Im Fall meines Beispiels liefert der  Chi²-Test nach Ansatz von Cochran und Armitag die Werte  Chi²=14,93 und p<0,01.  Der Wert für den Trend zeigt einen signifikanten Anstieg der Erkrankungsrate mit der Zunahme der Schadstoffkonzentration.

Literatur:

[1] Sachs, Lothar; und Jürgen Hedderich; A ngewandte Statistik : Methodensammlung mit R; Berlin : Springer Berlin, 2009 Angewandte Statistik: Methodensammlung mit R

Tagged with: