Data manipulation with dplyr

Das Tutorial Data manipulation with dplyr mit Hadley Wickham
ist auf der UseR! 2015 in Aalborg für mich das erste Highlight.

Tutorial UseR! 2015 in Aalborg Dänemark

Tutorial UseR! 2015 in Aalborg Dänemark

Ich denke, da werden gerade mit den Keynotes noch einige weitere Highlights folgen. Neben sehr netten Leuten, mit denen ich mich schon unterhalten konnte, ist auch das Wetter sehr schön hier in Dänemark.

Tagged with:
 

Daten für den Journalisten…

und natürlich dadurch Information für die Leser so beschreibt es ein sehr interessanter Artikel in der Zeit: “Daten sind der Treibstoff des Journalismus”. Seit kurzer Zeit werden von Qualitätsmedien immer mehr Datenbanken angelegt, die zu aktuellen Ereignissen Hintergrunddaten liefern. Journalisten sollten nicht nur Geschichten schreiben sondern auch einen Datenjournalismus betreiben.

Nach Adrian Holovatys Meinung

sollten sich Zeitungen und andere Medien nicht nur auf Geschichten konzentrieren. Sie sollten viel mehr Informationen unter dem Aspekt betrachten, wie ihr Inhalt sich in strukturierter Form, also in Datenbanken, ablegen lässt. Dann, so Holovaty, könnte aus Geschichten auf Dauer ein Mehrwert abgeschöpft werden.

Ein Beispiel von Datenvisualisierung und Bereitstellung der The New York Times R&D Lab has built a tool that explores the life stories take in the social space.
Die aktuelle Technik ermöglicht sehr schöne Visualisierungen mit dynamischen dargestellten Zeitläufen.

Ein Screenshot aus der Visualisierung von Daten http://www.niemanlab.org/2011/04/the-new-york-times-rd-lab-has-built-a-tool-that-explores-the-life-stories-take-in-the-social-space/

Hier kommt auch es aber sowohl auf die Qualität der Aufbereitung an, denn mitunter ist viel Chartjunk in den Zeitungen zu finden. Wo in sehr hübschen 3-D Grafiken kaum Information zu finden ist. Den Begriff Chartjunk bedeutet “Grafikmüll” oder “Diagrammschmutz” und wurde von Edward R. Tufte geprägt. Er beschäftigt sich schon seit langen mit der Visualisierung von Daten.

 

Suchmaschine für Daten

Vor ein paar Tagen habe ich eine sehr interessante Suchmaschine für Daten gefunden. GraphWise ist war die erste Suchmaschine im Netz die nur nach Tabellen sucht und aus diesen Tabellen einfache Grafiken erstellt. Derzeit ist die Seite im Beta-Stadium und seit 8. Oktober online offline.
graphwise

Die Suche gestaltet sich sehr einfach (nur deutsche Umlaute funktionieren nicht). Gibt man zum Beispiel den Begriff Tryptophan ein (ein Aminosäure) so bekommt man die entsprechenden Tabellen geliefert. Aus den Daten lassen sich Balkendiagramme, Tortendiagramme sowie Bubble-Diagramm erstellen.
Hoffe Die Seite geht irgendwann wieder online.

Gefunden via: Tasty Data Goodies

Tagged with:
 

Piraten

Eine interessante statistische Interpretation des Zusammenhanges von globale Erwärmung und Anzahl an Piraten habe ich auf der Seite der Church of the Flying Spaghetti Monster gefunden.

You may be interested to know that global warming, earthquakes, hurricanes, and other natural disasters are a direct effect of the shrinking numbers of Pirates since the 1800s. ..
As you can see, there is a statistically significant inverse relationship between pirates and global temperature.

Piraten Statistik
Quelle: http://www.venganza.org/

Die Seite Church of the Flying Spaghetti Monster (Fliegende Spaghettimonster) ist eine satirische Auseinandersetzung mit dem an US-amerikanischen Schulen unterrichteten Intelligent Design. Es finden sich aber auch, zum Nachdenken anregende, statistische Beweise für Nonsenstheorien.

Tagged with: