map with heat

Nur ein kleines Update, weil es hier ja etwas still war: der Grund dafür ist, dass meine data-bezogenen Energien mehr oder weniger vollständig von einigen MOOCs absorbiert wurden (siehe Data Moocs Spring/Summer 2014 und Data Moocs Spring 2014), und die waren (resp. sind) zwar teilweise tatsächlich sehr super, vermitteln aber grösstenteils halt einfach zu lernenden resp. zu verstehenden ‘kanonischen Stoff’, der aber selbst nicht wirklich Anschlusskommunikation sucht.

(nachdem ich eig. alle erwähnten moocs und noch einige andere zumindest angeschnuppert habe, sind unterm strich drei übrig geblieben, die ich dann mit gewisser hingabe gemacht habe (resp. noch mache): (1) data analysis and statistical inference von duke/coursera – eine wirklich grossartige einführung in die statistischen grundkonzepte, aber auch die damit verbundene ‘welt-’ und wissenschaftlichkeit und mit toolbox (r, rstudio, rmarkdown, knitr, pandoc) für reproducible research; neben der norvig klasse, siehe u.a. pierce hawthorne, bisher der mooc, wo ich mich am meisten anstrengen musste, um ihn überhaupt zu ‘schaffen’, was dann aber natürlich die wertigkeit für einen selbst mitunter auch erst konstituiert; und neben norvig und model studies sicher eines der highlights meiner bisherigen moocs overall; den impliziten humor von mine çetinkaya-rundel werde ich jedenfalls nicht vergessen. (2) exploratory data analysis von udacity – eine durchaus gute einführung in den datenanalytischen prozess, der vor allem eine ungeplante komplementierende visualisierungskomponente für die prinzipien von (1) mit r/ggplot2 beinhaltet, die dort vl. etwas zu kurz kam; ist aber auch an und für sich zumindest halbwegs durchdacht und überlegt (von den anderen kursen der neuen datenspezialisierung von udacity kann man das ja nicht wirlich sagen, die wirken mitunter eher lieblos rund um ein zu belegendes schlagwort zusammengewürfelt und sind eher keine werbung für ihr neues modell); und (3) the analytics edge vom mit/edx. das ist ein wilder ritt, der sich nicht lange mit den basics aufhält, sondern in woche 2 lineare regression, in woche 3 logistische regression, in woche 4 modellierungstechniken auf basis von entscheidungsbäumen und -wäldern, in woche 5 verschiedene strategien für natural language processing, in woche 6 hierarchisches und k-clustering und in der aktuellen woche 7 gerade einen – übrigens wirklich lustigen und durchaus kompetitiven – privaten wettbewerb auf kaggle offeriert. lineare und integer optimierung kommen noch. und während dabei dann natürlich viel ‘voodoo coding’ ist, ist das trotzdem auch eine nette alternative und abrundung zu (1) und (2); und während die ansätze unterschiedlicher nicht sein könnten, irgendwie haben sie sich interessanterweise recht harmonisch ergänzt und teilweise sogar wechselseitig beleuchtet)

selfie

^ nett: Selfiecity – eine Art Visualisierungsprojekt von Selfies.

Kl. Nachtrag zu Data Moocs Spring 2014: Praktischerweise starten im März und April eine ganze weitere Reihe an Kursen rund um Statistik und Data Analysis:

Intro to Data Science

^ Data Analysis and Statistical Inference von Coursera (siehe) – läuft schon seit 2 Wochen, dauert 10 Wochen und ist sehr gut. Es kombiniert die Basics von Statistik und Wahrscheinlichkeitstheorie (bis zu multiple linear regression und bayesian inference) mit einem guten Schwung Praxis und einem grösseren Projekt.

Making Sense of Data

^ Making Sense of Data von Google (siehe) – startet am 18. März und dürfte ein Crash-Kurs in Google Fusion Tables sein. Die bisherigen nativen Kurse von Google – Power Searching resp. Mapping With Google – waren beide überraschend gut.

Und ab 7. April startet Coursera gleich einen Schwung an 4-wöchigen Kursen im Rahmen einer ‘Spezialisierung’:

The Data Scientist's Toolbox

^ The Data Scientist’s Toolbox (siehe) – In this course you will get an introduction to the main tools and ideas in the data scientist’s toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, Github, R, and Rstudio.

R Programming

^ R Programming (siehe) – In this course you will learn how to program in R and how to use R for effective data analysis.

Getting and Cleaning Data

^ Getting and Cleaning Data (siehe) – The course will cover the basics needed for collecting, cleaning, and sharing data.

osm

^ the next web mit einer recht interessanten Doku über OpenStreetMap und den dahinterstehenden Mechanismen.

code for germany

^ devoha: mit Code for Germany gibts jetzt auch den Versuch, eine deutsche Ausgabe von Code for America zu etablieren, open data hacker unite usw.

^ Stephen Wolfram stellt die bald kommende Wolfram Language vor (ht @random101).

(abt. holy squirrel)

google takeout

^ kleiner Tipp: bei Google Takeout kann man jetzt auch das gesamte Gmail-Account als Mbox exportieren. Das dauert zwar ein bisschen, aber der psychohygienische Frieden zu wissen, dass man dafür zumindest auch ein Backup hat, ist nicht so ohne.

(‘select all’ aus-klicken, ‘gmail’ anklicken, auf ‘create archive’ clicken und ein bisschen warten)

2994km

In 2013, you traveled 2,994 km. That’s more than the length of the Great Barrier Reef!

(siehe Berlin to Madrid)

Note: Ich spiele mich gerade mit dem Design der Startseite herum, hier nur die letzten 8 Einträge. Die normale Pagination mit jeweils 20 Einträgen pro Seite gibt es wie bisher bei live.hackr.

Inhaltsverzeichnis

Einige Ein- und Ausgänge von hackr.de.

teilweise under construction

Subblogs

  • live.hackr
    - das Hauptblog. Wer hier neu ist, fängt am besten hier an.
  • chronicle
    - ein Strom an News direkt von den Company-Blogs.
  • news
    - ein Strom an Blogposts mit Nachrichten.
  • shared
    - ein Strom an Blogposts mit lesenswerten Artikeln.
  • worldwide
    - ein Strom meiner Aktivitäten jenseits von hackr.de.
  • twitter nuts
    - ein Subblog mit neuen Twitter-Apps. (derzeit inaktiv)
  • hackr.tv
    - ein Subblog mit Videos.
  • hackr.fm
    - ein Subblog mit Podcasts. (derzeit inaktiv)

Kategorien

Suchen

Für Suchen im Blog empfehle ich die integrierte Suche – ein Suchfeld befindet sich fast auf jeder Seite im Blog. Weitere Suchmöglichkeiten sind:

  • hackr search by google
    - eine CSE in hackr.de. Ein Vorteil gegenüber der integrierten Suche ist, dass sie via Google betrieben wird und also auch die Suchsyntax von Google unterstützt.
  • hackr.search
    - eine CSE in 100+ deutschsprachigen Webtechblogs.
  • momb.search
    - eine CSE in 100+ internationalen Webtechblogs.

Misc

Metacollection

Eine Sammlung zu Serien, Miniseries, Yearlies und Sammlungen.

Selection

Empfehlungen aus den jeweiligen Jahrgängen auf einer Seite.

Editorial

Series

Miniseries

Yearlies

Worldwide

Misc

Archiv

2014:

januar

2013:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2012:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2011:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2010:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2009:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2008:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2007:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2006:

dezember, november, oktober, september, august, juli, juni, mai, april, märz, februar, januar

2005:

dezember, november, oktober, september, august, juli