
ein kleines blog ueber small data

How far birds migrate


^ sogar vögel werden überwacht: Using CartoDB to visualize how far birds migrate in a single night

☍ 24.06.2015 /via @blogs-en # ornithology visualisation

The Migrants Files

migrants files

^ klingt nach einem ambitionierten Projekt: The Migrant Files – eine Art Projekt, das diverse gesellschaftspolitische Situationen data-driven dokumentiert und visualisiert.

☍ 18.06.2015 # data datajournalism



^ gelegentlich nützlich: man kann auch im Terminal pdf’s ganz einfach mergen:

"/System/Library/Automator/Combine PDF Pages.action/Contents/Resources/" -o output.pdf part-1.pdf part-2.pdf ...

☍ 18.06.2015 # osx howto

Google Trends Datastore

google trends datastore

aha, Google publiziert jetzt anscheinend selektive Datensets von Google Trends (ann)

☍ 17.06.2015 # google data

LA Busfeed


^ nicht buzzfeed sondern busfeed für LA: Aggregate data from LA realtime bus feed (via)

☍ 10.06.2015 /via @flowingdata # losangeles traffic github

Big Merkel

merkel kopfteil

kinda funny: big data bekommt mit angela merkel eine unerwartete fürsprecherin:

Germans need to overcome their traditional fear of the large-scale collection of personal data by companies and instead embrace its opportunities or risk being marginalized in the global economy

‘Many jobs will disappear because they can be replaced by machines,’ said Merkel. ‘But I’m convinced that many more jobs will be created through the value of data.’

☍ 10.06.2015 # politics bigdata

The Google Stack

google stack

^ ein student namens malte schwarzkopf hat den stack von google in eine übersichtliche grafik gepackt [pdf].

☍ 05.06.2015 # google

Bayesian truth serum


vom konzept her spannend, wenn es funktioniert: Bayesian truth serum – eine art bewertungssystem für situationen, in denen es keine möglichkeit gibt zu überprüfen, ob aussagen wahrheitsgemäß gemacht werden, der aussagende über das ausgesagte überhaupt kenntnis hat, usw. (basiert anscheinend irgendwie auf der korrelation von metaaussagen).

☍ 05.06.2015 # statistics

Daily Routines


^ berühmte kreative selbstquantifiziert: the daily routines of famous creative people

Blue Note


^ ganz interessant: Blue is the new orange – eine Art Visualisierung der Popularität von Farben in Gemälden.


☍ 18.04.2015 /via @flowingdata # visualisation art r

Otto Kaggle

Otto Group Product Classification Challenge

^ ganz interessant: Otto hat gerade eine Kaggle Competition

For this competition, we have provided a dataset with 93 features for more than 200,000 products. The objective is to build a predictive model which is able to distinguish between our main product categories. The winning models will be open sourced.

☍ 18.04.2015 # ecommerce kaggle

Amazon Machine Learning

amazon machine learning

^ Amazon hat eine Art Service für Machine Learning vorgestellt: Amazon Machine Learning (ann)

(interessant ist es, soweit ich sehe und das beurteilen kann, nicht so sehr wegen einer vermutbaren qualität – i.e. man wird damit keine kaggle competition gewinnen, es gibt gerade mal binary classification, multiclass classification und regression und bei allen verfahren nur ein paar schrauben, mit denen man die internen algorithmen tunen kann – aber doch wegen der infrastrukturellen unverbindlichkeit und skalierbarkeit für bereiche, in denen einfache klassifikationen gut genug sind)

☍ 12.04.2015 # amazon aws ml

Wolfram Data Drop

data drop

^ untested aber super: Wolfram Data Drop :

The Wolfram Data Drop is an open service that makes it easy to accumulate data of any kind, from anywhere – setting it up for immediate computation, visualization, analysis, querying, or other operations.

☍ 31.03.2015 # data wolframalpha



^ nützlich: jq – eine Art sed für json.


☍ 26.03.2015 # jq python cli json

Tangram Style

ffm tronish

^ schick: tangram (etwa ffm tronish)

☍ 26.03.2015 # openstreetmap maps