data.hackr

ein kleines blog ueber small data


Social Movie Graphs

moviegalaxies

nett: Moviegalaxies

(via)

☍ 06.09.2012 /via @flowingdata # visualisation movies

represent.la

la

represent.la

☍ 06.09.2012 # losangeles startups visualisation

Edge Prediction

Edge Prediction in a Social Graph

^ auch untested usw.: einige Graph-Interventionen von Edwin Chen (leider für Facebook, ich glaub via @chl)

☍ 06.08.2012 # visualisation python

Data Driven Documents

d3js

^ auch untested, auch probably super: D3.js – eine JavaScript Bibliothek für Visualisierungen und eine Anleitung von FlowingData, wie man damit etwa Graphen darstellen kann.

☍ 06.08.2012 /via @flowingdata # visualisation tools

Sports Data Pt. 2 (Dash Edition)

bolt

^ und die NYT mit einer Art Visualisierung der Entwicklung der Rekorde im 100m Lauf bis Usain Bolt.


Sports Data Pt. 1 (Swimwear Edition)

swimming records

^ die WP mit einer Art Visualisierung der Korrelation zwischen Schwimmanzügen und Rekorden.

☍ 06.08.2012 /via @washingtonpost # visualisation sports

Arms Trade

arms

^ irre Visualisierung des globalen Kleinwaffenhandels von Google.

☍ 05.08.2012 # visualisation geography politics

The Internet Map

internet map

auch nett: The Internet Map

(via)

☍ 30.07.2012 /via @flowingdata # visualisation web

Moneyball

political moneyball

Political Moneyball – eine Art Visualisierung vom WSJ (siehe)

☍ 26.07.2012 # visualisation politics

7up

venn 7

^ nettes 7-layeriges Venn Diagramm.

☍ 24.07.2012 /via @informationisbeautiful # visualisation

Graph of Ideas

graph of ideas

^ auch nett: der Graph aller Ideen (via)

☍ 19.07.2012 /via @flowingdata # visualisation ideas

Useless Stats Pt. 2

meine 320 Freunde (oder Squirrels etc.) auf Twitter folgen selbst nicht weniger als 127.214 verschiedenen Leuten (oder Squirrels etc.) bei 249.608 einzelnen Verfolgungen.

(auch hier finde ich die streuung wie bei den xx-reduce datasets doch überraschend. dass jeder von mir verfolgte 780 leuten folgt find ich zwar auch schon viel, dass aber jeder im durchschnitt dabei fast 400 ganz neue knoten erschliesst ist erstaunlich, zumal es sich ja ums verfolgen und nicht ums verfolgt werden handelt, dort könnte man das noch über bots et al. erklären)

 169 5876652
 135 3782931
 133 9334352
 129 9655032
 126 1487011
 121 711803
 121 10774952
 113 1276151
 112 1007251
 108 14547663
 106 5751892
 104 5638152
 104 5618832
 102 623453
 101 1151281

^ # of followers aus dem set, ID

die cliquish-ness ist so lala, 15 werden von mehr als 100 der 320 auch verfolgt, mehr als 3000 von zumindest 10, 31231 von zumindest zweien und also 95983 sind einsam verfolgte Blätter.

12
13
14
15
20
21
22
23
38
47
53
57
66
107
136

^ ID

13 der ersten 100 und 3106 der ersten Mio Twitteruser werden irgendwie erfasst.

☍ 19.07.2012 # twitter stats

omg, circlereduce

circlereduce

next up in der reduce Reihe (siehe omg, groupreduce, omg, feedreduce, omg, linkreduce und omg, listreduce) : circlereduce, z.b circlereduce tech de. wie immer werden aus dem jeweiligen input – in diesem fall ein circle – die links kontextlos extrahiert und das ganze soweit es geht von diversem cruft und selbstlinks befreit. da google noch keine offizielle API für den sozialen graphen der circles offeriert (auch wenn sie ihn intern […/socialgraph/lookup/…] schon verwenden) funktioniert das derzeit nur mit meinen. aber auch hier gibt es natürlich auch ein praktisches last 100

update: die reduce-serie gibt’s nicht mehr.

☍ 10.07.2012 # hackr hackrengine googleplus

The Reduced and the Cooked

links

drei Minianmerkungen nach einigen Tagen eher im Reduktionsstrom (siehe stick to one’s last):

  • kontextlos ist der Strom der Links auch handverlesener Quellen doch sehr roh, auch wenn man den offensichtlichsten cruft rausfiltert (das ist nicht gerade erstaunlich, aber erwarten können und spüren ist halt was anderes). Nicht unspannend, aber rau.
  • das Web scheint sich in eine Art Zweiklassengesellschaft aufgeteilt haben. Es gibt erstaunlich viele wirklich gut gemachte und optisch sehr ansprechende Seiten (mit einem nicht so kleinen aber auch nicht dominanten subset neominimalistischer seiten); und es gibt erstaunlich viele wirklich grottenschlechte Seiten, die sich anscheinend schon seit längerem in einem race to the bottom befinden und jede Selbstachtung beim versuchten Monetarisieren abgelegt haben. Fürs Verlinken scheint das übrigens überhaupt kein Kriterium zu sein.
  • man sieht einige Muster – auf was einer immer wieder verlinkt, auf was einer nicht verlinkt, auf was eine gruppe als standardreferenz verlinkt, etc. – die man im normalen Konsum vl. nicht sehen und also auch nicht erwarten würde. Auch nicht wirklich überraschend, aber interessanterweise hat sich da eine gefühlte konzeptionelle Nähe oft mit einem wtf bzgl. der Links oder der primären Quellen kombiniert. Gleichzeitig funktionieren klassische Linkschleudern und ‘Newsmaster’ gar nicht so schlecht und so vermutete Dumpfbacken wie TC oder TNW sogar wirklich gut und auch versatil (am peinlichsten berührt war ich übrigens bei meinem eigenen output).
☍ 09.07.2012 # infoeconomy

omg, stick to one's last

und noch ein kleiner Nachtrag in der reduce Reihe: die Linkreduzierer (siehe omg, groupreduce, omg, feedreduce, omg, linkreduce und omg, listreduce) haben jetzt auch eine handliche Liste der 100 letzten Links aller jeweils aggregierter Accounts.

feed100

^ feedreduce last 100

link100

^ linkreduce last 100

list100

^ listreduce last 100

group100

^ groupreduce last 100

update: die reduce-serie gibt’s nicht mehr.

☍ 08.07.2012 # hackr hackrengine