Community College
Annie Edison
Nur ein kleines Update zu Tough Graders und Data Moocs Spring/Summer 2014 und Data Moocs Spring 2014 : ich hab mich jetzt auch noch durch die 9 Kurse der Data Science Specialization von Johns Hopkins auf Coursera (ich muss leider sagen) durchgewerkelt.
- The Data Scientist’s Toolbox
- R Programming
- Getting and Cleaning Data
- Exploratory Data Analysis
- Reproducible Research
- Statistical Inference
- Regression Models
- Practical Machine Learning
- Developing Data Products
Unterm Strich sind die 9 Kurse zwar eine Zumutung auf jeder Ebene (bipolare schwierigkeit der kurse, überwiegend eine lieblose neuverteilung von material das bei ihnen halt herumlag, nonpräsenz der professoren in den foren und nonreaktivität auf auch massive technische probleme, ungetestete quizzes, zusammenhanglose und aus dem leftfield kommende projekte, uvm.) aber es verstecken sich schon auch das eine oder andere Nugget; gute Statistiker und R-Zauberer sind die Johns Hopkins Biostats Guys sicherlich (ich erspare euch und mir hier ein genaueres was und warum, aber falls ihr die kurse in erwägung zieht fragt mich jederzeit)
Ein Grundskill ist für Selbstlernen sicherlich, einerseits die Qualität des moocs adäquat einzuschätzen und andererseits auch bei suboptimalen moocs das Beste für sich draus zu machen – und dafür ist die Spezialisation wohl das Boot Camp.
Tough Graders
Nur ein kleines Update, weil es hier ja etwas still war: der Grund dafür ist, dass meine data-bezogenen Energien mehr oder weniger vollständig von einigen MOOCs absorbiert wurden (siehe Data Moocs Spring/Summer 2014 und Data Moocs Spring 2014), und die waren (resp. sind) zwar teilweise tatsächlich sehr super, vermitteln aber grösstenteils halt einfach zu lernenden resp. zu verstehenden ‘kanonischen Stoff’, der aber selbst nicht wirklich Anschlusskommunikation sucht.
(nachdem ich eig. alle erwähnten moocs und noch einige andere zumindest angeschnuppert habe, sind unterm strich drei übrig geblieben, die ich dann mit gewisser hingabe gemacht habe (resp. noch mache): (1) data analysis and statistical inference von duke/coursera – eine wirklich grossartige einführung in die statistischen grundkonzepte, aber auch die damit verbundene ‘welt-’ und wissenschaftlichkeit und mit toolbox (r, rstudio, rmarkdown, knitr, pandoc) für reproducible research; neben der norvig klasse, siehe u.a. pierce hawthorne, bisher der mooc, wo ich mich am meisten anstrengen musste, um ihn überhaupt zu ‘schaffen’, was dann aber natürlich die wertigkeit für einen selbst mitunter auch erst konstituiert; und neben norvig und model studies sicher eines der highlights meiner bisherigen moocs overall; den impliziten humor von mine çetinkaya-rundel werde ich jedenfalls nicht vergessen. (2) exploratory data analysis von udacity – eine durchaus gute einführung in den datenanalytischen prozess, der vor allem eine ungeplante komplementierende visualisierungskomponente für die prinzipien von (1) mit r/ggplot2 beinhaltet, die dort vl. etwas zu kurz kam; ist aber auch an und für sich zumindest halbwegs durchdacht und überlegt (von den anderen kursen der neuen datenspezialisierung von udacity kann man das ja nicht wirlich sagen, die wirken mitunter eher lieblos rund um ein zu belegendes schlagwort zusammengewürfelt und sind eher keine werbung für ihr neues modell); und (3) the analytics edge vom mit/edx. das ist ein wilder ritt, der sich nicht lange mit den basics aufhält, sondern in woche 2 lineare regression, in woche 3 logistische regression, in woche 4 modellierungstechniken auf basis von entscheidungsbäumen und -wäldern, in woche 5 verschiedene strategien für natural language processing, in woche 6 hierarchisches und k-clustering und in der aktuellen woche 7 gerade einen – übrigens wirklich lustigen und durchaus kompetitiven – privaten wettbewerb auf kaggle offeriert. lineare und integer optimierung kommen noch. und während dabei dann natürlich viel ‘voodoo coding’ ist, ist das trotzdem auch eine nette alternative und abrundung zu (1) und (2); und während die ansätze unterschiedlicher nicht sein könnten, irgendwie haben sie sich interessanterweise recht harmonisch ergänzt und teilweise sogar wechselseitig beleuchtet)
Data Moocs Spring/Summer 2014
Kl. Nachtrag zu Data Moocs Spring 2014: Praktischerweise starten im März und April eine ganze weitere Reihe an Kursen rund um Statistik und Data Analysis:
^ Data Analysis and Statistical Inference von Coursera (siehe) – läuft schon seit 2 Wochen, dauert 10 Wochen und ist sehr gut. Es kombiniert die Basics von Statistik und Wahrscheinlichkeitstheorie (bis zu multiple linear regression und bayesian inference) mit einem guten Schwung Praxis und einem grösseren Projekt.
^ Making Sense of Data von Google (siehe) – startet am 18. März und dürfte ein Crash-Kurs in Google Fusion Tables sein. Die bisherigen nativen Kurse von Google – Power Searching resp. Mapping With Google – waren beide überraschend gut.
Und ab 7. April startet Coursera gleich einen Schwung an 4-wöchigen Kursen im Rahmen einer ‘Spezialisierung’:
^ The Data Scientist’s Toolbox (siehe) – In this course you will get an introduction to the main tools and ideas in the data scientist’s toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, Github, R, and Rstudio.
^ R Programming (siehe) – In this course you will learn how to program in R and how to use R for effective data analysis.
^ Getting and Cleaning Data (siehe) – The course will cover the basics needed for collecting, cleaning, and sharing data.
Data Moocs Spring 2014
Praktischerweise starten im Februar und März gleich eine ganze Reihe an Kursen rund um Statistik und Data Analysis:
^ Intro to Data Science von Udacity (siehe) – hat diese Woche begonnen, dauert 5 Wochen und schaut nicht schlecht aus. Topics sind Data Manipulation, Data Analysis with Statistics and Machine Learning, Data Communication with Information Visualization und Data at Scale
, scheint Pandas zu verwenden.
^ Introduction to Probability von edX / MIT (siehe) – hat auch diese Woche begonnen, dauert 15 Wochen und schaut auch nicht schlecht aus und werd ich auf alle Fälle probieren, könnte mir aber zu mathematisch sein (multiple discrete or continuous random variables, expectations, and conditional distributions, laws of large numbers, the main tools of Bayesian inference methods, an introduction to random processes, Poisson processes and Markov chains
).
^ Introduction to Statistics von edX / UC Berkeley startet am 24. Feb und dauert 5 Wochen. Möchte ich auf alle Fälle machen. Ein bisschen Statistik braucht man einfach, weil sonst schnell Dinge zu unnötigen Roadblocks werden.
^ Data Wrangling with MongoDB von Udacity (siehe) – startet am 26. Feb, dauert 6 Wochen und schaut auch nicht schlecht aus. Students will learn how to collect, clean, and extract needed data and store it in MongoDB. We will also cover schema design, learn how to process data within MongoDB, and utilize Hadoop along with MongoDB to perform MapReduce operations.
.
^ The Analytics Edge von edX / MIT (siehe) – beginnt am 4. März, dauert 11 Wochen und schaut sehr interessant aus (Through these examples and many more, we will teach you the following analytics methods: linear regression, logistic regression, trees, text analytics, clustering, visualization, and optimization. We will being using the statistical software R to build models and work with data.
).
^ Exploratory Data Analysis wieder von Udacity (siehe) – startet am 12. März, dauert 6 Wochen und schaut auch nicht schlecht aus, scheint vor allem R zu verwenden.
Abed Nadir
kleiner Nachtrag zu A new course experience, wo Udacity neue Kurse und ein neues Modell angekündigt hat und gwm. Fortführung von Craig Pelton und Jeff Winger – nur zur Erinnerung: Udacity hat sich nach einem furiosen Start ja Mitte 2012 in ein kleines konzeptionelles Loch gesetzt, vor allem wohl weil Thrun mit Coursera mithalten wollte und alles aufs Pimpen von Kennzahlen gesetzt hat.
Wenn ich die Beteiligung in den Foren richtig deute hat sich in den 18 Monaten seither die Grundstimmung nie mehr wirklich gefangen, der Krautsalat an Kursen und die Unentschlossenheit gegenüber der Zielgruppe (die eine kraft zieht zu schülern und das zertifikat muss auch für adhs’ler machbar sein, sonst wird ja die dropout rate zu hoch, die andere zu ‘professionals’ die man potentiell auch zum bezahlen motivieren kann und die das zertifikat u.u. im cv präsentieren wollen, und da wird dann auch ungünstig, wenn sich herumspricht, wie wenig man machen muss, usw.) halfen da sicher nicht weiter.
Ihr neuer Ansatz klang zunächst nicht ganz unplausibel: wir machen thematische Tracks (2014 einmal beginnend mit data science) und wir offerieren neben dem kostenlosen tier auch einen kostenpflichtigen, der dann persönliches Coaching und ein ‘verifiziertes’ Zertifikat beinhaltet.
Aber ich hab jetzt die letzten zwei Tage Introduction to Hadoop and MapReduce – den ersten Kurs in dieser Serie – gemacht und es zeichnet sich leider das nächste Loch ab. Der Kurs selbst ist zwar nicht schlecht, wenn man wie ich mit Hadoop noch nie was zu tun hatte, man bekommt einen Eindruck um was es geht, wofür man es braucht, ein bisschen Gefühl wie man dafür programmiert und man macht zwei kleine Projekte in einer VM mit eingerichteter Entwicklungsumgebung (für VirtualBox oder VMware), aber jetzt kommt’s: man kann als Zaungast den Kurs nicht offiziell beenden, weil das Projekt nur in der kostenpflichtigen ‘full course experience’ bewertet wird. Alleine dass sich ein Mooc Anbieter nicht selbst denken kann, dass das vl. keine so gute Idee ist – psychologisch fühlt man sich natürlich nicht nur übergangen sondern tatsächlich um sein Zeit und den Aufwand beraubt, man lernt ja nicht fürs Leben sondern fürs Zertifikat – ist kein gutes Zeichen, auch die Umsetzung selbst war (wenn ich wiederum das forum richtig deute) anscheinend schwach und mit 150$/m viel zu teuer für das (zusätzlich) Gebotene.
6.00x
auch devoha: last not least hat jetzt auch edX den ersten Batch an Kursen – u.a. die zwei CS Einführungskurse vom MIT und von Harvard – gestartet, und da hat sich das Warten vielleicht doch gelohnt: die Plattform ist ein interessanter Kompromiss zwischen Coursera und Udacity und man spürt, dass hier auch den grundsätzlichen Rahmenbedingungen (wie unambiguität und aufwandstechnisches pacing in den fragestellungen der problem sets) etwas Aufmerksamkeit geschenkt wurde)
I Put the R in Markus
^ Minianmerkung: der Kurs Computing for Data Analysis – eine Art Crashkurs in R – ist zwar gar nicht schlecht, stellt aber einen neuen Rekord in pädagogischer Unzumutbarkeit auf. Dabei ist das Tempo – wenngleich auch gewagt: für das R’sche Äquivalent zum Komplex list comprehensions, map/reduce/filter, generator und anonyme functions und continuations/lexical scoping hat er gerade mal 15 min gebraucht – sogar noch irgendwie ok, weil man das jeweils eine Woche sinken lassen und sich ein bisschen herumspielen kann. Aber er zaubert dann einerseits ohne Warnung Themen aus dem Hut, für die es in einem ‘Einführungskurs’ weder begründbaren Sinn noch Nutzen gibt, etwa Debugging oder die integrierte Optimization. Und die Assignments kommen irgendwie aus dem Nichts und sind dann zwar nicht ‘schwer’, aber unlösbar wenn man irgendwo steckt und eben nicht so konstruiert, dass im getriggerten Problemlösungsprozess ein erkennbarer Wert steckt.
(having said that ist R doch sehr super, wenn man sowas mag, und ich bin mir noch nicht ganz sicher, ob ich dafür roboter genug bin oder nicht, aber zumindest ein teil fühlt sich davon doch angezogen, einem anderen ist es ein bisschen zu matrix-haltig)
Jason Stackhouse
devoha auch hier: Networked Life auf Coursera ist nicht so schlecht
(… wenn man sich einmal an das format voice over slideshow gewöhnt hat, was hier nicht wirklich stört; formal ansonsten interessant, dass coursera hier vom pacing her einen mittelweg ausprobiert: man kann den kurs so schnell machen wie man will, aber es gibt trotzdem verbindliche wöchentliche deadlines und ein ende)
Google Course Builder
Peter Norvig stellt den Google Course Bilder vor (wer die wirklich gute Power Searching Klasse gemacht hat weiss, was er mit dem GCB bekommt, es ist so ziemlich 1:1 die App Engine App dafür)
(ansonsten wird es langsam langweilig, sich über google lustig zu machen, aber damit haben sie usability- und konzeptlosigkeitsmässig auch für ihre massstäbe einen neuen vogel abgeschossen, andererseits ists natürlich trotzdem gut zu sehen, dass sie irgendwas machen und zumindest das thema entdeckt haben, wobei ich eher auf eine übernahme von udacity spekuliert hätte)
war ein youtube video, sie haben es aber gelöscht. ich behalte es hier
At your own risk
(living on the edge)
And no, it's not gamified
gamification vassup; web intelligence and big data ich don't think so; #coursera
— Markus Spath (@hackr) August 27, 2012
(nts: mich öfter selbst zitieren)
neu bei coursera: Gamification, hat heute begonnen und kann ich – zumindest nach der ersten einheit – empfehlen. kevin werbach scheint ähnlich wie scott page bei model thinking eine gute mischung aus informiert, abgeklärt, praktisch, gut gelaunt und gleichzeitig dicht zu finden.
ein verständnis von gamification ist wohl tatsächlich auch weblebensdialektisch recht nützlich, weil die kenntnis der eingesetzten techniken natürlich einerseits bei der ‘feindbeobachtung’ hilft – sprich: man lernt zu sehen, wann und wie irgendwer versucht einen zu gamifizieren -, man dadurch aber auch den natürlichen abwehrreflex – ohne mir! – überkommen und es also quasi second order mässig zulassen kann. es ist eines dieser (handvoll an) konzepte, deren verständnis webkomplexitäten reduziert und gleichzeitig ausdifferenzierungen katalysiert.
openHPI
endlich der erste deutsche Udacity-Klon: openHPI
(abt. kulturkreislehre)
Jeff Winger
huch, der kommende Pulsschlag an Kursen von Coursera und Udacity hat schon wieder eine Tendenz zu Mathematik/Algorithmik/Big Data:
Making Math Matter (Udacity, ab 3.9.)
Intro to Theoretical Computer Science (Udacity, ab 1.10.)
Gamification (Coursera, ab 27.8.)
Web Intelligence and Big Data (Coursera, ab 27.8.)
Social Network Analysis (Coursera, ab 1.9.)
Networked Life (Coursera, ab 1.9.)
Introduction to Mathematical Thinking (Coursera, ab 17.9.)
Computing for Data Analysis (Coursera, ab 24.9.)
Algorithms: Design and Analysis, Part 2 (Coursera, ab 1.10.)
Artificial Intelligence (edX, ab 24.9.)
Coursera hat sich meine Kritik in Craig Pelton übrigens zu Herzen genommen und deutlich in das Design investiert, teilweise haben sogar die Kurse einen Hauch an eigenem Branding.
Übrigens sickerten unlängst einige Details zu den Deals zwischen Universitäten und Coursera durch und einerseits muss man sich dann schon wundern, andererseits wundert man sich über was anderes nicht mehr:
Die Unis bekommen für die Veröffentlichung der Kurse je nach Lebensdauer auf Coursera zwischen 6 und 15% der Einnahmen, worin die Einnahmen bestehen ist aber noch unklar, ein paar Überlegungen gibt es aber bereits.
Dass die Unis dabei mitmachen, ist das Verwunderliche. Ich vermute es liegt daran, dass sie die Karotten ’1 Mio Studenten’ und ‘es ist 11:55’ vor die Nase gesetzt bekommen, ohne eigene Handlungskompetenz als mögliche Alternative zu sehen. (ist natürlich spekulativ, aber es deutet einiges darauf hin, u.a. die von einigen professoren gebetsmühlartig wiedergegebenen floskeln mit teilweise jenseitiger einschätzung des impacts ihres kurses.)
Dass die Kurse bei Coursera sind wie sie sind, ist das damit Erklärte. Natürlich wird unter diesen Konditionen der Aufwand minimiert und also die ohnehin vorhandenen Vorlesungen halt wo notwendig adaptiert.
Udacity ist gleichzeitig in den letzten 2 Monaten ein bisschen vom Pfad abgekommen. Ich habs ja hier schon angedeutet, für Udacity war dieses Hexamester inhaltlich eine kleine Katastrophe – von einem angekündigten Kurs zum SE hat man überhaupt nichts mehr gehört, der Mathematikkurs wurde zunächst mit fadenscheinigen Argumenten verschoben, und jetzt gecancelt, der Statistikkurs war zwar eigentlich nicht schlecht, der gecover’te Raum spannte sich von basics, über charts, Mittelwerte, Varianz, Wahrscheinlichkeitstheorie, Bayes, diversen Verteilungen, Vertrauensintervallen und statistischen Hypothesen bis zur linearen Regression, allerdings war auch vieles schlampig, unfertig, ungetestet und irgendwie adhoc begonnen und mittendrin beendet, der Algorithmenkurs war recht nett, siehe unten, der Physikkurs war angeblich sehr gut, der Softwaretestingkurs war ich würd einmal sagen auch nicht schlecht und teilweise interessant aber insgesamt durchwachsen und nicht wirklich udacious.
Allen gemein war leider (und wirklich völlig unverständlicherweise, sie sollten die bedeutung kennen), dass die formale Konsistenz mehr oder weniger aufgegeben wurde. Statt einem erwartbaren Puls mit mütterlichem Behagen für die Studenten – alle 9 wochen ein neuer jahrgang mit 4 oder 5 neuen kursen, alle kurse dauern 7 wochen, jeden montag gibts neue inhalte, jeden dienstag gibts neue problem sets und die auflösung der letzten woche, exams in der letzten wochen mit deadline, usw. – sind sie einerseits zu einem völlig offenen Format für alles gewechselt (start, dauer und exam wann man will), wurden andererseits aber beim Posten neuer Inhalte ebenso ungenau (nicht fertig, technische probleme, inhaltliche probleme bei den formulierungen und den gradern).
Ihre eigentliche Hauptleistung – die Synchronisierung der Zeitlichkeiten – haben auch sie gegen die Werbebotschaft ‘join the revolution’ eingetauscht, nur dass sie es eher den Medien und nicht anderen Unis erzählen, die Kosten dafür sind, dass sie sich plötzlich mit allen anderen mehr oder weniger statischen Angeboten vergleichen lassen müssen, und bei allen Bereichen in denen es einen definierten Kanon gibt, werden sie es schwer haben. Ihre andere Hauptleistung würde ich in Anlehnung an opinionated software ‘opinionated education’ nennen, und da haben sie nach wie vor die Nase vorn und wohl mittelfristig zumindest von coursera und edx und der khan academy nichts zu befürchten.
(uff, das wird mir zu lang, den oben versprochenen vergleich der algorithmuskurse bei coursera und udacity spar ich mir, nur ein satz dazu: man konnte die jeweiligen vor- und nachteile der jeweiligen ansätze fast in reinkultur beobachten und für den interessierten schüler ist tatsächlich die heterogenität das tüpfelchen auf dem i)
Jim Rash
noch ein Mininachtrag zu Craig Pelton : nach Coursera hat jetzt auch edX den ersten Schwung an Kursen angekündigt, u.a. die Berkeley Klasse CS188 über AI.
Es wirkt aber so, also beschränke sich auch edX wie Coursera eher auf das Veronlinen von Vorhandenem, nicht auf die Evolution der Form. Die Einführung in CS gibts zb schon lange auf OCW und die SaaS Klasse läuft gerade auf Coursera und besteht in einer Audioaufnahme einer Vorlesung mit eingespielten Folien und dient primär dem Crossselling ihres Buchs zum Thema (was imo völlig ok ist, aber sie erwähnen es alle 5 min und nach 30 erwähnungen wer mit das too much)
Craig Pelton
Apropos New School of Education: das etwas umtriebige Verhalten von Udacity’s Sebastian Thrun – es gibt ja kaum ein Medium, in dem er in den letzten Wochen kein Interview gegeben und die Revolution der Bildung angedeutet hat – war Coursera dann doch ein bisschen zu suspekt und sie haben nicht nur Partnerschaften mit 12 weiteren Universitäten sondern auch zunächst mal 111 weitere Kurse angekündigt. edX wiederum bekommt eine Million von der Gates Foundation, das Feld beschleunigt sich ganz offenkundlich.
Und dabei lustig: alles, was für den derzeitigen Umbruch notwendig war, ist, dass einer (Udacity) Gas gegeben und ein Eitzerl mehr Aufwand investiert hat, sprich nicht nur vorhandenes Material adaptiert, sondern dediziert neues Material in einem geeigneteren Format erstellt hat; die Form der Vorlesung nicht unreflektiert übernommen (Coursera) oder pragmatisch aufgelöst (Khan) sondern eine erwartbare Form definiert hat; und vor allem: Design nicht völlig ignoriert sondern ein bisschen in das Design der Website, das Design der Umgebung und das Branding investiert hat. (ich hab die problemchen mit udacity schon gelegentlich erwähnt und wiederhole sie hier jetzt nicht; entscheidend ist tatsächlich die disposition, und da hat udacity alle auf dem falschen fuss erwischt)
(nur als gefühl am rande: mir kommt vor, dass thrun gerade ein bisschen überverkauft und überverspricht. mit der statistik klasse wollte er etwa einen neuen teilnehmerrekord aufstellen, angemeldet haben sich dann 25.000 und nicht die erhofften 160k+; als neue zielgruppe wurden schüler ausgemacht, und das hat sich dann auch im ‘anspruch’ und der zumindest anfänglichen gegen null gehenden schwierigkeitsstufe manifestiert, die sich dann aber in eine bipolare unentschiedenheit transformiert hat, was der kurs sein soll (prepre-algebra in den lectures mit sich wiederholenden ‘doesn’t this blow your mind?’ und irgendwie aus dem nichts kommenden problem sets, die dann komplexere integralrechnung und mathematische beweisführung erforderten, wechseln sich freudig ab). udacity hat afaics ein riesiges potential, aber auch einige löcher, in die sie fallen können, wenn sie zu früh zu viel wollen oder hudeln oder zu früh erfolgreich werden, so blöd das klingt)
RCKNiuqgwgp
wenn du selbst eine vergleichende studie machen willst: coursera und udacity offerieren derzeit beide gerade einführungen in algorithmen, und beide sind eig. auch repräsentativ für die jeweiligen ansätze und zeigen auch die derzeitigen stärken. (udacity: http://www.udacity.com/overview/Course/cs215/CourseRev/1 auf preview klicken, die erste lektion ist ok; coursera: https://www.coursera.org/course/algo auf preview klicken, ich würd mir zumindest Dijkstra's Shortest-Path Algorithm (21 min) in sektion XI anschauen, da ist er gut gelaunt und das ist wirklich ein eleganter und auch verständlicher algorithmus. oder quicksort.)
eher ein gefühl, aber ich glaube dass derzeit ein 'autoritärer' stil (im sinne von dem professor, dem das wissen unterstellt wird, nicht im sinne von kalt und arrogant) besser funktioniert als flottierende und autopoetische peer flocken. in den foren stürzen sie sich wie wölfe auf die kleinste unsicherheit oder ungenauigkeit der teaching assistants. (was natürlich nicht heisst, dass das für jeden inhalt funktioniert, ganz im gegenteil)
(hab ich noch gar nicht gedacht gehabt, aber) eigentlich sind die angebote nicht 'sozial' (im mediatopschen web 2.0 sinne) sondern nur auf masse 'skaliert' mit einigen sozialen features.
Power Searching with Google
ha, jetzt offeriert auch Google Kurse im Udacity Stil, inkl. Zertifikat: Power Searching with Google
VAM9K1SmD5H
oops, I think I've just mixed up the surveys for Udacity CS101 and CS212 which might give the evaluating script some weird edge case, lol.Britta Perry
huch, der kommende Pulsschlag an Kursen von Coursera und Udacity hat eine Tendenz zu Mathematik/Statistik/Algorithmik:
Cryptography (Coursera, ab 11.6.)
Algorithms: Design and Analysis (Coursera, ab 11.6.)
Introduction to Statistics (Udacity, ab 25.6.)
Algorithms: Crunching Social Networks (Udacity, ab 25.6.)
Logic and Discrete Mathematics (Udacity, ab 25.6.)
dazu passend noch CS 61B Data Structures (Berkeley, seit 2006)
Bei wem wie bei mir die Mathematik-Kenntnisse seit dem Gymnasium wahrscheinlich auf Volksschulniveau degeneriert sind, könnte eine kleine Auffrischung vl. gar nicht schaden.
(ich glaub ich werd mal schauen; ein bisschen math/algo/statistics wär vl. tatsächlich gar nicht schlecht, zumal ich in letzter zeit schon gemerkt hab, wie schnell man ansonsten einfach völlig ansteht und noch nicht mal die problematik des problems erahnbar ist, bestenfalls die selbstbeobachtung beim vermuten einer beobachtungsunfähigkeit, man gwm. eingezäunt dahindenkt usw. andererseits ist das ein bereich, in dem die soziale aufgabenverteilung schon sinnvoll ist, die relevanten probleme sind schwer und man kann das nicht wirklich im nebenbei aufpicken usw.)
The Amazing Race
So, noch ein vorläufig letztes Update zu der Community Serie (siehe Greendale und Señor Chang und Pierce Hawthorne und Troy Barnes) und auch meine Antwort für Quiz #60 :
diese Woche sind die Finals und unterm Strich ist wirklich irre, wie weit man in sechs Wochen kommen kann. Die Exams selbst sind nicht leicht aber machbar (bei CS101 etwa die Optimierung vom Ranking Algorithmus, indem reziproke Links bis zu einer definierbaren Tiefe als solche erkannt und also nicht gewichtet werden oder die Realisierung von einem einfachen zellulären Automaten, bei CS253 die Entwicklung eines auch wieder einfachen Wikis mit Versionskontrolle, und sechs harte Knochen / Puzzles von Norvig) und runden die Kurse doch schön ab.
Was uns zum Quiz bringt:
Die primäre Leistung von Udacity (und Coursera und dem kommenden edX usw.) besteht in der Bündelung der Zeitlichkeiten der ‘Studenten’ und ‘Lehrer’.
Die Inhalte selbst sind die längste Zeit schon irgendwie da. Aber auch wenn es super ist und bleibt, wenn das MIT oder Berkeley oder Stanford ihre Vorlesungen aufnehmen und dann ggf. mit einigen Slides ins Web stellen, in Zukunft reicht diese Geste der Gnade beim gleichzeitigen ‘lasst uns bitte ansonsten zufrieden’ nicht mehr aus (wobei natürlich themen bleiben, die sich so auch gut abbilden lassen; ein crashkurs in poststrukturalistischer literaturkritk ist auch als vorlesung nicht schlecht, siehe).
Was fehlte war der persönliche Anspruch an die Teilnehmer, das Gefühl der Aufgehobenheit (i.g.z oben angesprochenen erwarteten Dankbarkeit) und eben die Synchronisierung der Zeiten bei gleichzeitigem Setzen von Deadlines für Homeworks und Exams. Nur durch diese Gleichzeitigkeit ist dieser persönliche Anspruch und das Gefühl der Aufgehobenheit möglich, nur durch die Gleichzeitigkeit entsteht genügend Dichte, dass sich die Leute bei Problemen – Verständnisschwierigkeiten in den Lectures, Stocken in den Homeworks – auch selbst helfen können.
Das für sich nutzbar machend hat sich Udacity thematisch in einem sweet spot positioniert, der bis dato zumindest massentauglich nicht angegangen wurde: im Niemandsland zwischen dem ‘hello world’ und den Problemen von Leuten, die schon jahrelang in dem Feld arbeiten. Hello worlds gibts zu allem, aber es ist schwer dann zum nächsten Schritt zu kommen (man denke an das Codeyear der Codacademy). Auch vielleicht nicht gelöst, aber sicher nicht unterorganisiert ist der Austausch und die Weiterbidung von ohnehin schon Professionals (Kurse, Kongresse, Zertifikate, Blogs von und für Spezialisten, etctralala.) Und wirklich gelöst ist das Problem der Nanochunks sprich konkreten Fragen. Spezifisch genug kann man diese ohne Umformulierung in Google stellen und wird dann üblicherweise zur passenden Frage/Antwort-Kombi bei Stack Overflow verwiesen.
Was aber fehlte war ein ‘Curriculum’ das zwischen den Erleuchtungsebenen vermittelt und wenn man sich das überlegt, dann ist das tatsächlich ein Problem, das sich nicht wirklich leicht durch das Web lösen lässt (zu unterscheiden vom im web vermitteln; einmal gelöst lässt es sich natürlich ideal im web vermitteln). Und das Problem für das Problem ist natürlich einerseits der Aufwand der Erstellung und andererseits das Risiko der Evaluation auf seiten der Azubis. Es ist einfach zu riskant, einige Wochen zu investieren, nur um dann draufzukommen, dass das alles ein veralteter und stilistisch grauenhafter Blödsinn war, der einen eigentlich nur noch dummer gemacht hat, als man ohnehin schon war.
Aber Udacity (und zu einem geringeren Grad Coursera – die stecken eher noch im alten Modell fest und tendieren den Mehraufwand ab gefilmter Vorlesung eher zu minimieren, da basiert der Wert derzeit eher noch auf der Qualität und dem Einsatz der ‘Lehrer’) schickt sich an, sukzessive die Blöcke für solche Curricula zu entwickeln und dadurch einige mögliche Probleme für Selbstlerner zu lösen. Vor allem das der Roadblocks.
Roadblocks
Roadblocks sind – wie wir von the Amazing Race wissen – Blockaden, die wir aus dem Weg räumen müssen, bevor wir unsere Reise fortsetzen können. Oft sind das nur Kleinigkeiten – deshalb bleibt der modus face to face so wichtig, ein anderer sieht oft in 5 Sekunden, warum es hängt -, aber bevor man sie nicht gelöst hat, geht es nicht weiter. Und Udacity versucht auf allen Ebenen und ich würde sagen nicht ganz erfolglos, diese Roadblocks zu vermeiden. Das beginnt mir der Auswahl der Tools und der technischen Infrastrukur (fast alles kann man im online editor machen, es wird sofort diagnostiziert, Google App Engine läuft bei den meisten out-of-the-box), geht über die Auswahl und Entwicklung der Themen bis zur semibetreuten (TAs springen eig. immer ein) Community. Für Autodidakten jedenfalls ein guter Modus.
(es gab durchaus auch zu kritisierendes; die automatischen grader etwa sind sehr pingelig und die anweisungen waren oft viel zu uneindeutig und teilweise auch selbstwidersprüchlich, da ein externes paar augen drüberschauen zu lassen wäre vl. keine schlechte idee gewesen, denken wir an die diversity models der model thinking klasse. pädagogisch ‘zumutbar’ sind einige einheiten sich auch nicht usw, aber ich will hier nicht jammern)
((nur am Rande aber ein Ding ist mir ganz extrem aufgefallen: die Kluft zwischen schnell hingeklopft und verschiffbar ist gigantisch. Einen Prototypen zu bauen, der funktional das meiste kann und im eigenen Setup problemlos funktioniert ist eine ganz andere Nummer als in der freien Wildbahn zumutbar zu sein und alle möglichen Kontingenzen abzufedern. Ich schätze das Verhältnis liegt irgendwo zwischen 1:10 und 1:20. Nicht nur deshalb hab ich aber jedenfalls einen ganz neuen Respekt vor jeglichen Anwendungen, aber es nützt ja nix, es is halt trotzdem wie’s is))
Quiz Pt. 60 (The Paintballs Edition)
kleines Nachtragsquiz zu Troy Barnes : worin besteht denn eigentlich die eigentliche Leistung / Innovation von Udacity und Coursera?
(wie immer gibt es da keine richtige lösung, aber beide (auf|er|um)lösen einen zustand / ein problem, das die davorigen angebote noch nicht sahen, das sich in zukunft aber als recht entscheidend erwiesen haben wird. den allgemeinen zugang zu ich sag mal highest quality content – sprich die lectures von ivy league universities – gibts ja doch schon lange, opencourseware etwa seit 10 jahren, und auch die technik vom interaktiven codieren im browser ist nicht ganz neu.)
Pierce Hawthorne
kl. Nachtrag zu Señor Chang und Greendale : die Dichte und das angeschlagene Tempo der von Udacity offerierten Kurse ist doch erstaunlich, vor allem Peter Norvig’s CS212 (was als fortsetzungskurs für das CS101 und also für leute mit einem 6-wöchigen kurs als basis offeriert wird; peter norvig ist übrigens auch die antwort von quiz pt. 57) ist nichts für Leute mit schwachen Nerven oder einem niedrigen Frustrationsthreshold, der ist in Woche 3 schon bei der Implementierung eines Compilers für regular expressions gelandet (fast noch erstaunlicher: der code passt auf 18 zeilen, siehe screenshot, aber norvig schreibt auch einen spell checker auf basis von bayesian probability theory in 21 zeilen), davor hat man dafür eine API und einen Interpreter geschrieben, danach – und spätestens da bin ich dann aber völlig ausgestiegen – kommt auch noch ein Generator für alle möglichen ‘Sprachen’, Mashups von Functions, bei denen alle möglichen Zeitlichkeiten vorgespeichert werden, dynamisches Mapping von Funktionen und Meta-Dekorators, Memoization via Caches für Funktionen, ein injiziertes Tracetool und Programmieren in verschiedenen virtualisierten Timelines. Und das alles in 60min oder so. Die programmiertechnisch notwendigen Konzepte wie list comprehensions, generator expressions, generator functions und voodoo mit den eingebauten Collections werden on the fly erwähnt.
MIT and Harvard announce edX
Jetzt also auch noch MIT und Harvard mit einer Art Webuni.Señor Chang
kl. Nachtrag zu Greendale : praktischerweise offeriert Udacity anscheinend die abgehaltenen Kurse dann auch in den folgenden Hexamestern in einem Selbstbedienungsmodus. Die letzten drei Tage hab ich die Einführung für Dummies CS101 irgendwie als Crashkurs absolviert, eig. um die Basics von Python zumindest einmal gesehen zu haben, als kleine Überraschung steht man dann aber am Ende mit einer selbst geschriebenen Suchmaschiene da, die zumindest konzeptionell dem Stand von Google anno 1998 entspricht, inkl. Crawler, Indizierung in selbstkomponierten Hashtables, rudimentärer Graphentheorie und nicht zuletzt Implementierung eines kleinen PageRanks, der in Phasen iterativ ‘schlauer’ wird (relaxation algorithm, siehe bild).
(abt. smoking heads)
Greendale
noch ein kleiner Nachtrag zu Community College : Udacity startet gerade einen Schwung an neuen Kursen.
(endgültige kritik nach der ersten stunde: gegenüber coursera hat udacity einige vor- und nachteile, aber insgesamt ist es etwas durchdachter und technisch ausgereifter; dass man in den lectures inline mitprogrammieren kann/muss ist jedenfalls schon sehr nett/stressig. (ich kann leider kein python und fürchte dass mir CS212 deshalb ein bisschen too much ist, aber vl. gehen die idiosynkrasien von python im gleichen schwung rein))
Model Studies
kl. Nachtrag zu Community College : die Model Thinking Klasse hat gerade ihr Midterm und deshalb nochmal ein kleiner Anstups; die Videos sind auch ohne Anmeldung einsehbar, ein langes Wochenende reicht wohl auch zum Catchup aus und zumindest ich hatte in den letzten Jahren selten mehr Bang für den Buck (Time).
Der Kurs ist (wenn man allem folgen will, was auch nicht notwendig ist, weil er sehr modular ist) nicht ganz einfach, aber Hausverstand und ein bisschen Lust an logischem Denken reicht (im Gegensatz zu den anderen Stanford-Kursen, in die ich hineingeschnuppert habe) locker aus, also keineswegs schwer, aber sehr gut (mich dünkt man müsste viel viel mehr Zeit investieren, um dann einen signifikant höheren Nutzen zu haben); Scott Page hat spürbar Lust am Thema und ist extrem gut darin, die Modelle auf einem Abstraktionsniveau zu erklären, das gleichzeit verständlich und non-trivial ist, und sie dann auch in ihrer Relevanz für unser Dasein zu positionieren.
(fast bei jedem modell hat es bei mir irgendwie kling kling kling gemacht und plötzlich hatte ich ein instrumentarium dafür, irgendein phänomen zu fassen, das davor irgendwie meistens in der konzeptionellen suppe der überkompliziertheit geschwommen ist. und eines der ersten dinge die man lernt, ist, die bedingungen zu klären, unter denen die jeweils getroffenen grundannahmen gültig sind (was mir, so blöd es klingt, schon alleine dabei geholfen hat, meinen gereiztheitszustand gegenüber einigen feldern zu senken, weil ich mich z.b. bei aussagen nicht mehr über die inkonsistenzen und willkürlichen grundannahmen ärgere, sondern eher den gültigkeitsbereich skizziere, den es ja trotzdem meistens auch gibt). ein anderes ist, dass man plötzlich ein auge für modelle bekommt und sie erkennt, wenn sie etwa von anderen menschen angewandt werden (ob sie es jetzt wissen oder nicht). auch das führt mitunter zu einer defrustrierung mit den mitmenschen, weil man ihren irr- und unsinn oft als rationales verhalten (halt unter suboptimalen grundannahmen) zumindest nachvollziehen kann; viele der aktuellen konfikte sind halt einfach ein clash zwischen optimierung eines big coefficient der sich leider einer new reality gegenüber (nicht) sieht. oder sie helfen beim etablieren eines ‘feelings’ für die dynamik von equilibrien von szenarien, die übrigens oft contraintuitiv sind)
Community College
ui, Stanford offeriert in diesem Quarter gleich drei Kurse für ein systematischeres Denken:
Models help us to better organize information – to make sense of that fire hose or hairball of data (choose your metaphor) available on the Internet. Models improve our abilities to make accurate forecasts. They help us make better decisions and adopt more effective strategies. They even can improve our ability to design institutions and procedures.
Popularized by movies such as “A Beautiful Mind”, game theory is the mathematical modeling of strategic interaction among rational (and irrational) agents. Beyond what we call ‘games’ in common language, such as chess, poker, soccer, etc., it includes the modeling of conflict among nations, political campaigns, competition among firms, and trading behavior in markets such as the NYSE. How could you begin to model eBay, Google keyword auctions, and peer to peer file-sharing networks, without accounting for the incentives of the people using them? The course will provide the basics: representing games and strategies, the extensive form (which computer scientists call game trees), Bayesian games (modeling things like auctions), repeated and stochastic games, and more. We’ll include a variety of examples including classic games and a few applications.
Information theory is the science of operations on data such as compression, storage, and communication. It is among the few disciplines fortunate to have a precise date of birth: 1948, with the publication of Claude E. Shannon’s paper entitled “A Mathematical Theory of Communication”.
Irgendjemand up for a study group?