Met ''de meest sexy baan van de 21e eeuw'' naar San Francisco

  • Nadieh Bremer
  • 06 maart 2013

Ok, niet helemaal SF, maar nog wel de Bay Area. Afgelopen 26-28 februari kwamen er bijna 4000 data nerds bij elkaar voor de Strata Conferentie: Making Data Work in Santa Clara…en daar was ik er 1 van! Volgens Forbes magazine is Data Scientist de meest sexy baan van de 21e eeuw, dus de Strata Conferentie was dan wel the-place-to-be. Tijdens de conferentie werden er presentaties gegeven door de meest vooraanstaande en vernieuwende bedrijven/onderzoekers op het gebied van Data, zoals Facebook, Twitter en Google.

De onderwerpen liepen uiteen van Data Science, Data Visualization, Open Data (zoals de statistieken die de overheid via het CBS verspreid) en natuurlijk ook Big Data, de hipste technologie trend van 2012. Met gemiddeld 600 tweets per seconde (oftewel 50 miljoen per dag) kunnen ze bij Twitter zeker van Big Data spreken. Maar ook supermarkten die elk gescand artikel van alle mandjes bij alle kassa’s in alle winkels verzamelen, kampen met de opslagproblemen van hun Big Data.


Dag 1 – Workshops

Om 5:00 maar opgestaan, na 16x de klok op de wekkerradio te hebben gekeken in de afgelopen nacht, had slapen toch geen zin meer. Nog even wat mailtjes verwerkt voordat ik, 4 uur later, bij de conferentie mijn prachtige naamkaartje kon omhangen. De eerste dag bestond uit twee lange workshops (ik had voor de conferentie al besloten welke van de 10 ik wilde gaan volgen). Binnen mijn afdeling, Business Intelligence & Analytics, ben ik veel bezig met het schrijven van mijn eigen programma’s en modellen om data te analyseren. Dus een workshop die gave features uitlegt over een programmeertaal die ik erg veel gebruik, liet ik niet aan me voorbij gaan. Het was wel meteen duidelijk wie hard-core programmeerders waren (een Mac, lucky them). Ondanks mijn jetlag was de tijd zo voorbij.

In de middag meegenomen door het data team van The Guardian in hun proces om data in interessante en mooie verhalen om te zetten. Leuk om te zien hoe ver je kunt komen met alleen publiekelijk verkrijgbare data en veelal gratis tools (bekijk vooral deze mooie voorbeelden van Google Fusion Maps, volgens mij werken Nederlandse kranten er jammer genoeg nog niet mee).

Aan het eind van de dag ging een bijbehorende beurs open (denk aan de carrière beurs) met alleen maar bedrijven die zich bezig houden met data, zoals Microsoft en HP. Ik had alleen het idee dat de bezoekers van de conferentie niet echt de Decision Makers waren, maar eerder de werknemers van bedrijven zoals Microsoft zelf. Dus ik heb eigenlijk nog steeds geen idee wie ze probeerde te overtuigen om hun ‘awesome’ producten te kopen. Maar ik vond het niet erg, je kunt nooit genoeg gadgets hebben!


Dag 2 – Losse Presentaties

De dag begon goed met twee presentaties over Recommender Systemen (Stitch Fix en Birchbox). Deze proberen te voorspellen wat de voorkeur van gebruikers is. Waarschijnlijk heeft zo’n systeem jou al eens geanalyseerd bij NetFlix, Pandora of Amazon. Ook nog de best practices van het maken van een voorspellingsmodel geleerd van Facebook.

Door ondertussen met medebezoekers te praten, kwam ik erachter dat er een grote variatie is in de bedrijven achter de bezoekers. Zo zat ik tijdens de lunch aan een tafel met een medewerker van Motorola en Time Warner Cable (een televisieprovider) en bespraken we hoe ieder van ons het Recommender systeem zou kunnen toepassen binnen ons vakgebied. Zou het bijvoorbeeld niet fijn zijn als de tv alvast voor jou bepaald welke programma’s uit de 200+ kanalen jij interessant vindt?

Even wat minder technisch, maar net zo leuk, was een presentatie van een ‘Viz Wiz’ van Twitter, waarin hij zijn eigen (gave) werk kon showcasen. Bekijk vooral zijn Twitter Political Engagement Map waarin wordt getoond hoe heftig elke staat in de US via Twitter heeft gereageerd op een tweet uitspraak van Obama en Romney.

Dag 3 – Alweer de laatste dag

Nog maar enkele presentaties te gaan. Vooral een uitgebreide presentatie over hoe MailChimp hackers en ‘just stupid people’ uit hun systemen weet te houden m.b.v. voorspellingen had ik niet willen missen! Daarnaast ook minstens 6 T-shirts en vele buttons met geeky teksten verzameld op de beurs (‘My Data is Bigger than Yours’, ‘I’d segment that’).

Het was leuk om te zien hoe 4000 van nature nogal introverte mensen met mogelijke netwerk momenten omgaan, zoals korte pauzes tussen presentaties. Op elke stoel en langs de muren op de grond waren bezoekers te vinden achter hun Mac of iPad, waarschijnlijk aan het bloggen of tweeten over wat ze net hadden gehoord. Tijdens de lunch wordt je gelukkig wel gedwongen om aan een tafel te zitten. Vandaag had ik daar een leuke discussie met een medewerker van de FAA (Federal Aviation Administration) over datagebruik om vliegen veiliger te maken (heb alle Air Crash Investigations gezien!).

Voordat ik het wist, was het alweer tijd voor de laatste presentatie, maar wel een super afsluiting over het gebruik van Data Science tijdens de afgelopen US elections. Zo heeft het Obama team honderden verschillende e-mails met steeds een andere titel gestuurd naar Obama aanhangers voor donaties om zo te kijken welke titel het meest zou opbrengen. Van “Michelle time” tot “Some scary numbers” of nog slechter. Uiteindelijk bracht de meest succesvolle titel miljoenen dollars binnen: “Hey” (gek genoeg denk ik dan vaak dat het spam is).

Jammer genoeg weinig tijd om bij te komen, want de volgende ochtend zat ik alweer in het vliegtuig naar Schiphol. Natuurlijk wel te bedenken hoe ik al die gave dingen die ik had geleerd zelf kon gaan toepassen en ondertussen al mijn eerste Google Fusion Table van Nederland gemaakt!

Voor een uitgebreider verslag, van ook de technische aspecten, verwijs ik je graag door naar mijn eigen blog.

Nadieh Bremer

Business Intelligence & Analytics - BA

Ik ben cum laude afgestudeerd in de Sterrenkunde en in oktober 2011 begonnen bij Deloitte als Junior Consultant Advanced Analytics. Tijdens mijn werk ben ik vaak bezig met het analyseren van data en creëren van dashboards met behulp van (zelf geschreven) algoritmes en modellen. Naast mijn werk vind ik het leuk om te lezen, zonnen, rondreizen en koken.

Dagen als deze!

  • Ronald van Etten
  • 28 februari 2013
Naar boven