Print:

Save the planet, become a pirate

Fabian Jansen, Data physicist & Advisor Big Data & Analytics

LinkedIn profiel

“Save the planet, become a pirate” is een bekende grap onder jonge wetenschappers en wetenschapsstudenten. De aanzet tot deze grap is de sterke correlatie over de afgelopen twee eeuwen tussen de opwarming van de aarde en het dalend aantal piraten. Ergo, zo luidt de clou, wil je de planeet redden, word dan piraat!

Uiteraard is deze conclusie klinkklare onzin, maar het vat op ludieke wijze samen dat correlatie en causatie heel verschillende dingen zijn. Door de absurditeit van de vergelijking in de categorie “appels met peren”, zal iedereen moeiteloos inzien dat piraten en de opwarming van de aarde niets met elkaar te maken hebben. Maar hoe zit het met andere gevallen waarbij deze schifting niet op het eerste oog te maken valt? Zo laten data bijvoorbeeld zien dat er een sterke correlatie bestaat tussen autisme en de verkoop van organisch voedsel. Toch maar geen organisch voedsel? De data laten het zien toch? Of zit het toch anders?

Met de komst van Big Data gaat er voor ieder persoon, bedrijf en ondernemer een wereld van correlaties open. Je kan databronnen uit diverse kanalen met elkaar vergelijken en machine learning tools zijn in staat om verbanden en patronen te ontdekken die het menselijk oog ontgaan. Maar run jij je business uitsluitend op een patroon, een verband? Stel: uit analyse blijkt dat er boven verwachting veel vrouwelijke bezoekers naar een site met contactadvertenties komen. Je zou daaruit kunnen concluderen dat je aanname er overwegend mannelijke bezoekers aan te treffen niet klopte, en daarop je advertenties en aanbieders aan te passen. Je komt echter weer op een heel ander spoor wanneer je de analyse uitbreid door niet alleen te toetsen of de bezoeker man of vrouw is, maar ook na te gaan wat de aanleiding is van het bezoek. Dan laat je analyse zien dat veel van deze vrouwelijke bezoekers naar de site komen om er zelf een advertentie te plaatsen in plaats van er één te zoeken.

Jonge wetenschappers leren van meet af aan te denken in termen van causatie in plaats van correlatie. Pas wanneer je in staat bent om de oorzaak van deze correlatie te vinden heb je een waardevol inzicht te pakken. Een dashboard met interactieve bedrijfsresultaten is (nog) niet voldoende om als bedrijf je koers te wijzigen. Het inzicht in de oorzaken achter deze cijfers geven wél de benodigde handvaten om in te schatten welke actie of strategie nodig is. Wat deze wetenschappelijke denk- en werkwijze ons leert is dat data analyse draait om de interpretatie van data en contextualisatie van resultaten. Een machine learning tool kan talloze correlaties vinden, maar zal in werkelijkheid geen enkele causatie herkennen. En de analist of data scientist die een dergelijke tool ongecheckt aan het werk zet is niet slimmer dan de tool zelf. Met een goede dosis wetenschappelijke benadering kom je zo tot waardevolle inzichten met een conclusie die hout snijdt!

Over Fabian Jansen

Dr. Ir. Fabian Jansen
Fabian is Adviseur Big Data & Analytics bij KPMG. Hij is een enthousiast onderzoeker en zich bezig met allerlei vraagstukken rondom Big Data. Hij ziet het als een uitdaging om organisaties te helpen hun voordeel te doen op basis van de enorme mogelijkheden die Big Data geeft.

Wij gebruiken cookies om IIR.nl gemakkelijk te maken. Bezoekt u onze website, dan gaat u akkoord met deze cookies meer informatie

De cookie-instellingen op deze website zijn ingesteld op 'toestaan cookies "om u de beste surfervaring mogelijk. Als u doorgaat met deze website te gebruiken zonder het wijzigen van uw cookie-instellingen of u klikt op "Accepteren" hieronder dan bent u akkoord met deze instellingen.

Sluiten