Print:

Goud vinden in de databergen

Jasper Bakker, Freelance ICT & internet-journalist

LinkedIn profiel

Goede analyse levert gouden inzichten op, maar het vinden van de juiste verbanden is als het zoeken van naalden in alsmaar groeiende databergen. Daarbij speelt ook de betrouwbaarheid van data een grote rol. Geleidelijk aan wordt de goudkoorts gesteund door onderbouwde methodieken.

Data-analyse en Big Data zijn an sich niet nieuw. Data-analyse was echter voorheen vooral een ICT-kwestie; analyse van technische gegevens over bijvoorbeeld serverbelasting, netwerkverkeer en opslagbetrouwbaarheid. Inzichten daarin kunnen helpen om budgettering, aanschaf en werkzaamheden te plannen. Tegenwoordig dient data analytics een steeds breder toepassingsveld, ver voorbij de automatisering zelf.

Groot, groter en ook klein

Big Data op zijn beurt was voorheen vooral iets voor de echt grote ondernemingen die met enorme hoeveelheden data werken; zeg maar de Shells van deze wereld. Tegenwoordig zijn veel bedrijven en organisaties bezig met groeiende bergen data. Zij kampen niet langer met het – ook best uitdagende – probleem van data-opslag en -beheer. Zij proberen de opgeslagen interne en de beschikbare externe data te benutten, te doorgronden. Gestructureerde én ongestructureerde data bevat namelijk goudklompjes die mits goed geanaliseerd waardevolle inzichten kunnen opleveren.

Bedrijven en organisaties van allerlei soorten, sectoren en maten kunnen daar hun voordeel mee doen. Dit besef is inmiddels wel breed doorgedringen in de markt. Dit lijkt haaks te staan op het bekoelen van de hype rond Big Data. Trends als het Internet of Things (IoT) hebben de aandacht en hype-koorts overgenomen. Het IoT – wat zelf overigens ook een flinke aanjager voor Big Data is – heeft twee jaar terug al het stokje overgenomen van Big Data als meestgehypte technologie op de bekende Hype Cylce van ICT-onderzoeksbureau Gartner.

De hype voorbij

Deze verschuiving wil echter niet zeggen dat Big Data zelf aan het bekoelen is. De Hype Cycle geeft na de piek van de ‘overtrokken verwachtingen’ namelijk de ‘helling van verlichting’ die leidt naar het ‘plateau van productiviteit’. Na de hype volgt dus achtereenvolgens relativering, duiding en praktisch nut. Daar tussenin, direct na de scherpe piek van de hype, ligt echter nog het diepe dal van de teleurstelling. Gartner noemt dit de ‘trog van de ontgoocheling’.

Big Data als trend bevindt zich nu in de afdalingsfase. De hooggespannen verwachtingen en hyperbolische beloftes worden aan de tand gevoeld, ontkracht en bescheidener ingeschaald. Het is daarbij wel zaak om actief de ontwikkelingen en mogelijkheden scherp in de gaten te blijven houden. De toekomst, stellen analisten zoals die van Gartner, is aan datagedreven organisaties.

Wie, waar, wanneer?

Het gedoodverfde voorbeeld van Uber is hier een bewijs van. De faciliteerder van autoritten, die zelf geen taxibedrijf is, dankt zijn enorme waarde, zijn gigantische groei en zijn hele bestaan aan data en goed gebruik daarvan. Welke Uber-gebruiker heeft waar en wanneer een rit nodig naar waar, welke Uber-chauffeur is daar en dan in de buurt, en hoe is het gesteld met de verkeersdrukte op die route plus de vraag naar ritten op dat moment? Eigenlijk is dit nog een simpel geval van data combineren en niet eens zozeer diepgaand analyseren.

Er is meer mogelijk met meer analyse, van eventueel meer data. Maak nu niet de vergissing dat de potentie van Big Data vooral schuilt in complexe omgevingen van datareuzen. Zoals bijvoorbeeld de Shells, Unilevers en McCain Foods’ van deze wereld. Inmiddels zijn er naast zulke industriële reuzen ook andere organisaties opgestaan die databergen hebben, scheppen en ontginnen. Denk ook hierbij niet alleen aan bekende internetreuzen als Google, Amazon en Facebook, of aan ICT-giganten als IBM.

Van straaljagers tot komkommers

De toepassingsmogelijkheden van Big Data zijn niet voorbehouden aan grote, abstracte projecten als gezondheidszorg, stedelijke ontwikkeling en smart cities. Het nut kent ook praktische kanten zoals de bestrijding van fraude, bijvoorbeeld op beursniveau wat de Amerikaanse toezichthouder SEC (Securities and Exchange Commission) nu opzet. Maar de praktische mogelijkheden reiken verder, tot aan kleinere en alledaagse zaken als personeelsbeleid, machine-onderhoud en zelfs komkommers.

Zo kan Big Data nuttige inzichten verschaffen aan werkgevers over hoe hun gediversifieerde personeelsbestand het doet. Elke organisatie wil natuurlijk de beste werknemers aantrekken, hebben en belonen. Maar hoe dat te identificeren? Tot op heden is dat voor veel organisaties nogal een analoge kwestie; iets dat wordt overgelaten aan persoonlijke beoordelingen door leidinggevenden en vinkjes op prestatielijstjes. Dat kan beter, dat kan digitaler.

Big Data kan ook veel betekenen voor een traditionele bedrijfsactiviteit als onderhoud. Denk aan onderhoud van machines, zendmasten, wijkcentrales, scheepsonderdelen, vliegtuigcomponenten, en zo nog veel meer. Een grootschalig voorbeeld is hoe vliegtuigfabrikant Lockheed Martin Big Data benut voor de diagnostiek en het onderhoud van F-35 straaljagers. De daar toegepaste principes gaan echter net zo goed op voor gewonere industriële systemen en kleinere zaken als bijvoorbeeld autobanden van bedrijfsauto’s en privéwagens.

Deep learning

En dan is er nog de doodgewone komkommer. Die bestaat eigenlijk niet. De ene komkommer is namelijk de andere niet, zo weet de Japanse kweker Makoto Koike. “Elke komkommer heeft een iets andere kleur, vorm, kwaliteit en versheid”, legt hij uit in een case study van Google over cloud, Big Data en deep learning. En bepaalde komkommers zijn op de markt meer waard dan andere, dus is onderscheid maken en sorteren een bedrijfsnoodzaak.

Makoto is van origine ontwerper van ingebedde systemen in de Japanse auto-industrie, maar hij is vorig jaar een handje gaan helpen op de komkommerboerderij van zijn ouders. Daar ontdekte de ingenieur een databerg: die van alle verschillen in komkommers. De grote hoeveelheid variabelen zorgt voor veel werk in het sorteren van de gekweekte groente. Sorteerwerk dat nogal handwerk was. Dat kon beter, dat kon digitaler, besloot de techneut.

Relatief klein beginnen

Dus begon hij een dataset aan te leggen van zo’n 7000 foto’s van komkommers die op de ouderwetse manier waren gesorteerd. Vervolgens heeft hij die datahoeveelheid ingevoerd in deep learning-software TensorFlow. Google heeft deze software voor het behappen van Big Data eerder dit jaar als open source beschikbaar gesteld.

Makoto heeft daarmee een zelfgebouwd systeem gemaakt om het sorteren automatisch te doen. Hij bereikte daarmee gelijk al relatief hoge succespercentages voor de correcte komkommerherkenning. Dit is echter pas het begin, want de foto’s zijn low-res en de identificatie gebeurt aanvankelijk alleen op vorm, lengte en vervorming. De kleur, textuur, beschadigingen en stekeltjes moeten ook worden meegewogen in de sortering.

Breder, groter, sneller

Komkommers zijn echter slechts één soort product, net zoals deep learning één soort benadering is en TensorFlow één bepaald stuk software daarvoor. MapReduce, Hadoop, NoSQL, MongoDB en vele andere producten en technieken hebben elk hun eigenschappen en dus elk hun specifieke nut. Er zijn vele bomen die het zicht op het bos kunnen belemmeren.

Verder is Big Data veel breder dan komkommers en hoeft het niet per sé – of gelijk – aan deep learning te worden gekoppeld. Naast het grote aantal beschikbare tools en technieken, zijn er ook nog vele verschillende analysemethodes. Hoe vindt u het gewenste goud in de databergen van uw organisatie? Binnen afzienbare tijd, want tijd is een kritieke factor. Welke inzichten en voorspellingen zijn daaruit te putten waarmee uw organisatie de voorsprong kan claimen?

Wie had er een link vermoed tussen Big Data en komkommers?

Meer weten?
Meer informatie over Big Data, volg dan de 4-daagse training Big Data Analytics.

Wij gebruiken cookies om IIR.nl gemakkelijk te maken. Bezoekt u onze website, dan gaat u akkoord met deze cookies meer informatie

De cookie-instellingen op deze website zijn ingesteld op 'toestaan cookies "om u de beste surfervaring mogelijk. Als u doorgaat met deze website te gebruiken zonder het wijzigen van uw cookie-instellingen of u klikt op "Accepteren" hieronder dan bent u akkoord met deze instellingen.

Sluiten