dinsdag 22 januari 2013

Big-Data: Big-Money of Big-Hype?

Ik heb een computer. Zo'n doodgewone klapdoos met een harde schrijf met ongeveer 250 Gigabytes opslagcapaciteit. Langzamerhand slibt de harde schijf dicht omdat ik gewoon alles opsla wat ik tegenkom. Foto's, filmpjes, emails, muziekfragmenten enzovoorts. Nog erger: ik ben het overzicht kwijt!

Zo moet het internet zich ook zo langzamerhand voelen. Overal liggen gegevens opgeslagen, klaar om tot bruikbare informatie verwerkt te worden. Je hoeft ze alleen maar te koppelen. Dat zegt dan weer iemand op internet. Een onnoemelijke hoeveelheid Petabytes, Exabytes, Zettabytes of Yottabytes. We ontwikkelen een nieuwe hype van een al lang bestaand fenomeen en noemen het: Big Data.

Volgens mij niets meer dan een marketing term, want Big Data bestaat al zo lang als dat er internet is. Nu is het ineens modern. Vooral leuk voor de omliggende bedrijfstakken.
Want natuurlijk moet je een 'Big Data Strategie' ontwikkelen en een moet je 'profiteren van Big Data'. Natuurlijk moet je alle seminars aflopen en workshops bezoeken van bedrijven die je gaan vertellen over de fantastische mogelijkheden van Big Data. Want Big-Data is 'grondstof voor innovatie en groei!' Vooral bij bedrijven die daar 'Big Money' van maken.
Je bent niet meer dan een object met geld, een zak vol euro's, geloof me.


Wat nou, als je er wél wat mee gaat doen? Dat je van die enorme hoeveelheid gegevens aparte datasetjes kunt maken en die gaat verkopen? We hebben het over 2 zettabyte aan gegevens in 2015. Gat in de markt toch? Volgens het IDC en Gartner zullen de verkopen van Big-Data-subsets toenemen. Voor 2016 wordt een omzet van 18 miljard euro verwacht. Mooie cijfers; om van te watertanden...
Maar ja... welk bedrijf gaat al die data opzoeken, ontsluiten, analyseren, rubriceren en verkopen? Wie doet aan Big-Data-Processing? Er zijn al genoeg bedrijven die dit intern doen. Maar commercieel? En dat je dan écht wat te bieden hebt in plaats van een hoop gebakken lucht?
En dan goedkoop als het kan; we blijven Nederlanders.


Eén Apache project met open-source software is Hadoop. Hadoop is 'a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models'.

Er wordt dus serieus werk van gemaakt. Big-Data is nu 'hot' en 'trending'. Net zoals 'alles-in-de-cloud-doen' vorig jaar. Maar zie ik Big-Data volgend jaar rond deze tijd nog terugkomen?
Of blijft het bij een kurkdroge definitie in Wikipedia?

Big Data:  a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications

Wikipedia