Hoe de data-explosie al onze vragen gaat beantwoorden

De big data revolutie

14 november 2014
In dit artikel:

We leven in een maatschappij die steeds verder digitaliseert, niet het minst door de opkomst van social media en het gebruik van mobiele apparaten.

Het gevolg is een enorme groei aan data die wordt gegenereerd en vastgelegd. Deze groei is volgens de auteurs Viktor Mayer-Schönberger en Kenneth Cukier zodanig extreem groot dat we met elkaar de laatste twee jaar meer data hebben gegenereerd dan de 2000 jaar ervoor.

Volgens de auteurs bevinden we ons dan ook in een ‘big data revolutie’ die zij in hun boek nader uiteenzetten.


9200000010167596DE BIG DATA REVOLUTIE; HOE DE
DATA-EXPLOSIE AL ONZE VRAGEN GAAT BEANTWOORDEN

VIKTOR MAYER-SCHÖNBERGER EN KENNETH CUKIER
ISBN: 9789490574901


Het eerste hoofdstuk (titel: ‘Nu’) van het boek vormt zowel een inleiding als samenvatting van het onderwerp. De auteurs leggen uit hoe de ‘big data revolutie’ is ontstaan, wat de omvang is en zij geven hun visie hierop. Deze visie luidt: ‘big data’ verwijst naar dingen die je op een grote schaal kunt doen en die op kleinere schaal niet mogelijk zijn en waarmee je nieuwe inzichten verkrijgt of nieuwe vormen van economische waarden creëert op een manier die invloed heeft op andere markten, organisaties en de relatie tussen burgers en overheden. De visie wordt in de overige hoofdstukken van het boek nader uitgelegd. Titels van deze hoofdstukken zijn: Meer, Rommeligheid, Correlaties, Dataficatie, Economische waarde, Gevolgen, Risico’s, Controle en Straks.

Een paar voor onze beroepsgroep interessante zaken laat ik hier kort de revue passeren.

In het hoofdstuk ‘Meer’ wordt overtuigend beschreven en statistisch onderbouwd dat als gevolg van de beschikbaarheid van zowel ‘big data’ als rekenkracht de traditionele aanpak van onderzoeken door middel van steekproeven tot het verleden kan behoren.

In aansluiting hierop wordt in het hoofdstuk ‘Rommeligheid’ uitgelegd dat ‘big data’-gegevensverzamelingen meer vervuiling (kunnen) bevatten, maar dat dit altijd opweegt tegen de voordelen van dergelijke enorm grote gegevensverzamelingen. Kwantiteit weegt dus op tegen kwaliteit. Onderzoek op dergelijke verzamelingen heeft evenwel een grote impact op de traditionele wijze waarop wiskundigen, verzekeringsexperts, accountants maar ook onze beroepsgroep gegevens verzamelen, vastleggen en beheren.

Big Data is een goudmijn

Zoals de titels al doen vermoeden zijn ook de hoofdstukken ‘Economische waarde’, ‘Risico’s’ en ‘Controle’ relevant voor ons als IT-auditors en deze geven dan ook stof tot nadenken. Wat bepaalt nu de werkelijke waarde van bedrijven als Google en Facebook? Wat draagt hun ‘big data’ hieraan bij? Overheden verzamelen geautoriseerd enorme hoeveelheden gegevens over mensen voor taken die aan overheden zijn toegekend. Hoe weten we dat deze gegevens niet als bron gaan dienen voor andere, meer discutabele en/of commerciële op deze ‘big data’ gebaseerde toepassingen? Hoe gaan we om met het risico dat we te veel vertrouwen stellen in de uitkomst van ‘big data-analyses’?

Belangrijke conclusie van de auteurs is dat ‘big data’ een goudmijn is. De waarde van de goudmijn wordt echter in grote mate bepaald door de moeite die ervoor nodig is om het goud uit de mijn te kunnen winnen.

Vertaald naar ‘big data’ betekent dit dat de mogelijkheden enorm zijn. Voor het ontsluiten ervan zijn echter enorme aantallen, zeer lastige wiskundige rekenmodellen nodig. Dit is volgens de auteurs lonend voor bedrijven die er duidelijk voor hebben gekozen de strategische doelstelling meerwaarde te halen uit ‘big-data’, in te voeren in hun primaire bedrijfsprocessen. Verschillende voorbeelden illustreren dat niet alleen grote en gerenommeerde bedrijven hierin succesvol zijn.

In het geheel genomen wordt de visie op ‘big data’ op een vlotte en aantrekkelijke manier uitgewerkt waarbij goede, aansprekende voorbeelden worden gebruikt. Kortom een absolute aanrader!

Ing. J. (Hans) C.L. Kramer RE

Hans Kramer heeft gedurende dertien jaar de functie van zowel in- als extern IT-auditor uitgeoefend. Sinds oktober 2012 is Hans Manager Datacentre High Availability Infrastructure & Application Operations met als belangrijkste klant de afdeling Asset Optimisation & Trade van energieleverancier Vattenfall.