De datarevolutie: ‘Hoe de data-explosie al onze vragen gaat beantwoorden’

27/06/2013

Enorme stromen gegevens zijn bezig de wereld in razend tempo te veranderen. Het boek ‘De Big Data Revolutie’ laat goed zien hoe het zo gekomen is, wat dat betekent en hoe dit in de toekomst kan uitpakken.

Big Data – een term die de laatste tijd steeds vaker opduikt. Het wordt gebruikt in marketing, in de wetenschap, google doet er van alles mee – Big Data lijkt overal, maar wat is het precies? Zoals met alles wat de potentie heeft een hype te worden, wordt er ook veel onzin gezegd. Viktor Mayer-Schönberger en Kenneth Cukier proberen de onzin opzij te schuiven en eens goed duidelijk te maken wat Big Data echt was, is, en zal worden, in dit zeer goed leesbare boek.

In het eerste hoofdstuk maken de auteurs gelijk één ding goed duidelijk: “Er bestaat geen exacte definitie van big data (…) De term ‘big data’ verwijst naar dingen die je op een grote schaal kunt doen en op kleinere schaal niet mogelijk zijn, en waarmee je nieuwe inzichten verkrijgt of nieuwe vormen van economische waarde creëert op een manier die invloed heeft op (…) markten, organisaties en de relatie tussen burgers en overheden”.

De schrijvers proberen alles, van de geschiedenis tot de toepassingen van big data te behandelen. Zo leer je dat de oorsprong van big data in de sterrenkunde ligt, waar de digitale informatierevolutie zo ongeveer begon. Een telescoop die in 2000 in gebruik werd genomen, had in de eerste weken al meer informatie verzameld dan in de hele eerdere geschiedenis van de astronomie. Een telescoop die in 2016 in bedrijf zal gaan, zal in vijf weken evenveel gegevens verzamelen als de telescoop uit 2000 in tien jaar. Dit is mogelijk geworden door de steeds grotere rekenkracht van computers.

Ook schrijven ze hoe dataverzamelingen al een lange geschiedenis hebben, zoals de volkstellingen. Waar het tellen van alle inwoners van een land op een gegeven moment niet meer mogelijk was, en vervangen werd door een aselecte steekproef, kunnen we met big data weer terug naar het tellen en analyseren van alles.

Dat heeft voordelen, maar tegenover het steeds groter worden van de hoeveelheid gegevens staat een steeds grotere onnauwkeurigheid van die gegevens. Was het bij een kleine steekproef nog van belang om exact te zijn, bij big datasets zijn afwijkende waarden niet zo’n probleem. Meer gegevens levert zelfs meer op dan betere algoritmes, zoals bij automatische vertalingen. De nauwkeurigheid van vertaalsites wordt beter door het uitbreiden van de hoeveelheid woorden in de database, maar nauwelijks door een beter vertaalalgoritme. Tegenwoordig werken vertaalsites niet meer met voorbeeldzinnen, maar vergelijkt Google een zin met bekende vertalingen. Dat daar foute vertalingen bij zitten maakt niet uit – omdat de hoeveelheid vergelijkingsmateriaal zo groot is, is de uitkomst goed genoeg. Meer verdient de voorkeur boven beter.

Veranderde waarneming

De schrijvers denken dat big data zal veranderen hoe we de wereld waarnemen. Dit komt omdat we steeds meer gegevens hebben, doordat we steeds meer aspecten van de wereld in digitale gegevens vertalen: dataficatie. De mens is altijd al bezig geweest met het kwantificeren van de wereld om zich heen, maar dat is met van computers veel makkelijker. Alles wordt omgezet in gegevens: boeken worden niet alleen gescand, maar de woorden worden digitaal (en dus doorzoekbaar) gemaakt; locaties worden gegevens door smartphones; sociale interacties worden gegevens door facebook en twitter.Big Data Boek

En dit is slechts het begin, volgens de schrijvers. Ze geven voorbeelden van manieren om gegevens niet alleen te gebruiken voor hun primaire doel maar te kunnen hergebruiken zodat ze ten gelde gemaakt kunnen worden. Zo gebruikt Google de tijd dat mensen nemen om zoekresultaten bekijken om zoekopdrachten te verbeteren. Gegevens worden zo van steeds grotere waarde, maar omdat ze vaak pas in secundaire toepassingen echt tot economisch gewin leiden is het lastig om ze op waarde te kunnen schatten.

Zo onstaan als gevolg van de big data-revolutie nieuwe bedrijven: bezitters van de gegevens, dataspecialisten die complexe analyses uit kunnen voeren, en bedrijven die helemaal in termen van big data denken. Op de lange termijn kunnen gegevens, en de juiste analyses, steeds vaker de rol van de expert overnemen: een potentieel honkbaltalent wordt niet meer binnengehaald vanwege zijn uitstraling, maar puur vanwege zijn gedataficeerde successen.

De schrijvers onderkennen dat er ook risico’s zitten aan big data. De Oost-Duitse geheime dienst STASI had het in deze tijd een stuk makkelijker gehad om burgers te bespioneren. Ze vragen zich af, als alles om ons heen verzameld wordt, of onze privacy niet in gevaar komt, wat ze illustreren met voorbeelden van bedrijven die geanonimiseerde gegevens van gebruikers hadden vrijgegeven. De bedrijven beweerden dat de gegevens nooit tot één persoon konden worden teruggebracht, maar slimme data-experts hadden dit zo voor elkaar. Ook zouden we in de toekomst mensen kunnen straffen om wat ze van plan zijn te gaan doen. Dat zijn, volgens de schrijvers, harde inbreuken op onze privacy en onze vrije wil.

Een ander risico, wanneer mensen geheel op data gaan vertrouwen, is dat ze niet meer zien wat er écht in de wereld gebeurt. De auteurs waarschuwen dat wij de data moeten controleren voordat big data óns gaan controleren, dat we de ontwikkelingen onder controle moeten houden, voordat de data de loop met óns nemen. Big data werkt op een schaal die ons gewone begrip te boven gaat. Hierdoor zal een nieuwe beroepsgroep ontstaan: algoritmisten. Zij hebben kennis van informatica, wiskunde en statistiek en treden op als controleurs van big data-analyses en voorspellingen.

En die hebben we zeker nodig. In een blik naar de toekomst vatten de schrijvers samen hoe big data ons in de toekomst verder kan helpen. Hun visie op de toekomst is erg positief: “Big data staat op het punt de manier te veranderen waarop we leven, werken en denken. De veranderingen (…) zijn zelfs groter dan die (…) van eerdere baanbrekende innovaties. (…) Een wereldbeeld dat in het teken stond van causaliteit wordt verdrongen door een hegemonie van correlaties.” En dit gaat zo nog een paar pagina’s door.

Misschien hebben ze gelijk

Aanhangers van nieuwe ideeën denken natuurlijk altijd dat juist dát de wereld gaat veranderen, maar misschien hebben de schrijvers van dit boek er gelijk in. Big data heeft de wereld al veranderd, zonder dat we dat zelf doorhadden. En de ontwikkeling die aan het begin van de big data revolutie stond, de steeds betere computers, is nog lang niet op z’n eind.

Samenvattend is dit een duidelijk, overzichtelijk en gestructureerd boek over wat big data was, is, en kan worden. Het leest prettig door de duidelijke opbouw, elk hoofdstuk begint met een voorbeeld van het thema dat behandeld gaat worden. Historische anekdotes: een zeenavigator uit 1839 die logboekgegevens van schepen ging verzamelen zodat schepen efficiënter konden varen als voorbeeld van dataficatie, maar ook vrij recente voorbeelden: de captcha-herkenningsmethode waarmee websites spambots succesvol buiten de deur houden als voorbeeld van het economisch benutten van big data. De schrijvers grijpen regelmatig terug naar dat voorbeeld, waardoor je als lezer alles goed in context kunt plaatsen. Zo word je aan de hand genomen door de complexe onderwerpen.

Met een hype als big data is het onvermijdelijk dat het aantal mensen dat erop inspringt ook talrijk wordt. Vele bedrijfjes, initiatieven en guru’s worden als voorbeelden van toepassingen aangedragen. Daardoor duizelt het je al snel van de namen, bekende als Facebook, Google, Twitter, Amazon, Wallmart, eBay, IBM, Microsoft en Apple, maar ook minder bekende namen als Farecast, Experian, Aviva, Xoom, Kaggle, Inrix, Zynga, Decide.com, FlightCaster, Quantcast, en nog veel meer. Als de schrijvers dan vederop ervan uitgaan dat je nog weet wat dat bedrijfje precies doet, dan raak je als lezer wel eens de draad kwijt. Die namen hadden wel wat minder gekund – of zou er sponsoring in het spel zijn…? Alleen Big Data kan daar het antwoord op geven…

Deze recensie verscheen op wetenschap24.nl

Titel: De Big Data Revolutie – Hoe de data-explosie al onze vragen gaat beantwoorden 
Auteur: Viktor Mayer-Schönberger & Kenneth Cukier
Uitgeverij: MAVEN publishing, 2013
Paperback, 303 pagina’s, 20 euro (e-book 10 euro)
ISBN: 9789490574901

Tags:

Leave a Comment