m
14 SPECTRUM
1
f
j
Sinds 20 februari is Sili
con Valley in Californië
bijna vijftig miljonairs
rijker. Toen werd Whats-
app gekocht door Face-
book voor een recordbe
drag van 19 miljard dol
lar. Waarvoor? Voor de gebruikers,
hun telefoonnummers en chatgedrag.
Kortom voor big data, de verzamel
term voor enorme hoeveelheden digi
tale informatie. Big data lijkt het nieu
we goud. Het komt overal vandaan:
van Google die onze zoektermen
kent, van apps die weten hoeveel we
joggen of eten, van weersatellieten en
van sensoren die de kwaliteit van dij
ken meten. En er komt meer. Wasma
chine, koffiezetapparaat, thermostaat,
auto en mobieltje gaan met elkaar
'praten' om het leven makkelijker te
maken. Maar wat houdt big data eigen
lijk in?
„De drie V's zijn altijd erg helder: vo
lume, velocity (snelheid, red.) en varië
teit", legt Eric van Tol het begrip uit.
Hij is directeur van het Expertisecen
trum Big Data én 'aanjager' van het
overheidsproject Big Data. „Maar nu
zijn het nog te veel data om met de
huidige technologie te verwerken. Al
les dient zich te snel aan. Denk aan
tweets die zo massaal binnenkomen
dat ze niet meer allemaal kunnen wor
den verwerkt. Veel data zijn boven
dien te gevarieerd. Plaatjes, tekst en
cijfers combineren lukt alleen met big
data-technologie."
Grote hoeveelheden informatie waren
er vroeger ook. „Maar het groeit nu ex
ponentieel, omdat we van alles online
doen", zegt Wout Withagen, direc
teur van internetbureau Freshheads.
Daarom begint het in allerlei sectoren
te kriebelen: 'Zoveel data, daar moe
ten we iets mee', wordt gedacht.
Want kijk naar Google en Amazon,
die verdienen veel geld met gerichte
advertenties.
Iedereen ziet big data inmiddels als
toekomstbelofte. Neem de weten
schap. „Data over DNA verdubbelen
elke zes tot acht maanden", illustreert
big data-enthousiast Barend Mons,
hoogleraar biosemantiek aan het
Leids Universitair Medisc h Gentrum.
De hoeveelheid erfelijke informatie is
inmiddels zo ingewikkeld, dat het
zelfs voor heel slimme mensen onmo
gelijk is om daar nog snel iets nieuws
in te ontdekken. „Een computer kan
veel beter omgaan met die complexi
teit en het volume van de wetenschap
pelijke kennis. Dat is een goudmijn
aan ongebruikte kennis", aldus Mons.
Door databases te combineren zou je
bijvoorbeeld sneller kunnen ontdek
ken of een bepaald gen de kans op
kanker verhoogt. Toch blijft de weten
schapper nodig. „Een computer kan
patronen herkennen. Wat je daarmee
kan, is een andere vraag."
Volgens internet-ondernemer Witha
gen profiteren ook consumenten van
big data. Doordat alle postcodes en
adresgegevens in Nederland sinds
2012 openbaar zijn, hoefje bij een
webwinkel alleen postcode en huis
nummer in te voeren, waarna automa
tisch de juiste straat wordt ingevuld.
In België onderzoekt het Vlaams Insti
tuut voor Mobiliteit of boordcompu
ters van auto's kunnen bijdragen aan
bij wegonderhoud. Moeten auto's er
gens een flinke dip verwerken, dan zit
er misschien een gat in het wegdek.
Toch zijn er genoeg critici die big data
niet zo'n hallelujah-verhaal vinden
als velen willen doen geloven. „Het is
een hype", zegt Scott Lusher, direc
teur toegepaste e-wetenschappen van
het Netherlands eScience Center, een
organisatie die wetenschap en big da
ta aan elkaar wil koppelen. Lusher ver
wijst naar de 'levensloopgrafiek' van
nieuwe technologieën. Daarin staat
big data volgens hem op het hoogste
punt met grote beloften en veel inte
resse van het grote publiek. Maar daar
na volgt een 'piek van opgeblazen ver
wachtingen'. Iedereen raakt teleurge
steld en de verwachtingen worden bij
gesteld. Uiteindelijk vindt de techno
logie toch nog waardevolle toepassin
gen. Alleen grote (internet)bedrijven
zitten in die laatste fase nu ze hun big
data gebruiken om advertenties te ver
kopen.
De eerste teleurstellingen over big da
ta zijn er dan ook. In 2009 beweerde
Google dat het griepepidemieën beter
kon voorspellen op basis van zoekter
men die mensen gebruikten dan over
heidsinstellingen. Maar onlangs bleek
dat Google met zijn big data vaak een
twee keer zo grote griepepidemie
voorspelde dan er uiteindelijk was.
„Er zijn limieten aan wat je met data
kan doen", relativeert Jelte Timmer
van het Rathenau Instituut, een orga
nisatie die zich bezighoudt met vraag
stukken op het snijvlak van weten
schap, technologie en samenleving.
Op drie punten ziet Timmer proble
men. Bij het verzamelen van de data,
bij het analyseren ervan en bij het vi
sualiseren. Als voorbeeld noemt hij
Operatie Igloo White uit de Vietnam-
oorlog. De Amerikanen wilden met
sensoren langs junglepaden de bevoor
radingsroutes van de Noord-Vietna-
mezen in kaart brengen en bombarde
ren. De sensoren konden stemmen en
motorgeluid opvangen. „Het systeem
bleek echter niet goed te werken om
dat de Noord-Vietnamezen het mis
leidden. Kortom: je kunt nog zoveel
data hebben, het kan ook onbetrouw
bare informatie zijn."
ata vertegenwoordigen
altijd maar een deel
van de werkelijkheid,
zoals een foto niet de
hele werkelijkheid
weergeeft. Timmer: „Wat zegt een da
taset nu echt? Wat als je zegt in plaats
van een steekproef nemen we nu al
les. Alles van wat? De oorspronkelijke
context gaat snel verloren." Mensen
kijken bovendien met bepaalde veron
derstellingen naar die data, waardoor
echt objectieve analyse onmogelijk is.
Intussen botsen big data-projecten
steeds vaker met de privacy. ING on
dervond dat toen de bank het idee lan
ceerde om betaalgegevens te gebrui
ken om klanten aanbiedingen van der
den te doen. Dat viel zo slecht dat het
plan overhaast werd ingetrokken.
Toen bleek dat de Belastingdienst ken
tekengegevens van parkeergarages ge
bruikte om te controleren of leaserij
ders wel eerlijk het aantal privé-
kilometers invulden, stuitte ook dat
op massaal verzet. Kortom, hoe ver ga
je? Wordt de film Minority Report,
waarin mensen worden gearresteerd
vóórdat ze een misdaad plegen, straks
werkelijkheid? In Chicago ontstond
opschudding over een namenlijst van
de politie met vierhonderd mensen
die volgens berekeningen de fout in
zouden kunnen gaan en allemaal een
waarschuwing hadden gekregen.
Internetdeskundige Withagen vat sa
men: „We gaan de vruchten plukken
van big data, maar er zit een keerzijde
aan. Daar moet je een maatschappelij
ke discussie over voeren. Als je er niet
zorgvuldig mee omgaat, zet dat
kwaad bloed."
De privacydiscussie kan dus het suc
ces van big data bedreigen. Big da
ta-expert Van Tol: „Veel bedrijven
zijn vooral bang voor het verlies van
vertrouwen. Ze moeten een balans
vinden tussen privacy en gemak."
door Freke Remmers
D
-4b
h
reageren?
spectrum@depersdienst.nl