De Datameesters

boek

Stephen Baker

Steeds meer dagelijkse verrichtingen worden geÔnformatiseerd. Of we de metro nemen, een bankkaart gebruiken of gewoon rondlopen met een gsm op zak, steeds opnieuw laten we een spoor van informatie na. Waardepapieren worden niet meer fysiek geleverd en er is een wetsvoorstel om het maximumbedrag voor contante verrichtingen verder te beperken. Er verschijnen meer en meer camera's in de straten en bijna elke grote winkelketen biedt ons lidkaarten aan waarmee we, in ruil voor een getrouwheidskorting, achteloos onze gegevens laten registreren. Op het internet laten we nog een groter spoor na van bezochte sites, zoektermen en aankopen. Sociale media en mailverkeer geven het netwerk en de intensiteit van onze sociale contacten weer. Elk van die gegevens op zich lijkt misschien onbelangrijk, maar samen bieden ze een steeds duidelijker beeld van ons doen en laten. Moeten we ons meer zorgen beginnen maken over onze privacy? Kunnen we hier nog aan ontsnappen? Stephen Baker bezocht de bedrijven die deze gegevens verzamelen en analyseren. In zijn boek De Datameesters beschrijft hij wat ze er mee doen en hoe ze er geld aan verdienen.

Wanneer je vandaag sommige websites bezoekt wordt jouw profiel vergeleken met duizenden anderen. Op basis van deze analyse brengt men je producten onder de aandacht die je waarschijnlijk zullen interesseren. Dit is op zich niet anders dan hoe het was voor de opkomst van winkelketens toen de kruidenier of de beenhouwer zijn cliŽnteel en hun voorkeuren nog persoonlijk kende en hen nieuwe dingen aanprijsde. Het is alleen maar leuk en nuttig. Maar er wordt ook geŽxperimenteerd met camera's die het traject analyseren die een grootwarenhuisbezoeker aflegt, waarbij een intelligent winkelkarretje chocoladeliefhebbers de kortste weg wijst naar de amandelen die in korting zijn. Kortingen worden dan speciaal afgestemd op specifieke klanten met als doel hen meer te laten kopen. Indien uit de gegevens blijkt dat iemand week na week tussen de Ä 95 en Ä 105 uitgeeft wordt deze persoon geen kortingen meer aangeboden omdat hij of zij waarschijnlijk toch maar een beperkt budget heeft. Klanten die dan weer geen enkele merkgetrouwheid hebben en systematisch het product in de aanbieding kopen worden beschouwd als Ďeendenmosselí. Ze zijn commercieel niet interessant genoeg, krijgen geen geÔndividualiseerde kortingen meer en er wordt zelfs gezocht naar mogelijkheden om deze klanten te Ďontslaaní.

Ook Obama steunde voor zijn kiescampagnes erg op de datameesters. In een massa gegevens wordt naar patronen gezocht die een indicatie geven van bepaalde politieke gevoeligheden. Op basis van deze informatie worden kiezers in groepen opgedeeld zodat de projecten van de kiescampagne per groep kunnen worden uitgelegd in de taal van de kiezer. De gegevens zijn niet meer dan massa's feitjes die niet meer dan oppervlakkig verband houden met politiek. Omdat bijvoorbeeld uit statistische analyse blijkt dat de eigenaars van katten eerder democratisch stemmen en eigenaars van honden eerder republikeins, is de informatie dat u kattenvoer koopt interessant. Hoe meer van deze indirecte kleine indicatoren of Ďproxiesí kunnen bepaald worden, hoe waarschijnlijker de classificatie van de kiezer wordt.

Klassiek marktonderzoek is duur en relatief traag. Maar miljoenen bloggers geven dagelijks gratis over allerlei dingen hun mening te kennen. Computers uitgerust met programma's voor natuurlijke taalherkenning analyseren deze blogs automatisch en maken wiskundige modellen van hun auteurs. De keuze van gebruikte woorden geeft indicaties van de leeftijdscategorie, het opleidingsniveau en waarschijnlijke inkomen van de auteur. Bedrijven laten dan de databanken doorzoeken naar blogs waarop uitspraken over hun producten gedaan werden. Dit geeft hen veel directere en eerlijkere informatie dan dat ze via enquÍtevragen zouden kunnen bekomen. Ook voor sociaalwetenschappelijk onderzoek kan deze informatie bijzonder waardevol zijn.

Al deze voorbeelden hebben het voordeel dat ze een grote foutenmarge toelaten. Zolang er maar globaal meer verkocht wordt maakt het eigenlijk niet veel uit of het model er voor een specifieke klant naast zit. Maar Stephen Baker beschrijft ook experimenteel onderzoek bij IBM waarbij gemeten wordt welke sites een werknemer bezoekt, wie hij mailt, hoeveel meetings hij bijwoont en met wie, tot hoeveel toetsaanslagen per minuut worden ingegeven toe. Dit alles wordt in een model gegoten dat de best presterende werknemers in kaart brengt. Volgens IBM gaat het om een methode om de tevredenheid van de werknemer te verhogen zodat op die manier zijn vermogens optimaal kan inzetten, maar dit doet toch denken aan een nieuwe vorm van Taylorisme. Is het wel juist dat iedereen dezelfde stijl moet hanteren om succesvol te zijn? Zijn de manieren om succes te meten wel objectief en toereikend?

Op zich kan er niets tegen ingebracht worden dat prestaties van werknemers gemeten en beoordeeld worden. Maar men gaat hier uit van een bepaalde hypothese over wat succesvol is en welk gedrag daar toe leidt. De indicatoren die IBM uit de datamining haalt, correleren met succes maar er is geen causaal verband aangetoond. Dit is een belangrijk verschil met de online winkel die promotie maakt voor een extra artikel. Deze gegevensbanken genereren eigenlijk gewoon hypothesen, zoals bijvoorbeeld dat de meeste mannen van dertig jaar die met een Toyota rijden geÔnteresseerd zijn in een Corsica vakantie. De test of de verwachting wel klopt zit in de verkoopcijfers.

Zit de test van het succes van de datameesters voor Obama dan in zijn verkiezing? Dit is al heel wat moeilijker te zeggen omdat er allerlei andere factoren invloed hebben zoals de economie of wie de tegenkandidaat is. De datamining is interessant omdat het wiskundige modellen maakt van ieder van ons en in een enorm aantal parameters onverwachte correlaties vindt. Maar dit is slechts een heuristiek die ons hypothesen oplevert die op hun beurt dan kritisch moeten getest worden. Of een bepaald patroon van gebruik van mails en telefoon leidt tot een succesvolle werknemers is daarbij nog niet aangetoond.

Ook de overheid verzamelt heel wat gegevens over de burgers. Voor een deel is dit slechts het efficiŽnter maken van de bestaande administratie. Een zelfstandige die al jaren beweert verlies te maken maar de ene sportwagen na de andere koopt zal vermoedelijk gecontroleerd worden. Als fraude en fiscale ontduiking beter kunnen opgespoord worden kan men alleen maar hopen dat dit ook toelaat de totale fiscale druk te verminderen en tot een rechtvaardige inning te komen. Dit is gebaseerd op informatie die de overheid ook nu reeds wettelijk toe komt. Iets anders is het wanneer het Amerikaanse National Security Agency alle mogelijke gegevens over burgers begint te verwerken zoals bijvoorbeeld wie met wie telefonisch contact heeft en hoe lang. Zowel de enorme budgetten die voor de NSA vrij gemaakt worden als de geheimhouding van hun activiteiten vinden hun verantwoording in de strijd tegen het terrorisme.

Maar terrorismebestrijding vergt nu net een totaal andere soort van analyse. Bij een klantenprofiel gaat men een individuele klant vergelijken met statistische gegevens over anderen. Men classificeert een profiel, of zoals de datameesters zeggen, men stopt ze in een emmer. Een terrorist daarentegen moet men eerder zien te vinden in de totale groep. Men moet hem bij wijze van spreken uit de emmer kunnen halen. Om een terrorist te vinden moet men normen definiŽren die als 'normaal gedrag' gelden en een alarmbel laten afgaan wanneer een individu hier te veel van afwijkt. De meeste van deze afwijkingen zijn natuurlijk volstrekt aanvaardbaar en het behoort tot de creativiteit en de vrijheid van ieder om zijn leven vorm te geven zoals zij of hij dit wenst. Het is dan ook bedenkelijk dat een systeem regels voor 'normaliteit' lijkt voor te schrijven.

Bovendien wijst Baker er op dat het voor terroristen bijzonder gemakkelijk is om de datameesters te slim af te zijn. In tegenstelling tot de argeloze klant wil de terrorist niet gevonden worden. Het volstaat zelfs dat ze regelmatig trainingen houden binnen het terroristennetwerk door dat in de hoogste graad van paraatheid te brengen en de aanslag op het laatste moment af te blazen. Uiteraard zal de NSA bepaalde patronen in hun data detecteren maar als er daarna niets gebeurt zal het systeem leren deze signalen in de toekomst te negeren. Het is volgens Baker dan ook geen toeval dat Osama Bin Laden gevonden werd met klassiek menselijk inlichtingenwerk en niet via datamining.

Er is een verschil tussen het stellen van een specifieke vraag aan een databank met statistische gegevens en alles proberen te bewaken. Het is zeer moeilijk om een voorspellend model op te zetten voor zeldzame of nog nooit eerder voorgekomen gebeurtenissen. Datamining is veel minder nuttig voor de bestrijding van terrorisme dan men beweert. Indien iemand op sociale media uitdrukking geeft aan een politieke mening, is het dan aan de overheid om dat te bewaken en te analyseren? Wanneer het om extremistische standpunten gaat zou men geneigd zijn te beweren dat de staatsveiligheid hier belang in heeft. Maar wanneer is iets extreem? Heel veel politieke of wetenschappelijke uitspraken waren ooit minstens excentriek. Oproepen tot geweld lijkt een beter criterium maar helaas moet men de berichten eerst volledig analyseren vooraleer men weet of er een oproep tot geweld in voor komt. Serieuze terroristische netwerken zoeken elkaar niet op via sociale media. We moeten opletten dat de politieke kracht van sociale media voor democratische politieke debatten niet verloren gaat door te veel overheidscontrole.

We kennen in BelgiŽ ook al een tijdje het gedeeld medisch dossier waarbij artsen gegevens over de medische historiek van patiŽnten delen. Ook de Algemene Pharmaceutische Bond, de beroepsvereniging van de Belgische apothekers, organiseert nu een gedeeld farmaceutisch dossier. Hiermee kan de apotheker, waar men zich ook aandient, verifiŽren welke medicijnen de patiŽnt reeds gebruikt en oordelen of dit tot schadelijke interacties kan leiden met het voorschrift. Zo kan de apotheker nog beter deskundig advies geven. De nodige maatregelen werden getroffen om deze gegevens niet centraal op te slaan en correct te versleutelen. Het is steeds aan de patiŽnt om zijn pincode te gebruiken om, volgens de principes van patient empowerment, de apotheker die zijn vertrouwen geniet toegang te geven tot zijn persoonlijke gegevens.

Het kost vandaag nog slechts Ä500 en ťťn week tijd om een volledig menselijk genoom te analyseren. Waar men tot nu toe zou kunnen stellen dat onze medicijnen confectie zijn, zou dit met het gebruik van databanken met genetische informatie naar medicatie als maatpakken kunnen evolueren. De levenskwaliteit van vele mensen kan door gebruik van deze technologieŽn opmerkelijk verbeteren. Stephen Baker beschrijft ook onderzoek naar de inrichting van een huis waarbij vrijwel alle gedrag van de bewoners gemeten wordt. Elektronische matten meten hoe stabiel iemand loopt, om hoe laat men opstaat, of men niet vergeet de tanden te poetsen, tot het toiletbezoek toe. Op zich een echt Big Brother huis. Maar een paar keer vergeten de tanden te poetsen kan een kleine indicatie zijn voor beginnende Alzheimer. Wanneer een kritische drempel van deze indicatoren overschreden wordt kan dit systeem een arts verwittigen dat controle wenselijk is. Dit zou wel eens een belangrijk middel kunnen zijn om de stijgende kosten van de ouderenzorg beheersbaar te houden en tegelijkertijd de levenskwaliteit van onze ouderen te verhogen.

Is dit nu niet allemaal ook een gevaarlijke evolutie? Wat indien genetische informatie in handen valt van verzekeringsondernemingen, is men dan nog verzekerbaar? Wil men eigenlijk wel weten dat men een verhoogde kans heeft op een ziekte waarvoor geen preventieve kuur bestaat? Zal het niet zo worden dat onze bejaarden die de Big Brother aanpak aanvaarden korting krijgen op hun levensverzekering? En komt dit er niet eigenlijk op neer dat diegenen die zich niet aan het programma onderwerpen gepenaliseerd zullen worden? En waarom dan stoppen bij bejaarden? Vele ouderdomsziekten zijn immers het resultaat van een volgehouden levensstijl. Dreigt hier gezond leven niet tot een plicht te worden? Anderzijds kan men zich afvragen of men er werkelijk bewust en vrij voor kiest om ongezond te leven.

Verzekeringsondernemingen vragen vandaag ook om medische vragenlijsten getrouw in te vullen. En indien iemand door gebrek aan expertise iets verkeerd noteert riskeert die geen vergoeding te ontvangen op het moment dat het nodig blijkt. Ook al werden de premies jarenlang correct betaald. De meeste verzekeringen kunnen zelfs het contract eenzijdig opzeggen na een ongeval met ernstige, blijvende letsels. Maar dit zijn problemen betreffende de vraag hoe we solidariteit kunnen financieren met privť kapitaal en welke juridische bescherming daaraan gekoppeld dient te worden. Dit is helemaal geen probleem van informatie. Wanneer informatietechnologie tot een beter leven en een betere maatschappij kan leiden dan mag men die kans niet laten liggen.

De principes van democratische vertegenwoordiging, scheiding der machten en beperking van macht in de tijd zijn enorm belangrijk gebleken. Men moet er dan ook blijven over waken dat er geen machtsconcentraties ontstaan door het bezit van informatie. Dit is de moeilijke oefening waar wetgevers voor staan. We willen de sociale, technologische en economische voordelen van de nieuwe technologieŽn wel realiseren maar daarbij geen vrijheid verliezen. Na het Enron-schandaal werd in de Verenigde Staten de Sarbanes-Oxley-wet gestemd om aan de hand van informatica een betere boekhoudkundige controle van beursgenoteerde ondernemingen te bekomen. Dat men nu iets dergelijks zou organiseren voor banken lijkt geen overbodige luxe. Informatisering kan zeker ook veel bijdragen tot een open en rechtvaardige samenleving.

Het stemmen van wetten verloopt veel trager dan de technologie evolueert, waardoor de wetten steeds te laat lijken te komen. Maar dit hoeft geen probleem te zijn omdat wetten niet over technologie moeten gaan. Ze moeten het hebben over informatie, de waarde die dat heeft en de mogelijke schade die ze kan berokkenen. ICT-ers klagen soms dat de regelgeving technisch niet kan geÔmplementeerd worden, zoals bijvoorbeeld het wissen van alle links in netwerkdatabanken. Maar men verbiedt ook de productie van keukenmessen niet omdat de fabrikant niet kan garanderen dat men er niemand mee neersteekt. Men kan misbruik van informatie op zichzelf verbieden. En indien nieuwe technologieŽn noodzakelijk zijn om wettelijk in orde te zijn, zal dit een zeer sterke motivatie zijn voor allerlei marktspelers om dit ook effectief te ontwikkelen. Juristen moeten de mogelijkheden en beperkingen van de informatietechnologie grondig begrijpen zonder de technische details te kennen. Hiervoor is het boek van Baker alvast een goede introductie.


Recensie door Jan De Vylder

Stephen Baker, De Datameesters, Maven Publishing, 2011

Links
mailto:jan.devylder@gmail.com
Share |

De Arabische Revolutie:

tussen droom en werkelijkheid

Op woensdag 5 april 20.00 uur

Afspraak in De Markten (Oude graanmarkt 5, 1000 Brussel) voor een avond met Koert Debeuf,

schrijver, columnist, directeur van het Tahrir Institute for Middle East Policy Europe en onderzoeker aan de Universiteit van Oxford.

Zijn recentste boek is "Inside the Arab Revolution. Three Years on the Front Line of the Arab Spring".

Koert zal gebaseerd op zijn persoonlijke ervaringen de Arabische Revolutie trachten te kaderen door parallellen te trekken met de Franse Revolutie en door een aantal inzichten te bieden in het Midden Oosten.

Uw aanmeldingsmail aan info@liberales.be geldt als inschrijving.

STEUN LIBERALES

Liberales werkt met onbezoldigde vrijwilligers en beperkt haar kosten tot een minimum. Toch hebben wij middelen nodig voor noodzakelijke uitgaven zoals abonnementen voor website en mailverkeer.

Uw steun is welkom op onze bankrekening BE44 3900 2047 5745. Ook kleine bedragen worden gewaardeerd. Vermeld het woord 'steun' als referentie.

Met hartelijke dank

Nieuwsbrief

Schrijf je in voor onze wekelijkse nieuwsbrief

Liberales TV

Contact

Claude Nijs
gsm: +32476 343098
claude@liberales.be