Zo’n 50 onderzoekers kwamen op 29 januari in Amersfoort bij elkaar voor de aftrap van het VWData startimpulsprogramma. Programmaleider Inald Lagendijk gaf aan hoe de uitvraag voor de Nationale Wetenschapsagenda resulteerde in 11700 vragen, die geclusterd zijn in 140 Grote Vragen, die op hun beurt weer in 25 ‘routes’ zijn gecombineerd, en hoe daaruit 8 routes zijn geselecteerd om middels een ‘Startimpuls’ hun bestaansrecht op de kaart te zetten. Programmaleider Inald Lagendijk gaf aan hoe de uitvraag voor de Nationale Wetenschapsagenda resulteerde in 11700 vragen, die geclusterd zijn in 140 Grote Vragen, die op hun beurt weer in 25 ‘routes’ zijn gecombineerd, en hoe daaruit 8 routes zijn geselecteerd om middels een ‘Startimpuls’ hun bestaansrecht op de kaart te zetten.
Relevant voor wetenschap en maatschappij
Het VWData programma, voluit “Verantwoorde Waardecreatie met Big Data”, komt voort uit de Big Data Route. Het programma concentreert zich op twee belangrijke concepten: FAIR (Findable, Accessible , Interoperable, Reusable) data, en FACT (Fair, Accurate, Confidential, Transparent) data science. Een buitengewoon relevant thema: het zal moeilijk zijn om een krant of een journaaluitzending te vinden waarin er niét “iets met data” aan de hand is.
Het programma zal niet alleen goede wetenschap bedrijven om zijn doelen waar te maken. Minstens zo belangrijk is dat ambassadeurs voor FACT en FAIR er voor zorgen dat zowel wetenschap als maatschappij verder bouwen op de VWData inzichten en resultaten. Daarom zal het programma óók contacten leggen met andere routes binnen de Nationale Wetenschapsagenda, maatschappelijke organisaties, nationale en internationale initiatieven linken.

Het VWData startimpulsprogramma bestaat uit verschillende onderzoeksteams. Fotografie: Elodie Burrillon / HUCOPIX

Programmaleider Inald Lagendijk. Fotografie: Elodie Burrillon / HUCOPIX
Juridische, ethische en maatschappelijke vraagstukken
De kick-off startte natuurlijk met het presenteren van de projecten waaruit VWData opgebouwd is. Een korte greep uit die projecten (op de website www.vw-data.nl staat de volledige lijst met projecten en onderwerpen) geeft bijvoorbeeld aan dat bias één van de onderwerpen is: hoe percipiëren nieuwsconsumenten hun filter bubble? En is daar wat tegen te doen? Dicht daarbij ligt het onderwerp hoe je bias in nieuwsberichten zélf kunt opsporen; kun je bijvoorbeeld geautomatiseerd vaststellen hoe het met het diversiteitsgehalte in ons nieuws staat? Of de ‘toxiciteit’ van een bijdrage aan een forum bepalen?

Lora Aroyo presenteert het project ‘Capturing Bias’ Fotografie: Elodie Burrillon / HUCOPIX
Privacy is natuurlijk een ander belangrijk onderwerp. Het duurde niet lang voordat de GDPR genoemd werd, de General Data Protection Regulation die op 25 mei in Nederland van kracht gaat. Bijvoorbeeld bij het project dat netwerkdata wil analyseren – maar dan wél privacy-vriendelijk. Het verzamelen van data is überhaupt iets waarbij privacy altijd een rol speelt, en één van de projecten gaat dan ook expliciet in op de vraag of je daarvoor een ethisch afwegingskader kunt maken.
Opvallende observatie bij een project dat vooral op transparantie ingaat: soms is veel transparantie juist niét gunstig voor het vertrouwen dat gebruikers hebben in de geleverde dienst. Een mooie uitdaging voor het betreffende project…
Tot slot is het natuurlijk de vraag hoe al die data analyses kunnen worden uitgevoerd op zó’n manier dat er niet meer met de data gesleept hoeft te worden dan strikt nodig: van sommige gevoelige data (bijvoorbeeld medisch) wil je niet dat die het ziekenhuis verlaat. Het uitwerken van een aanpak waarbij het algoritme naar de data reist (en niet andersom) is een aanpak daarbij. Er werden mooie nieuwe woorden gebruikt als ‘FAIRification’ en ‘ FACTification’. Als je gedistribueerde data hebt, wil je ook wel weten of je data FAIR zijn. Heb je daar metrieken voor?
Meer dan een verzameling deliverables
Presenteren van de projecten is één; zorgen dat die projecten samen méér worden dan een verzameling deliverables is iets anders. Tijdens de kick-off is er daarom veel ruimte gereserveerd om te brainstormen over ‘overkoepelende demonstrators’ - hoe kunnen we de concepten van Verantwoorde Waardecreatie met Data laten zien op een aansprekende manier? Het zijn de verhalen die VWData gaat vertellen en de discussies die daardoor teweeggebracht worden, die er voor zorgen dat het programma met recht een Startimpuls genoemd kan worden.

Brainstormen over ‘overkoepelende demonstrators’ Fotografie: Elodie Burrillon / HUCOPIX
In een vijftal groepen hebben de aanwezigen de eerste ideeën voor die verhalen geformuleerd. Er kwamen tools voorbij om mensen te helpen echte ‘FACT & FAIR services’ te ontwerpen, marktplaatsen, bijsluiters met stoplicht-indicatoren bij algoritmen, video’s waarin (een deel van) de 11700 vragen worden beantwoord, FACTathons, en nog veel meer. Opvallend was dat enerzijds de ‘schotjes’ tussen de projecten helemaal wegvielen bij de discussie, maar dat de ideeën ook nog wel wat generiek van aard waren.

Pitches over ‘overkoepelende demonstrators’ Fotografie: Elodie Burrillon / HUCOPIX
Op weg naar nieuwe en nóg betere vragen
De kick-off heeft gelukkig meer vragen opgeleverd dan antwoorden: de onderzoekers zullen hier de komende twee jaar hun handen meer dan vol aan hebben. Waarschijnlijk liggen er na die tijd naast een stapeltje antwoorden ook vooral weer nieuwe en nog betere vragen – zoals het een goede startimpuls betaamt!

Getekend verslag vatte de dag samen in een kunstwerk. Fotografie: Elodie Burrillon / HUCOPIX