Wat begon als het af en toe aankopen van een dataset en een helpende hand bij het werken met die data, is uitgegroeid tot een heus team van dataspecialisten. Dit jaar viert het Erasmus Data Service Centre van de Universiteitsbibliotheek haar tienjarig bestaan.
Toen data librarian Paul Plaatsman tien jaar geleden begon met het Erasmus Data Service Centre (EDSC) verwachtte hij niet dat de afdeling tien jaar later nog steeds nodig zou zijn. “Het belang van kwantitatieve analyses in de wetenschap is sterk toegenomen”, vertelt hij.
Goede interfaces

Zijn EDSC begon met de aankoop van ingewikkelde datasets, iets wat de universiteitsbibliotheek al deed, maar waar ook steeds meer ondersteuning bij nodig was. Sindsdien geven Plaatsman en de vier andere dataspecialisten workshops en individuele begeleiding aan studenten en onderzoekers die met ingewikkelde datasets werken. En dat blijft nodig, zegt hij. “Als er goede interfaces zouden zijn, zou ons werk niet nodig zijn.”
“Maar eigenlijk wordt het werken met grote datasets steeds ingewikkelder.” Plaatsman wijst bijvoorbeeld naar de Bloomberg terminals, computersystemen waar allerlei realtime financiële gegevens op te vinden zijn en waarvan het EDSC er tien exemplaren heeft staan. “Daar zijn aangepaste toetsenborden met allerlei kleurtjes voor nodig om met alle verschillende soorten gegevens om te kunnen gaan.”
Vingerafdruk
Een van de dingen waar Plaatsman het meest trots op is, is de toegang tot CBS microdata. Dat is geanonimiseerde data op bedrijfs-, organisatie-, of persoonsniveau, ‘een goudmijn voor wetenschappers’. Aan het gebruik van die microdata zijn allerlei strenge eisen verbonden. Zo tekent een onderzoeker een contract met het CBS, moet hij ieder half uur inloggen met een vingerafdruk en mag het scherm niet zichtbaar zijn voor anderen. “Ik heb jaren moeten knokken om het vertrouwen van het CBS te krijgen zodat we daar op de universiteit mee mogen werken.”
Workshops
“95 procent van wat wij doen is voor studenten”, vertelt Plaatsman. Het EDSC verzorgt vooral workshops om uit te leggen hoe zij met datasets kunnen werken. “Wat is er beschikbaar? Hoe kun je dat vinden? Hoe kun je datasets samenvoegen? Het uitleggen van analyses en methoden laten we wel aan docenten over, maar voor alle andere vragen kunnen studenten bij ons terecht.”
Lange tijd waren veel van de workshops ad hoc, zegt Plaatsman. Maar het krijgt steeds meer een structurele plek binnen het onderwijs. “Vorig jaar hebben we zo’n 30 workshops voor in totaal 600 studenten gegeven, maar in januari stond ik zelfs al een keer in de aula voor een groep van 350 studenten.”
Om het tienjarige jubileum te vieren, organiseert het EDSC op donderdag 9 juni een symposium voor wetenschappers. In het najaar vindt de EDSC Student Challenge plaats, waarbij studenten hun vaardigheden op het gebied van financiële data kunnen tonen.