Universiteit Leiden

nl en

Na het onderzoek

Als het onderzoek is gedaan, is het tijd om het onderzoek naar de buitenwereld te brengen. Hoogstwaarschijnlijk in de vorm van een of meerdere artikelen, maar misschien ook wel in de vorm van publicatie van een dataset. In ieder geval moet de belangrijkste data na het onderzoek volgens de universitaire richtlijn voor 10 jaar opgeslagen worden. Maar welke data is eigenlijk belangrijk?

Selectiecriteria voor data

Sommige data heeft een grote waarde voor andere onderzoekers of de maatschappij, maar bewaren is niet altijd even noodzakelijk. Soms is dit gewoonweg te kostbaar vanwege de grootte en is repliceren goedkoper. In andere gevallen gaat het om gegenereerde data en is het model belangrijker. Stel daarbij de volgende vragen:

  • Is de data uniek (bijvoorbeeld observatiedata)?
  • Zijn de kosten voor replicatie qua geld en kosten erg hoog?
  • Zijn er eisen om de data langdurig op te slaan, bijvoorbeeld vanuit de financier of de journal waarin het onderzoek is gepubliceerd?

Zie ook de hand-out ‘Selection of Data for Archiving’.

Open data

Natuurlijk is het mogelijk om data op te slaan in een kluis op het eigen instituut, maar in sommige gevallen eist een journal of financier openstelling van de data. Dat heeft voor onderzoekers ook voordelen. Door datasets citeerbaar te maken, kan ook dit deel van het onderzoek credits krijgen. Bovendien kunnen toekomstige werkgevers zien hoe goed er met data wordt omgegaan. Daarnaast kan het openen van de data soms zelfs voor veel grotere eigen onderzoeksmogelijkheden zorgen.

Vereiste voor publicatie

Steeds meer journals eisen dat de data onderliggende aan een artikel als open data beschikbaar is gesteld via een data-archief of als 'supplementary materials'. Dit geldt niet alleen voor toptijdschriften als Science en Nature. In sommige gevallen zijn de data zelfs onderdeel van het peer-review. Hou hier tijdens het onderzoek al rekening mee, zodat niemand niet voor een verrassing komt te staan bij het daadwerkelijk publiceren; publiceren gaat immers een stuk vlotter als de data al in het juiste formaat zijn en op de juiste manier zijn beschreven.

Data publiceren

Als wetenschapper haal je het meeste uit je werk door het juiste archief te kiezen en supplementary materials te vermijden: dit zorgt ervoor dat de data betrouwbaar toegankelijk zijn voor in ieder geval de komende 10 jaar, gevonden en geciteerd kunnen worden via een permanente url (zoals de doi) en het vergroot de zichtbaarheid van de onderzoekers, die aan de data hebben gewerkt. Uit diverse onderzoeken blijkt dat artikelen waarbij de data beschikbaar is gesteld vaker geciteerd worden. In de Leiden Research Data Information Sheets is een overzicht te vinden van de belangrijkste archieven en in hoeverre deze voldoen aan de universitaire richtlijn. Een overzicht van bestaande data-archieven per discipline is ook te vinden op www.re3data.org.

Data als publicatie

Bij negatieve resultaten kan het zelfs interessant zijn om alleen de dataset te publiceren; op die manier is duplicatie van het onderzoek te voorkomen en misschien is de data zelf nog bruikbaar in een ander of uitgebreider onderzoek.

De dataset kan nog extra onder de aandacht worden gebracht door hem ook te beschrijven in een datajournal als GigaScience of Scientific Data. Daarin staan de belangrijkste metadata van de set: hoe hij is verzameld en te gebruiken. In sommige gevallen staan ook mogelijke toepassingen vermeld, waardoor een dataset eerder opgepikt wordt door anderen.

Deze website maakt gebruik van cookies. Meer informatie