Debatt Brautaset, Jonassen, Bösl og Torheim

På tide å sette av fem prosent av prosjektmidlene til datahåndtering?

Forskningen som gjøres i forbindelse med den pågående pandemien, er et godt eksempel på at god datahåndtering er livsviktig, skriver knonikkforfatterne.

For at forskersamfunnet skal få fullt utbytte av dataene må forskerne sikre at dataene har god kvalitet gjennom gode datahåndteringsrutiner, skriver forfatterne. Bildet er fra Mikrobiologisk avdeling på Rikshospitalet.
Publisert Oppdatert

OBS! Denne artikkelen er mer enn tre år gammel, og kan inneholde utdatert informasjon.

Denne teksten er et debatt­inn­legg. Inn­holdet i teksten uttrykker forfatterens egen mening.

Professor Barend Mons i datainitiativet Go Fair tok i Nature tidligere i år til orde for at forskere bør sette av fem prosent av prosjektmidlene til å sikre at forskningsdataene er gjenbrukbare.

Ut fra erfaringen Senter for digitalt liv Norge har med å bistå forskere med datahåndtering, mener vi forskere må vurdere dette allerede i søknadsprosessen.

Mange forskere forbereder i disse dager søknader til Forskningsrådets søknadsfrister i februar. Forskningsrådet og EU har de siste årene krevd at søkere har en datahåndteringsplan, en såkalt DMP – data management plan.

I planen skal de blant annet beskrive hvilke data de skal samle inn eller generere i prosjektet, hvor de skal lagre dataene i prosjektperioden, hvilke metadata som må tas vare på og valg av dataformater. Hvor de skal lagre dataene etter prosjektets slutt, hvordan de skal gjøre dataene tilgjengelige på en måte som muliggjør gjenbruk og hvem som har ansvar for alt dette i de ulike fasene av prosjektet, må også inngå i planen.

Forskningsrådet formulerer det slik: «Hensikten er å planlegge for hvordan dere skal sikre forskningsdataene, både underveis i prosjektet, og for fremtidig gjenbruk. En datahåndteringsplan er også nyttig for å vise kostnader knyttet til datahåndtering og lagring, og i planleggingen av hvordan dere kan dekke disse kostnadene».

Senter for digitalt liv Norge (DLN) er et nasjonalt senter for bioteknologisk forskning og innovasjon. Innen både bioteknologi, som er vårt fagområde, og flere andre fagområder samles det inn og genereres store mengder data. Standardisert deling av data og muligheten for å reprodusere analyser er helt avgjørende for vitenskapelige framskritt, innovasjon og verdiskaping. For at forskersamfunnet skal få fullt utbytte av dataene må forskerne sikre at dataene har god kvalitet gjennom gode datahåndteringsrutiner.

For forskere over hele verden har det blitt et mål at forskningsdata skal være i tråd med det såkalte FAIR-prinsippet – findable, accessible, interoperable and reusable data. Det vil si at dataene må være søkbare, tilgjengelige og gjenbrukbare. I tillegg må både data og metadata kunne håndteres maskinelt, og forskerne må bruke konsistente vokabular. Forskningen som gjøres i forbindelse med den pågående pandemien, er et godt eksempel på at god datahåndtering er livsviktig.

For forskere over hele verden har det blitt et mål at forskningsdata må være søkbare, tilgjengelige og gjenbrukbare. 

Brautaset, Jonassen, Bõsl og Torheim

DLN har i dag 35 tverrfaglige bioteknologiprosjekter over hele landet og bistår prosjektene med blant annet datahåndtering. Vår erfaring er at prosjektene lager datahåndteringsplanene som både det norske og europeiske forskningsrådet krever, men at det ofte ikke settes av nok ressurser til å følge opp planene på en god nok måte. For noen kommer dette på agendaen først når tidsskriftene etterspør dokumentasjon.

Vi ser at vi kunne gjort en mye mer effektiv og bedre jobb om prosjektene selv hadde lagt til rette for god datahåndtering og satt av nok ressurser allerede i søknadsprosessen. Dette kan innebære å planlegge for at forskerne selv skal bruke tid på datahåndtering underveis i prosjektet, eventuelt med bistand fra eksperter på datahåndtering for å navigere blant alle valgmulighetene de har knyttet til for eksempel hvor de skal lagre dataene og hvordan de skal gjøre dataene tilgjengelige for andre.

Vi mener det er en god investering for forskerne å bruke tid på å lage en god datahåndteringsplan fra starten av. Det kan bidra til at de unngår forsinkelser i prosjektet på et senere stadium. For oss som jobber med prosjektene, er det også en god investering å bistå prosjekter i søknadsprosessen framfor å komme inn på et senere stadium.

Barend Mons i Go Fair International Support and Coordination Office har i flere år fremmet synet om å sette av fem prosent av prosjektmidlene til datahåndtering og skreiv om dette i Nature i februar i år. Han gjentok budskapet da han var hovedinnleder på vår konferanse Digital Life i november.

Mons viser til at, for eksempel stipendiater, kan ende opp med å bruke opptil 80 prosent av tiden sin på å bale med dataene framfor å bruke tiden på å forske dersom de ikke har satt av nok ressurser til datahåndtering. Han peker også på at god datahåndtering og FAIR deling av data er avgjørende for å få mer effektiv kunstig intelligens.

Vi i DLN er helt enige med Mons i at det er viktig å sette av nok midler til datahåndtering, og fem prosent er et godt første estimat. Men det må tas hensyn til at prosjekter er forskjellige, for noen er 5 prosent for mye, for andre for lite – det viktigste er at det settes av nok ressurser ut fra behovet i prosjektet og at forskere jobber etter FAIR-prinsippet.

Både Mons og vi i DLN tror mye data i dag går til spille. Dermed går også skattebetalernes penger til spille, så i bunn og grunn er god datahåndtering et etisk ansvar som bør inngå i god forskningspraksis.

Powered by Labrador CMS