Forskningsdata
47 studenter kunne skrive masteroppgave etter at professoren delte forskningsdata
— Selv om det har vært hinsides frivillig arbeid, har det vært store gevinster, sier professor Kirsti Klette. Nå ønsker en ny utredningsgruppe innspill på hvordan gjøre delingsprosessen enklest mulig for forskere.
Det er skrevet side opp og side ned om åpen forskning de siste årene, men også deling av dataene bak forskningen er et «omforent mål», skrev Forskningsrådsdirektør Mari Sundli Tveit i en kronikk i sommer.
Koronapandemien har med tydelighet vist viktigheten av nettopp deling av data.
Helt siden 2017 har Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata slått fast at forskningsdata skal være så åpne som mulig, men så lukkede som nødvendig.
I oktober kom datalisensutvalgets endelige rapport som utreder spørsmål om rettigheter og lisenser for gjenbruk av forskningsdata.
Utvalget slo tidlig fast at det ikke er lisenser og juridiske spørsmål som først og fremst stikker kjepper i hjulene for mer datadeling. Det dreier seg blant annet om mangel på insentiver, men også prosedyrer for hvordan gjøre det.
— Store gevinster
For per dags dato er det hverken meritterende eller økonomisk gunstig som forsker å bruke tiden sin på å dele forskningsdata. Det vil enten komme på toppen av de allerede 46 timer lange arbeidsukene til de vitenskapelig ansatte, eller komme i veien for andre viktige arbeidsoppgaver.
Kirsti Klette, professor og skoleforsker ved Universitetet i Oslo, har likevel valgt å bruke både masse tid og energi på å dele sine forskningsdata.
Selv om det har vært «sinnsvakt mye jobb» og har hindret Klette i å publisere forskning, så har innsatsen likevel vært verdt det, sier hun.
— Selv om det har vært hinsides frivillig arbeid, har det vært store gevinster. Det har ført til mange store prosjekter med utrolig flinke doktorander hvor vi sammen har drevet forskningsfronten når det gjelder klasseromsforskning. Jeg mener at det å dele data er kjempelurt og ser at det er mye data jeg ikke klarer å analysere på egenhånd, sier Klette.
Ved å dele data fra et prosjekt alene, har hele 47 masteroppgaver blitt til, slår Klette fast.
Videodata ga delingsidé
Det var ganske tilfeldig at Klette for flere år siden satte i gang delingsarbeidet.
Det startet med at et forskningsprosjekt hvor de bestemte seg for å bruke videodokumentasjon som data fra klasserommet.
— Det er en fantastisk måte å få innsikt i detaljerte sider ved læring og undervisning, inkludert prosesser og interaksjon. Før har vi sittet og tatt notater eller krysset av på skjema. Men på denne måten kunne vi ta med materialet tilbake til campus og analysere det nitidig. Det gjorde at vi kunne gjøre langt mer detaljerte og komplekse analyser, vi kunne jo sitte sammen flere forskere og se på videoen samtidig, sier Klette.
Dataene kunne på denne måten brukes både bredt, vidt og til flere formål.
— De var kostnadskrevende å hente inn og i tillegg er det belastende for informantene. At vi dermed kunne bruke videoene til flere formål var vinn-vinn for alle parter. Det gjorde at vi startet å tenke på hvordan vi kunne gjøre disse mer tilgjengelige for flere, sier Klette.
Etter dette startet Klette og kollegaene fra dag én i nye prosjekter å tenke langsiktig bruk av dataene når de skulle innhentes.
— Vi måtte se på hvordan vi kunne ivareta både etikk og personvern. En av de viktigste tingene er å legge inn samtykke-muligheter for gjenbruk og flerbruk av dataene, sier Klette.
Det hele har ført til at 80 forskere i det nordiske senteret for eksellens, Quality in Nordic Teaching (QUINT), hvor Klette er senterleder, nå deler videodata på kryss og tvers av landegrensene gjennom Teaching Learning Video lab.
Utredningsgruppe ønsker innspill
Klette er nå med i en ny gruppe, nedsatt av Direktoratet for høyere utdanning og kompetanse (HK-dir), som er i gang med å utrede hvilke verktøy forskerne trenger for å enklest mulig gjøre sine forskningsdata tilgjengelige og gjenbrukbare.
Gruppen ønsker nå innspill og kommentarer fra forskere på deres foreløpige rapport.
Fagdirektør i HK-dir, Katrine Weisteen Bjerde, leder sekretariatet i gruppen og førsteamanuensis Magnus Aronsen ved Universitetet i Oslo er gruppeleder.
Utredningsarbeidet viser at flere fagdisipliner har kommet langt når det kommer til deling av forskningsdata.
Flere institutter, som Norsk institutt for vannforskning (Niva), Norsk institutt for luftforskning (Nilu), Meterologisk institutt og Havforskningsinstituttet har for eksempel kommet langt, ifølge Bjerde.
— Generelt har humaniora- og samfunnsvitenskapene kommet kortere, da det er mindre tradisjon for deling av forskningsdata der, sier Bjerde.
Det kjenner skoleforsker Klette seg igjen i.
— Det finnes ingen prosedyre eller standarder for dette i humanistiske-og samfunnsvitenskapelige fag. Men den jobben kan gjøres og må gjøres om man skal møte idealet om åpne data. Ellers er dette bare tulleidealer. Får vi det til med videodata, da må det gå i andre fag også, sier Klette.
Ønsker at forskere skal vurdere datadeling ved prosjektstart
Fagdirektør Bjerde og professor Klette er klar på at ikke alle forskningsdata skal deles.
For forskere som driver med kvalitativ forskning vil det i mange tilfeller kunne være umulig å få folk til å stille til for eksempel intervjuer, om det skulle settes krav om deling og gjenbruk av intervjuet i ettertid.
— Målet er få forskergruppene til å diskutere og vurdere ved oppstarten av et prosjekt om dataene fra prosjektet vil være relevant og nyttig for andre i ettertid og hva man da eventuelt må gjøre når det kommer til arkivering, sier Bjerde.
Klette mener en prinsipiell tenkning rundt deling, gjenbruk og flerbruk må inn i prosedyrer og prosjektplanlegging helt fra prosjektoppstart.
— Flere humaniora- og samfunnsfag har lenge argumentert for at det er umulig å dele sine data, basert på dataens unike karakter. Ved nærmere gjennomtenkning tror jeg mange av oss i disse fagene kan gjøre deler av dataene, som for eksempel et tilstrekkelig nivå av metadata, tilgjengelig for andre. Om ikke informantene er villige til å dele noe informasjon fra dataene, så kan det tenkes at intervjuguider, teorier og tilsvarende kan deles, sier Klette.
Kan sette tidsramme for deling
— Om en forsker eller forskergruppe har brukt mye tid og krefter på å hente inn data, så er kanskje ikke det første de ønsker å dele dataen med andre, slik at andre kan drive forskning og publisere på deres data?
— Det kan man løse ved å lage systemer hvor prosjektledelsen og stipendiatene får førsterett til publisering. Man kan sette en tidsramme og om ingen har publisert noe innen et gitt tidspunkt, så kan andre få tilgang til dataene, sier Klette.
— Erfaringen er at de som går i front og deler kan være en av få, men de får likevel «kred» for det, selv om det ikke er like formelt. Men de klarer å bygge grupper rundt seg og finner ut at dersom alle deler får man mye mer å forske på og får mer spennende datasett å jobbe med. Også unge forskere vil vinne på å være del av større miljø som deler data, sier Bjerde.
Både Klette og utredningsleder Aronsen har erfaring med at deling av data både er bærekraftig, da man ikke trenger å hente inn data på nytt hele tiden, at det gir mulighet til å bygge på hverandre, i stedet for å finne opp kruttet på nytt og på nytt, og at det gir mulighet for longitudinell forskning.
Ønsker ikke pengetellekanter
Men alle tre, Aronsen, Bjerde og Klette, er tydelige på at dette tidkrevende arbeidet må meritteres på ulikt vis, dersom man ønsker å komme i mål.
Det er på tide at man går fra ildsjeler til mer systematikk i arbeidet med deling av forskningsdata.
— Dersom vi mener seriøst dette med åpne data må vi verdsette og finne måter å merittere dette viktige arbeidet. Satt litt på spissen føler jeg meg ofte som en «ubetalt forskningsassistent» for at andre skal bruke våre/mine data, sier Klette.
— Må datadeling bli en del av tellekantsystemet?
— Jeg tror ikke pengetellekanter på datadeling er vegen å gå. Det vil være svært ressurskrevende å telle nøyaktig nok til å fordele penger rettferdig. Jeg har mer tro på å følge opp arbeidet som Universitets- og høgskolerådet har frontet, der det jobbes for å gi ledere og komiteer en bredere palett for å vurdere ph.d.-er og forskere. Mye annet enn publisering på nivå 2 må gjelde for ansettelser og opprykk, for eksempel, sier Bjerde.
Utredningsleder Aronsen supplerer:
— En annen måte kunne vært at til ph.d.-innleveringer så kunne man fått uttelling for å dele datasett på samme måte som artikler, at man får en premiering av dataene i seg selv, sier Aronsen.
Ønsker deling inn i langtidsplanen
I tillegg til merittering og premiering, så må det en stor kulturendring til, ifølge Aronsen. Der har institusjonene et stort ansvar, mener han.
— Det er viktig at institusjonene er aktive og lager hverdager som gjør at forskerne får muligheten til å dele forskningsdata. Forskerne må få hjelp til å ta slike avgjørelser og for det trengs opplæring. Det er primært institusjonenes ansvar å sikre gode strukturer for deling av forskningsdata, sier Aronsen. Han legger til:
— Organiserer man dette på en god måte får man lagd kunnskap raskere og gjør den mer tilgjengelig for samfunnet. Målet er gode strukturer for å få utnyttet de store ressursene som forskningsdata er.
Aronsen mener deling av forskningsdata bør få en stor plass i den neste Langtidsplanen for forskning og høyere utdanning som skal legges frem kommende oktober.
— I tillegg kan Forskningsrådet stille betingelser i sine prosjektkontrakter og Kunnskapsdepartementet følge dette opp i sine dialoger med universiteter, høgskoler og institutter, sier Aronsen.
De tre opplever at det nå gjøres mye godt arbeid med datadeling. Forskningsrådet krever for eksempel at alle prosjekter som de finansiere skal vurdere om det skal lages en datahåndteringsplan.
Aronsen er helt tydelig i sin sak:
— Jeg er veldig overbevist om at dette (deling av forskningsdata, journ. anm.) er en svært viktig ting i videreutviklingen av kunnskapssamfunnet.