Forskningsdata management

Mængden af forskningsdata vokser eksponentielt i disse år, og evnen til at kunne administrere og udnytte forskningsdata effektivt, er en forudsætning for at indfri DTU’s ambition om at være blandt de fem bedste tekniske universiteter i Europa.

Omverdenen stiller i stigende grad krav til forskningsinstitutionernes evne til at lagre og dele forskningsdata i form af krav til bl.a. åbenhed, datasikkerhed og forskningsintegritet.

Sikker håndtering af forskningsdata, data management, er en forudsætning for forskningens troværdighed og for, at resultaterne kan reproduceres. Data management er relevant i alle faser af et forskningsprojekt: i planlægningen, i selv forskningen og i publiceringen samt ved deling af resultaterne - altså også efter projektets afslutning.

Forskningsdata management dækker forskellige område, blandt andet:

Dataindsamling

En af udfordringerne med at indsamle forskningsdata er, at de kan have meget forskellig karakter alt efter type af forskning stammer fra: observationsdata, eksperimentelle data, simuleringsdata, bearbejdede data osv..

Forskningsdata er ikke kun forskellige af karakter, de har også forskellige formater: tabeller, dokumenter, lyd- og videooptagelser, metoder, algoritmer og software, real-time data, store data, intelligent data og mange, mange flere. Nogle data kan endog være følsomme eller fortrolige og kræver særlig pleje.

Dataopbevaring

De fleste forskere bruger den it-infrastruktur, som deres institution stiller til rådighed til lagring og deling af deres data. Men i nogle tilfælde kan der være behov for særlige løsninger, især når datamængden er meget stor, eller når yderligere sikkerhedsforanstaltninger skal opfyldes. Hyppig og pålidelig backup er afgørende for at sikre mod tab af data.

Datadeling

Forskningsdata er værdifulde ikke kun for forskningsprojektet, men også for andre i det videnskabelige miljø og for samfundet som helhed.

Når forskning er finansieret af offentlige midler, bør de anvendte metoder være tilgængelige og resultaterne bør stilles til rådighed for alle. Deling af data gør det muligt at genbruge resultaterne og stimulere til nye forskningsprojekter.

Datasæt kan offentliggøres i særlige tidsskrifter og repositories og kan - på samme måde som videnskabelige artikler  - anerkendes og citeret og dermed øge synligheden af arbejdet bag.

Dokumentation

Dokumentation af data bliver ofte betragtet som tidskrævende og dyrt. Men dokumentation tilføjer værdi til data og gøre dem brugbare bredere.

Enhver fil eller et hvert datasæt bør indeholde metadata, der beskriver oprindelsen: hvor, hvornår, hvordan og hvem er ophavsmanden. God dokumentation er en forudsætning for at gøre forskningen reproducerbar og opfylder den danske kodeks for Research Integrity.

Langtidsbevaring

Der er stor risiko for data går tabt, når et projekt er færdig eller den forsker, der indsamlede data forlader institutionen. Det betyder spild af tid, penge og viden.

At udvælge hvilke data, som skal bevares i længere tid, og at sikre, at det er læselig og forståelig er en stor udfordring, men også en givende investering.