Forskningsdatamanagement

Mængden af forskningsdata vokser eksponentielt, og evnen til at kunne administrere og udnytte forskningsdata effektivt, er en forudsætning for at indfri DTU’s ambition om at være blandt de fem bedste tekniske universiteter i Europa.

Omverdenen stiller i stigende grad krav til forskningsinstitutionernes evne til at lagre og dele forskningsdata i form af krav til bl.a. åbenhed, datasikkerhed og forskningsintegritet.

Sikker håndtering af forskningsdata, datamanagement, er en forudsætning for forskningens troværdighed og for, at resultaterne kan reproduceres. Datamanagement er relevant i alle faser af et forskningsprojekt: i planlægningen, i indsamling/generering af data og i publiceringen samt ved deling af resultaterne - altså også efter projektets afslutning.

FAIR data

Det er et generelt princip for DTU at forskningsdata skal gøres FAIR. FAIR står for "Findable", "Accessible", "Interoperable" og "Reusable".

Forskningsdata er værdifulde ikke kun for det enkelte forskningsprojekt, men også for andre forskere i det videnskabelige miljø og for samfundet som helhed.

FAIR-principperne er internationalt anerkendte, grundlæggende retningslinjer for, hvordan vi deler vores data meningsfuldt. FAIR-principperne er bl.a. en nøglekomponent Horizon Europe.

Selvom FAIR handler om at guide til meningsfuld deling, betyder FAIR ikke nødvendigvis at al data skal være åben. FAIR kan anvendes i forskellige grader, som strækker sig fra fuldstændig åben, til lukket, men med deling af de beskrivende metadata om forskningsdata. Data skal kunne findes, men ikke nødvendigvis tilgås.

De fire FAIR-principper uddybes af 15 facetter, der beskriver, hvordan du gør dine data FAIR. Helt enkel kan du lave en datamanagementplan, overveje de formater, du bruger til data, sørge for rige metadata og dokumentation, samt at din data publiceres med en "persistent identifier" (DOI) og licens til andres genbrug af data. Metadata, licens og DOI kan bl.a. fås ved at publicere data i DTU's forskningsdata repository, DTU Data.

Du kan læse mere om FAIR principperne på HowToFAIR.dk og i den originale artikel "The FAIR Guiding Principles for scientific data management and stewardship", Wilkinson, M. et al.  Sci Data 3, 160018 (2016). https://www.nature.com/articles/sdata201618

Dataindsamling

En af udfordringerne med at indsamle forskningsdata er, at de kan have meget forskellig karakter alt efter hvilken type af forskning, de stammer fra: observationsdata, eksperimentelle data, simuleringsdata, bearbejdede data osv.

Forskningsdata er ikke kun forskellige af karakter, de har også forskellige formater: tabeller, dokumenter, lyd- og videooptagelser, metoder, algoritmer og software, real-time data, store data, intelligent data og mange, mange flere. Nogle data kan endog være følsomme eller fortrolige og kræver særlig praksisser.

Dataopbevaring

De fleste forskere bruger den it-infrastruktur, som deres institution stiller til rådighed til lagring og deling af deres data. Men i nogle tilfælde kan der være behov for særlige løsninger, især når datamængden er meget stor, eller når yderligere sikkerhedsforanstaltninger skal opfyldes. Hyppig og pålidelig backup er afgørende for at sikre mod tab af data.

Dokumentation

Dokumentation af data bliver ofte betragtet som tidskrævende og dyrt. Men dokumentation tilføjer værdi til data og gøre dem brugbare bredere.

Enhver fil eller et hvert datasæt bør indeholde metadata, der beskriver oprindelsen: hvor, hvornår, hvordan og hvem er ophavsmanden. God dokumentation er en forudsætning for at gøre forskningen reproducerbar og opfylder den danske kodeks for Research Integrity.

Langtidsbevaring

Der er stor risiko for data går tabt, når et projekt er færdig eller den forsker, der indsamlede data forlader institutionen. Det betyder spild af tid, penge og viden.

At udvælge hvilke data, som skal bevares i længere tid, og at sikre, at det er læselig og forståelig er en stor udfordring, men også en givende investering.

 

Politik

DTU’s politik for forskningsdata skal støtte forskere og studerende i beslutninger omkring håndtering af data. Politikken rummer også en definition af begreberne forskningsdata og forskningsdatamanagement (RDM), samt giver klare retningslinjer for, hvordan ansvaret for håndteringen af de forskellige praksisser vedrørende forskningsdata er fordelt mellem dig som forsker, institutledelsen og DTU.

Formålet med politikken er at beskrive, hvordan forskningsdata forvaltes på DTU og derigennem sørge for, at forskningen på DTU er i overensstemmelse med ”Den danske kodeks for integritet i forskningen”.

DTU’s politik for forskningsdatamanagement (pdf)