8. Databevaring

COBL_learningoutcome_40x40px_2017_15.png  Læringsmål

Når du har gennemført denne lektion, vil du være i stand til at: 

  • forklare fordelene ved at bevare data efter projektets afslutning 
  • beskrive, hvad du skal overveje, når du skal beslutte dig for, hvilke data der skal bevares og hvordan
  • lave et udkast til din egen plan for databevaring. 

____________________________________________________________

 

COBL_litterature_40x40px_2017_18.png  Hvorfor bevare data efter dit projekt er slut?

Når du afslutter dit projekt, vil du samtidig have afsluttet din dataindsamling, -behandling og -analyse. Du vil sandsynligvis beskrive dine vigtigste konklusioner i et dokument, såsom en bacheloropgave eller et speciale. Men forskningsdatamanagement slutter ikke, når du har afleveret dit speciale.  Der er et sidste trin i processen: langtidsbevaring (også kaldet "arkivering") af dine digitale data, fysisk materiale og relevant dokumentation. Databevaring omfatter de handlinger, du foretager for at sikre, at dine forskningsdata opbevares, så de forbliver tilgængelige og brugbare i op til flere år efter, dit projekt er afsluttet. Databevaring er vigtig, fordi det vil give dig selv, andre projektmedlemmer og din vejleder mulighed for at genfinde materialet i fremtiden og forstå, hvordan du udførte projektet. Dette kan give viden, der er nyttig for lignende undersøgelser, og måske gøre det muligt at genbruge forskningsdata fra dit projekt i nye projekter. 

____________________________________________________________

 

COBL_litterature_40x40px_2017_18.png  Hvad skal du bevare?

Du behøver ikke nødvendigvis at bevare alt, hvad du har produceret i dit projekt. Du skal beslutte dig for, hvad du vil beholde, og hvad du vil kassere. Du kan f.eks. overveje at beholde:

  • de datasæt, som du baserer konklusionerne i dit speciale på. Måske har du brug for at referere til dem igen i fremtiden, når der opstår spørgsmål til dit speciale?
  • alle data, der kan ende med at danne grundlag for en videnskabelig publikation
  • data, som du vurderer, kan være værdifulde for andre. Måske kan de bruges i et andet projekt?
  • data, der er baseret på sjældne prøver eller eksemplarer. Det er data, der ikke er nemme at genskabe.

Der kan også være data, som du ikke må bevare, f.eks.:

  • Personoplysninger, hvis deltagerne ikke har givet samtykke til, at du opbevarer deres data efter projektets afslutning.
  • Fortrolige data, f.eks. forretningsoplysninger, hvis aftalen med den virksomhed, du har samarbejdet med, kræver datadestruktion eller returnering af dataene til virksomheden.
  • Meget store datafiler eller fysisk materiale, hvis der ikke er tilstrækkelig lagerplads eller finansiering til at opbevare dem.
  • Alt fysisk materiale, hvis kvalitet forringes med tiden, så det ikke kan bruges i nye projekter.

Drøft altid din plan for databevaring med din vejleder. Hvilke data ønsker din vejleder, der skal bevares efter projektets afslutning? Er der krav eller regler for databevaring i din forskningsgruppe, på dit institut eller det sted, hvor du har været i praktik? Er det dyrt at bevare digitale data og materiale, og er der i så fald tilstrækkelige ressourcer til rådighed til at dække disse omkostninger? Begræns ikke jeres drøftelse til digitale data; Tænk også over, hvad du vil gøre med kode og kodebøger, (laboratorie)bøger, eksemplarer, prøver, artefakter og eventuel dokumentation i dit projekt.

____________________________________________________________

 

COBL_litterature_40x40px_2017_18.png  Sådan laver du et udkast til en plan for databevaring

Det er en rigtig god idé at lave en plan for bevaring af de data, materialer og den dokumentation, som du beslutter dig for at beholde efter projektets afslutning. Du kan beskrive din plan i projektets datamanagementplan. Overvej følgende spørgsmål: 

 Hvor skal jeg bevare mine data og materialer?

Hvor du skal bevare dine data efter projektets afslutning afhænger af en række beslutninger:

  • Hvem må få adgang til dataene efter projektets afslutning?
    Er det kun dig, eller skal din vejleder eller andre projektmedlemmer også have adgang? Hvis det er det sidste, skal du opbevare dataene på et sted, der vil være tilgængeligt for andre (og måske dig selv), også når du ikke længere er indskrevet på universitetet. Det kræver, at du flytter dine data, f.eks. fra dit personlige universitetsnetværksdrev (T) til forskningsgruppens fælles netværksdrev. Bemærk dog, at du ikke selv har adgang til dette gruppedrev, når du ikke længere er indskrevet på universitetet.

  • Hvor længe skal dine data bevares?
    Jo længere tid du vil opbevare dine data, jo vigtigere er det at tjekke, om længden af opbevaring kan garanteres. Dit personlige T-drev lukker ned tre måneder efter, at du ikke længere er indskrevet på universitetet, så det er ikke et godt sted at bevare dine data efter projektets afslutning. DeiC Storage (se lektion 6) garanterer 10 års opbevaring, og det kan være tilstrækkeligt til dine data. Hvis du beslutter dig for at uploade dine data til et datarepositorium (se lektion 7), kan du måske også langtidsbevare dine data her. Men tjek datarepositoriets regler for at se, hvor længe dataene bliver opbevaret. Hvis du arbejder med normale data, dvs. ikke personoplysninger eller fortrolige data (se lektion 6), kan du også overveje at opbevare en kopi af dataene på en bærbar harddisk, som du opbevarer derhjemme.

Datarepositorium vs. Dataarkiv 

I lektion 7 blev du præsenteret for konceptet "datarepositorium".  

  • Datarepositorier er elektroniske databaseinfrastrukturer, der kan bruges til opbevaring af afsluttede datasæt, hvor hovedformålet er publicering og deling af data med andre og ikke nødvendigvis langtidsbevaring af data.  

  • Dataarkiver er databaseinfrastrukturer, der også kan bruges til opbevaring af afsluttede datasæt, men hvor hovedformålet er langtidsopbevaring (måske på ubestemt tid) og ikke nødvendigvis deling af data.  

Det afspejles i, hvordan databaserne er oprettet, og hvilke funktioner der tilbydes. Nogle datarepositorier opererer også med en garanteret minimumsopbevaringsperiode (f.eks. 10 år), mens nogle dataarkiver også har funktioner til deling af data. Med andre ord kan du måske også bruge et datarepositorium til langtidsbevaring af dine data. I sidste ende afhænger dit valg af datarepositorium/arkiv af dine behov. Tjek altid datarepositoriernes/dataarkivernes regler for at finde ud af, hvilke services de tilbyder.    

 Hvilket dataformat skal mine data bevares i? 

Noget, du bør overveje, er, hvilket format du vil gemme dine digitale data i. Det kræver bestemt software at åbne visse filformater. Kan du med rimelighed forvente, at softwaren er tilgængelig om 5 år? Hvis svaret er "nej", er det bedst at bevare dataene i et andet format, der kan åbnes og vises på alle operativsystemer ved hjælp af alle former for software ("åbent format").  Gemmer du dine data i et åbent, ukrypteret og ukomprimeret format, vil dine data nemmere kunne anvendes i fremtiden. Hvis det ikke er muligt at gemme dine data i et åbent format, skal du sørge for at angive navnet på den software, der skal bruges for at åbne filen, i projektets dokumentation (f.eks. i en ReadMe-fil, som du gemmer sammen med dine data, se lektion 5).

Her er nogle eksempler på almindelige åbne formater:

Tekst

 

 

  • Almindelig tekst (.txt)
  • Portable Document Format (.pdf)
  • Open Document Format (.odf)

Tabeller, regneark

 

  • Kommaseparerede tabeller (.csv eller .txt)
  • Open document spreadsheet (.ods)

Billeder 

 

 

  • Tag Image File Format (.tiff or .tif)
  • Joint Photographic Experts Group (.jpg)
  • Graphics Interchange Format (.gif)

Lyd

 

  • Waveform Audio File Format (.wav)
  • Free Lossless Audio Codec (.flac)
Video
  • Moving Pictures Expert Group 4 (.mp4)

 Hvilken dokumentation bør følge med dine bevarede data og materialer? 

Langtidsbevaring af data og materiale giver kun mening, hvis du selv og andre kan finde og forstå dem. Sørg derfor for, at dokumentation om indhold af datafiler og fysisk materiale er tilgængelig og let at finde. Sørg for, at:

  • mærke eventuelle fysiske genstande med dato, navn og nøgleord, der beskriver projektet, og med oplysninger om eventuelle tilhørende digitale data
  • give de filer, du gemmer, sigende filnavne
  • bevare oplysninger og metadata, der beskriver, hvordan du har indsamlet og behandlet data og materiale sammen med dataene, f.eks. en projektplan eller -protokol, din datamanagementplan eller en ReadMe-fil
  • fortælle din vejleder, hvor dokumentationen kan findes.

Læs lektion 5 for at få flere tips til datadokumentation.


Eksempel, der viser vigtigheden af korrekt dokumentation for databevaring

Opbevaringen af skelettet af en enorm dinosaur kunne gå ubemærket hen i årtier, fordi knoglerne ikke var blevet katalogiseret, der var ingen optegnelser om dem, og nogle knogler var blevet brugt i andre udstillinger uden angivelse af, at de var del af en helhed. 
Læs historien her  Royal Ontario Museum discovers long-lost dinosaur skeleton in own archives Links to an external site. , City News, Nov 14, 2007.

1024px-Barosaurus_neck.jpeg

Ovenfor: En del af det forsvundne barosaurus-skelet, der blev fundet i arkiverne på Royal Ontario Museum.
Foto: Stacie DaPonte fra Toronto, ON, Canada, CC BY-SA 2.0 Links to an external site., via Wikimedia Commons

____________________________________________________________

 

COBL_videolecture_40x40px_2017_4.png  Databevaring i praksis

Morten Arendt Rasmussen, vejleder på Det Natur- og Biovidenskabelige Fakultet, forklarer, hvilke typer data han mener, der skal bevares efter projektets afslutning. 

Undertekster: Klik på CC-ikonet og vælg sprog
Hvis du oplever Access Denied, genindlæs da siden. Alternativt skift browser.

 

Nicole Schmitt, vejleder ved det Sundhedsvidenskabelige Fakultet, taler om langtidsbevaring af data fra studerendes projekter. 

____________________________________________________________

 

COBL_quiz_40x40px_2017_1.png  Test dig selv

Tjek, om du har fået fat i hovedpunkterne i denne lektion:

Quiz: Databevaring

____________________________________________________________

 

COBL_tasks_40x40px_2017_10.png  Færdiggør din DMP

Færdiggør din datamanagementplan (DMP) ved at udfylde de sidste spørgsmål i afsnit 8. Databevaring:

 

8.a Beskriv, hvilke data/hvilket materiale/hvilken projektdokumentation der skal opbevares efter projektets afslutning.

8.b Beskriv, hvor dataene/materialet/projektdokumentationen skal opbevares efter projektets afslutning, og hvordan det sikres, at en kopi af dataene er tilgængelig for din(e) vejleder(e).

 

Hvis du ikke er begyndt at udfylde din DMP endnu, kan du finde DMP-skabelonen her: KU DMP Skabelon for Studerende Download KU DMP Skabelon for Studerende

Husk, at drøfte datamanagementplanen med din vejleder i starten af dit projekt. Opbevar DMP'en sammen med dine data.

____________________________________________________________

 

COBL_sparks_40x40px_2017_19.png  Praktiske tips til langtidsbevaring af data

  1. Start altid med at tjekke, om der er nogen regler for bevaring og kassation af dine data. Du kan finde nogle tips til, hvor du finder sådanne regler, nedenfor. 

  2. Tjek KU's generelle regler for databevaring i KU's Politik for Forskningsdatamanagement. Ifølge politikken skal der eksempelvis opbevares en kopi af alle digitale datasæt, der ligger til grund for forskningspublikationer på KU, i mindst 5 år efter den seneste dato for enten projektets afslutning eller udgivelsen. Bacheloropgaver og specialer betragtes ikke altid som forskningspublikationer. Vi anbefaler dog, at du som udgangspunkt bevarer en kopi af de data, der ligger til grund for de resultater, der præsenteres i din bacheloropgave og dit speciale, i mindst 5 år efter afslutningen af dit projekt, medmindre andet angives af din vejleder.

  3. Hvis du arbejder med personoplysninger, skal du tjekke retningslinjerne for bevaring af personoplysninger på din uddannelses studieinformationsside under Planlæg dit studie > Regler og dispensationer > Sådan indsamler og håndterer du persondata.

  4. Hvis der er indgået en aftale i dit projekt, f.eks. fordi du samarbejder med en virksomhed, skal du tjekke aftalens vilkår og betingelser for databevaring.

  5. Beslut dig for, hvilken it-infrastruktur du vil bruge til langtidsbevaring af dine digitale data. Her er nogle forslag til data, der klassificeres som normale data (se lektion 5), hvor det er tilstrækkeligt, at dataene opbevares i maksimalt 10 år efter projektets afslutning:

 

KU's Gruppedrev

DeiC Storage

Et datarepositorium (se lektion 7)

Du skal have adgang til dataene, når du ikke længere er indskrevet på universitetet

Ikke egnet

Egnet

Egnet*

Andre KU-studerende/-ansatte skal have adgang

Egnet

Egnet

Egnet*

Der skal kunne gives adgang til eksterne

Ikke egnet

Egnet

Egnet*

* Du skal stadig tjekke betingelserne for det repositorium, du vælger, for at sikre, at dataene eksempelvis opbevares i mindst 5 år.

Bemærk, at du skal bruge andre løsninger til personoplysninger og fortrolige data. Det kan også være nødvendigt at bruge andre løsninger til data, der er klassificeret som normale data, f.eks. når der er tale om meget store datamængder, bestemte filformater eller andre specifikke krav. Endelig kan forskningsgrupper have deres egne databaser til langtidsbevaring af data. Spørg altid din vejleder først og kontakt KU-IT, hvis du har brug for hjælp.

  1. Opbevar dine digitale data sammen med en ReadMe-fil, der forklarer dataene. Her er en skabelon, som du kan bruge: ReadMe skabelon Download ReadMe skabelon

  2. Slå forskningsdatamanagement-termer op i RDM-ordliste.

____________________________________________________________

Publiceret i 2024