Del dine data med andre – om at data skal gøre maksimal nytte

Time.png  Tid

Lektionen forventes at tage ca. 15 min. at gennemføre. Dertil kommer refleksionsøvelserne, som du med stor fordel kan lave sammen med dine medstuderende. 

 

Datahåndtering.png  Om lektionen 'Del dine data med andre – om at data skal gøre maksimal nytte'

I lektionen bliver du præsenteret for, hvorfor det kan være en god idé at dele dine data, når du har afsluttet et projekt eller en opgave. Fortrolige data må du naturligvis ikke dele. Denne lektion handler om at vurdere, hvilke data du må dele, og hvilke du ikke må dele, og desuden vil du lære om, hvordan du kan dele de data, du gerne må dele.

Der vil i denne lektion blive nævnt en række begreber, som kan være nye for dig. Du kan se definitioner af begreberne i ordlisten.

 

COBL_learningoutcome_40x40px_2017_15-2-1.png  Læringsmål

Når du har gennemført lektionen, forventer vi at du kan:

  • vurdere, om det er hensigtsmæssige at dele dine data.
  • vurdere, hvilke rettighedsmæssige spørgsmål, der kan være for dine data.
  • dele dine data i et datarepositorie.

 

kilde.png  Kilde

Lektionen er produceret af Københavns Universitet som en del af Københavns Universitets læringsressourcer til digital dannelse, 2023. 

Fagansvarlige:

  • Lorna Wildgaard, ph.d., specialkonsulent, Københavns Universitetsbibliotek (KUB), Forskerservice
  • Asger Væring Larsen, specialkonsulent, Københavns Universitetsbibliotek (KUB), Forskerservice

__________________________________________________________

 

COBL_videolecture_40x40px_2017_4-1.png  Hvorfor dele data?

Hør en studerende, en vejleder og en forsker fortælle om, hvorfor det er en god idé at dele data.

Hvis du oplever Access Denied, genindlæs da siden. Alternativt skift browser.

__________________________________________________________

 

Literature.png  Deling af data har mange fordele – for samfundet og for den enkelte

Deling af data kan have flere fordele, både for den enkelte og for samfundet som helhed:

Samarbejde i forskningen: Deling af data kan give forskere og andre mulighed for at samarbejde og bygge videre på hinandens arbejde. Når data deles, kan de bruges af andre til at verificere forskningsresultater, foretage yderligere analyser og generere ny indsigt. Dette kan accelerere forskningstempoet og hjælpe med at besvare komplekse videnskabelige spørgsmål hurtigere.

Gennemsigtighed: Deling af data kan fremme gennemsigtighed i forskningen. Når data gøres tilgængelige for andre, kan de granskes og evalueres for nøjagtighed og bias. Dette kan bidrage til at opbygge tillid til forskningsresultater, politikker og beslutninger.

Effektivitet: Deling af data kan forbedre effektiviteten på en række måder. For eksempel kan det reducere behovet for dobbelt dataindsamlingsindsats, da forskere i stedet kan bruge eksisterende datasæt. Det kan også hjælpe med at identificere huller i forskning eller områder, hvor der er behov for yderligere dataindsamling.

Innovation: Deling af data kan stimulere innovation. Delte data kan kombineres og dermed belyse nye forskningsspørgsmål og understøtte udvikling af nye teknologier og applikationer – f.eks. under Corona, hvor forskere delte deres data for hurtigt at kunne udvikle ny medicin og nye behandlingsprogrammer.

Samfundsmæssige fordele: Deling af data kan have samfundsmæssige fordele såsom at forbedre resultaterne for folkesundheden, identificere miljørisici eller fremme social retfærdighed. For eksempel kan data indsamlet fra bærbare enheder bruges til at spore fysisk aktivitet og hjælpe folk med at foretage livsstilsændringer, der forbedrer deres helbred.

Anderkendelse og ejerskab: En forsker, der deler sine data, kan få anerkendelse for det store arbejde, der ligger i at skabe eller indsamle data og dokumentere hele processen. Samtidig kan forskeren sikre sig at blive krediteret for arbejdet og beslutte vilkårene for, hvordan data må genbruges af andre.

__________________________________________________________

 

Literature.png  Deling af data styrker reproducerbarheden af videnskabeligt arbejde

Deling af data kan altså være med til at forbedre reproducerbarheden af ​​eksperimenter, metoder, teorianvendelse og resultater eller fund, hvilket er et vigtigt aspekt af den videnskabelige proces. Netop reproducerbarhed har naturligvis størst betydning i de fag, som benytter sig af empirisk, kvantitativ databehandling og i mindre omfang i de fag, som f.eks. i højere grad bygger på fortolkning af tekster. Men i de fag, hvor man bygger sine resultater på f.eks. statistisk analyse, er det vigtigt at kunne bevise, hvordan man er kommet frem til sine resultater.

__________________________________________________________

 

Literature.png  Hvilke data må du dele – og hvilke må du ikke dele?

Om deling af dine data er en god ide, afhænger selvfølgelig af en konkret vurdering af de data, du har i din opgave eller dit projekt: 

  • Er der tale om persondata, kan du ikke dele data åbent med andre – med mindre du anonymiserer dem først. 
  • Data, der er omfattet af fortrolighedsaftaler, er heller ikke egnede til deling. 
  • Du må heller ikke dele data, som andre har ophavsretten til.

Data, der er omfattet af GDPR, databeskyttelsesloven eller af aftaler med virksomheder eller på anden måde er klassificerede, skal behandles i overensstemmelse med loven eller de indgåede aftaler.

Data, der stammer fra offentlige kilder, f.eks. danske myndigheder eller andre kilder, skal behandles efter deres regler. 

Vurder, om du har ophavsret til dine data. Hvis dit datasæt indeholder faktuelle oplysninger, så er det ikke beskyttet af lov om ophavsret. Hvis du f.eks. indsamler 100 tobaksplanters højde og vægt og opstiller det i en tabel, ja, så er der ingen, der har ophavsretten til de oplysninger – heller ikke dig. Hvis du vælger at lægge tabellen i et datarepositorie, kan andre bruge de data til, hvad de vil, også uden at referere til dig. De data er ikke beskyttet. Det giver dig en frihed til at gøre med data, hvad du vil, men det giver samtidig andre samme frihed.

I andre tilfælde kan data have det, man kalder værkshøjde i ophavsretsmæssig forstand. Det betyder, at der er tale om et "værk", der er beskyttet af ophavsretsloven. I disse tilfælde skal du spørge ophavspersonen, om du må bruge værket, og du skal referere til vedkommende, hvis du anvender værket eller dele af det til offentliggørelse. Det kunne f.eks. være billeder, der har krævet en vis kreativ proces for at blive til. De vil være beskyttet af ophavsretsloven. Men det kan være meget komplekst, og det er klogt at spørge en ophavsretskyndig person, f.eks. fakultetets jurist, hvis du eller din underviser er i tvivl.

De data, du selv indsamler, og som ikke er underlagt love eller aftaler, må du som udgangspunkt gøre med, hvad du vil. 

Når du har vurderet ovenstående og er kommet frem til, at du gerne vil dele dine data, er det næste trin at overveje, hvor og hvordan det er hensigtsmæssigt for dig at dele dine data.

__________________________________________________________

 

Literature.png  Hvor kan du dele dine data?

Når man skal dele data, bruger man typisk et 'datarepositorie'.

Der er et sted på nettet, hvor man kan uploade datafiler og beskrive dem med oplysninger, der er nødvendige for at kunne forstå og genanvende data – også kaldet metadata. Der findes rigtig mange forskellige repositorier at vælge imellem:

  • Institutionelle repositorier er typisk kun for ansatte (og evt. studerende) på et bestemt universitet.
  • Fagspecifikke repositorier indeholder kun data inden for et eller nogle få beslægtede fag – men kan være åbne for alle.
  • 'Catch-all-repositorier' er repositorier, der henvender sig til alle uanset institution, fag eller datatype.

For at vælge det rette repositorie kan du se på www.re3data.org Links to an external site., der er en database over tilgængelige repositorier til data. Her kan du browse eller søge efter repositorier efter de kriterier, du synes er vigtige, f.eks. emne, datatype eller land.

Et meget brugt generelt repositorie er Zenodo Links to an external site.. Det er åbent for alle og gratis.

__________________________________________________________

 

Literature.png  Kend dit repositorie, inden du deler dine data

Før du lægger dine data op i et repositorie, bør du lige studere de betingelser, der kan være for at lægge data op. Det kan hjælpe dig med at beskrive dine data og hjælpe dig med at vurdere repositoriets kvalitet. 

Undersøg som udgangspunkt: 

  • om det koster penge at deponere dine data.
  • om repositoriet kun modtager data fra dit fagområde.
  • hvilke formater data må deponeres i.
  • om der er krav til dokumentation af data.
  • om data kan lægges op, så de er frit tilgængelige (Open Access).
  • om du kan tildele særlige betingelser for, hvordan data må bruges af andre (en såkaldt slutbrugerlicens, der beskriver, hvad man som bruger må gøre med data – typisk Creative Commons Links to an external site.).
  • om dine data får en såkaldt DOI (digital object identifer) eller tilsvarende identifikation. En DOI er en form for CPR-nummer til dit datasæt, og den gør det muligt for andre at referere til dit datasæt, hvis de skriver en artikel, hvor de har brugt dine data.

Dette er nogle gode pejlemærker at gå efter. Derudover bør repositoriet garantere en levetid på mindst 5 år. En god tommelfingerregel er at gå efter repositorier, som er brugt af andre inden for samme fagområde.

NB! Vær opmærksom på, at når du først har lagt dine data op i et repositorie, er det ikke så nemt at få dem slettet igen, hvis du fortryder. Så du skal være sikker på, at data er klar til offentliggørelse, og at du har lov til det.

__________________________________________________________

 

Literature.png  Hvilket format kan du dele dine data i?

Sørg for, at dine data er struktureret på en god måde, så andre kan finde rundt i dem. De skal være beskrevne, så andre kan forstå baggrunden for indsamlingen, indsamlingsmetoden og andre kontekstuelle informationer. Se mere i lektionen 'Beskriv dine data'.

Kvantitative data

Sæt kvantitative data op på en forståelig måde – med data i f.eks. tabelform, og brug let forståelige kolonneoverskrifter. Overvej, om det giver mening at kolonneoverskrifter er på engelsk. Undlad at bruge forkortelser i overskrifterne (skriv f.eks. "koncentration" i stedet for "konc."). Husk at medtage de enheder, der er målt i (f.eks. cm, mol pr. liter eller hertz osv.). Hvis du har brug for at give meget baggrundsinformation, kan du vælge at lave en såkaldt README-fil (se lektionen Gem dine data godt – om at gemme data og finde dem igen). Sådan en fil kan du så gemme sammen med datasættet, sådan at andre kan få den nødvendige information, de har brug for for at vurdere, hvad data indeholder.

Kvalitative data 

Kvalitative data kan bestå af lyd, video eller billeder. Dem kan du analysere på flere forskellige måder, og det er vigtigt at skrive ned, hvordan du har gjort. Det kan du gøre i en README-fil. Især video kan fylde rigtig meget, men de fleste repositorier tillader ganske store filer, så det er ikke nødvendigvis et problem. Af hensyn til tiden, det tager at uploade/downloade filerne, kan det dog være en god ide at komprimere filerne, så de ikke fylder så meget. Det samme med lydfiler: Her kan det være en god ide at gemme filerne i mp3-formatet, der ikke fylder så meget. Hvis lydkvaliteten er meget vigtig, kan man vælge .flac, der er komprimeret, men uden at der mistes information, så lydkvaliteten er meget tæt på den originale.

__________________________________________________________

 

COBL_onlinediscussion_40x40px_2017_6.png  Refleksionsøvelse om deling af dine egne data

Deling eller genbrug af data skal, som beskrevet i lektionen, ske efter grundig overvejelse. Tænk på et datasæt, du har arbejdet med eller indsamlet data til i en tidligere opgave eller på dit studiejob, og reflekter over følgende spørgsmål.

  • Hvad bestod datasættet af, og hvorfor blev dataene indsamlet?
  • Er data egnede til deling?
  • Må du dele dem?
  • Hvilke gode og dårlige ting kan der ske som konsekvens af, at du har delt dine data – selvom de var egnede, og det var lovligt?
  • Hvad ville konsekvensen være for dig, hvis en person fx misbrugte dine delte data eller brugte dem til noget uden for den kontekst, de blev skabt i?
  • Hvilke andre fordele eller ulemper kan du se ved deling af dine data?

__________________________________________________________

 

COBL_onlinediscussion_40x40px_2017_6-1.png  Refleksionsøvelse om at genbruge andres data

Besøg Zenodo Links to an external site., søg eller klik dig frem til et datasæt fra dit fagområde, og kig på de oplysninger, der er registreret for det. Ud over navnet på datasættet er der en lang række forskellige oplysninger, f.eks. om det projekt, som data stammer fra, om selve filerne eller om dem, der har skabt datasættet. Disse oplysninger kaldes metadata. 

  • Hvilke oplysninger finder du?

Se f.eks. på dette datasæt: https://zenodo.org/record/5638170#.Y5HSf4SZNaQ Links to an external site.

  • Kan du få adgang til data?
  • Prøv at downloade Excel-arket (xls-filen).
  • Hvad kan du se af problemer med det datasæt?
  • Er der tilstrækkelig information til, at du kan forstå datasættet?

Prøv så at se på dette datasæt: https://zenodo.org/record/3368583#.Y5HTYISZNaQ Links to an external site.

  • Kig på datasættets metadata.
  • Er datasættet bedre beskrevet i Zenodo end det første?
  • På hvilken måde?
  • Prøv at downloade og se på Excel-filerne.
  • Er de bedre eller dårligere end det første datasæt?
  • På hvilken måde?

__________________________________________________________

 

COBL_fieldtrip_40x40px_2017_8.png  Hvis du vil vide mere

Her finder du en række ressourcer, hvor du på egen hånd kan læse mere mere om deling af data:

Her kan du læse mere om kvalitetskriterier for repositorier:

__________________________________________________________