7. Åben deling af data
Learning objectives
Når du har gennemført denne lektion, vil du være i stand til at:
- forklare, hvordan det gavner både dig og andre, når du deler data
- forklare, hvad "åbne data" er
- beskrive, hvordan du deler dine projektdata i din datamanagementplan.
____________________________________________________________
Hvad er deling af data?
Datadeling er, når du giver andre adgang til at bruge dine data, din kode, dine protokoller, din dokumentation og lignende. Datadeling kan forekomme inden for organisationer, mellem forskellige organisationer eller mellem enkeltpersoner. I lektion 6 behandlede vi lagringsværktøjer til deling af aktive data med projektmedlemmer, mens projektet er i gang (i et samarbejde). I denne lektion vil vi fokusere på deling af færdige datasæt ved at uploade disse datasæt til datalagre for at gøre dem åbent tilgængelige for andre. Det kaldes også datapublicering.
Før vi dykker ned i, hvorfor det er vigtigt, og hvad du bør overveje, når du deler data, vil vi præsentere dig for nogle nøglebegreber:
Datarepositorium
Et datarepositorium er et datalager, hvor forskere og studerende kan deponere (uploade) digitale datasæt og andre digitale forskningsobjekter samt metadata tilknyttet deres projekt med henblik på at dele data med andre.
Åbne data
Åbne data, også kaldet offentlige data, er forskningsdata med gratis, ubegrænset online adgang. For åbent at dele dine data deponerer du dem typisk i datarepositorier uden at sætte begrænsninger eller stille betingelser for dataadgang. Det betyder, at andre blot kan downloade en kopi af dit datasæt uden først at bede om din tilladelse.
Persistente identifikatorer (PID'er)
En persistent identifikator (PID) er et vedvarende, ubrydeligt internetlink til materiale såsom et dokument, datasæt, en internetside, software eller en forskningsartikel. Når du uploader dine data til et datarepositorium, vil repositoriet i mange tilfælde oprette en persistent identifikator til dine datasæt. Den mest almindelige persistente identifikator til artikler og datasæt er en digital objektidentifikator (DOI).
Datalicens
En datalicens er en juridisk tekst, der specificerer vilkår og betingelser for andres genbrug af datasæt. Hvis du f.eks. ønsker, at andre skal citere dig, når de bruger dine data, skal du vedhæfte en licens, der angiver, at du ønsker at blive citeret, f.eks. en CC-BY-licens. Du kan i mange tilfælde vælge mellem forskellige licenstyper, når du uploader dine data til et datarepositorium.
____________________________________________________________
Hvorfor skal du dele dataene fra dit projekt?
I videoen nedenfor kan du se, hvorfor du bør overveje at dele dine data.
Undertekster: Klik på CC-ikonet og vælg sprog
Hvis du oplever Access Denied, genindlæs da siden. Alternativt skift browser..
Når du deler data i repositorier:
- betyder det, at dit arbejde kan bidrage til andre projekter og reducere dobbeltarbejde
- giver du andre mulighed for at validere og bygge videre på dit arbejde
- kræver det, at du præsenterer dine data på en organiseret og velbeskrevet måde, så andre (herunder du selv i fremtiden) kan forstå, hvad dataene viser, og hvordan du har indsamlet, analyseret og behandlet dataene
- kan du bevare data efter projektets afslutning og sikre, at dataene forbliver tilgængelige for dig fremover (se lektion 8).
____________________________________________________________
Hvad skal man dele?
Før du deler dine data via et datarepositorium, skal du undersøge, om du rent faktisk har lov til det. I nogle tilfælde er datadeling forbudt, mens det i andre tilfælde er påkrævet. Her er nogle eksempler:
- Hvis du arbejder med personoplysninger, skal du beskytte privatlivets fred for de personer, du har fået dataene fra. I de fleste tilfælde må du ikke dele personoplysninger, og du skal derfor destruere dataene, når dit projekt er slut. Du kan kun dele data åbent ved hjælp af datarepositorier, hvis dataene er fuldstændigt anonymiserede (det er ikke længere muligt at identificere personerne). I nogle meget specifikke tilfælde kan du dele personoplysninger i ikke-anonymiseret form, hvis deltagerne i din undersøgelse har givet informeret samtykke til dette, men i sådanne tilfælde bør der også være indgået en juridisk aftale (en datadelingsaftale), og du bør bruge en sikker infrastruktur (lektion 6) til at dele dataene i stedet for et datarepositorium.
- Hvis du har genereret dataene i samarbejde med eksterne parter, f.eks. forskere fra andre universiteter eller virksomheder, skal du afgøre, hvem der har rettighederne til dataene, og om dataene må deles. Dette er ofte beskrevet i en aftale indgået med den eksterne part.
- Hvis dine resultater er baseret på eksisterende data indhentet fra dataudbydere, f.eks. Danmarks Statistik eller Rigsarkivet, er det usandsynligt, at du må videregive disse data til andre. Du bør undersøge dataudbydernes politik.
- Hvis du planlægger at publicere resultater i en tidsskriftsartikel, skal du tjekke udgiverens politik. Udgivere kræver i stigende grad, at datasæt, der er knyttet til en forskningsartikel, deles ved hjælp af datarepositorier.
! VIGTIGT Tal altid med din vejleder, før du beslutter dig for: 1) om dataene må deles eller ej 2) om de data, du ønsker at dele, kan gøres åbent tilgængelige via et repositorium eller skal deles via mere restriktive delingsmetoder.
|
Du kan f.eks. beslutte, at dine data skal bevares internt på KU og kun deles fra person til person efter anmodning (se lektion 8. Databevaring ).
Resten af denne lektion omhandler kun situationer, hvor data må deles åbent via et datarepositorium.
____________________________________________________________
Hvordan deler du åbent dataene fra dit projekt?
Når du har fået bekræftet, at du må dele dine data åbent, skal du beslutte dig for den bedste måde at gøre det på.
Nedenfor er nogle tips, du kan overveje:
Undersøg, hvilket datarepositorium du vil bruge |
|
Generelt er der tre forskellige typer repositorier.
Det kan være kompliceret at vælge et repositorium til datadeling. Her er en liste over overvejelser, der kan gøre det nemmere for dig at vælge:
|
|
Sørg for at inkludere dokumentation og metadata |
|
Det giver ikke mening at dele datasæt, som ingen kan forstå. Derfor er det vigtigt, at der inkluderes en beskrivelse af dataene i repositoriet. Det kan du gøre på to måder. Ved at uploade dokumenter, der beskriver dataene, sammen med datasættet Udover at uploade en ReadMe-fil kan du også overveje at uploade andre relevante oplysninger, der kan give dataene kontekst, såsom en projektbeskrivelse, en protokol, en spørgevejledning, en litteraturliste, PowerPoint-slides, der præsenterer dit projekt osv. Ved at udfylde oplysninger om datasættet i uploadformularen |
|
Få en persistent identifikator til dine data |
|
Mange repositorier opretter en persistent identifikator til dit datasæt, når du uploader dine data. Identifikatorerne er vedvarende links til dine data, og et eksempel er en DOI, en digital objektidentifikator. Persistente identifikatorer er vigtige af forskellige årsager. Først og fremmest kan du (og andre) ligesom med tidsskriftsartikler bruge den persistente identifikator til at citere dine data, for eksempel når du vil henvise til dine data i dit speciale, på din hjemmeside eller i en tidsskriftsartikel. Du kopierer blot den persistente identifikator, som repositoriet har genereret for dig, og tilføjer den som reference til dit citat. Her er eksempler på, hvordan et citat fra et datasæt kan se ud: Clarke, Harry (2022). A provisional checklist of European butterfly larval foodplants [Datasæt]. Dryad. https://doi.org/10.5061/dryad.6hdr7sr35 Links to an external site. Meyers, Charlène, 2022, "Transcription of 20 sight translations by translation students coded with voiced pauses and silent pauses", https://doi.org/10.34934/DVN/KHQE0P Links to an external site., Social Sciences and Digital Humanities Archive – SODHA, V1 For det andet vil den persistente identifikator gøre det meget nemmere for andre at finde og tilgå dine data. De kan blot klikke på den persistente identifikator fra et hvilket som helst onlinedokument eller en hvilken som helst hjemmeside, der citerer fra dataene, og det vil føre dem direkte til dit datasæt i repositoriet. |
|
Medtag oplysninger om, hvordan dine data kan genbruges af andre |
|
Et sidste skridt, du skal tage, når du deler dine data åbent, er at fortælle, hvordan andre kan genbruge dine data. Kan andre gøre, hvad de vil med dataene? Eller er der begrænsninger? Kan dataene f.eks. bruges til kommercielle formål? Og vil du have andre til at citere dine data, når de genbruger dem? Tal med din vejleder og beslut sammen, om der skal være nogen krav til genbrug. Du kan fortælle på forskellige måder, hvordan dine data må genbruges. Først og fremmest kan du blot beskrive dine krav i enhver dokumentation, du uploader sammen med datasættet (f.eks. ReadMe-filen) eller i de metadata, som repositoriet beder dig om at udfylde. Alternativt kan du bruge en licens til at beskrive dine betingelser.
Mere om licenser til genbrug Creative Commons-licenserne er den mest almindelige form for generiske licenser. Creative Commons-licenserne omfatter syv forskellige licenser, som du kan kombinere for præcist at definere, hvordan andre må bruge og dele dine data. Du kan bestemme, om og hvordan brugerne skal citere dig, når de bruger dataene, om dataene må bruges til kommercielle formål, eller om dataene på nogen måde må ændres eller tilpasses. Der findes også typespecifikke licenser. GNU-licenser er for eksempel til software og andre typer praktiske værker, såsom programmer, mens Unsplash-licenser er til fotografier, der frit kan deles. Når du vælger en licens og deler data og materialer, skal du sikre dig, at du har rettighederne til dataene. Det er kun rettighedshaveren, der kan give licens til dataene. Når du har givet licens til dine data, kan du ikke tilbagekalde licensen. ! VIGTIGT Bemærk, at licenser går begge veje. Licenser kan ikke kun bruges af dig til at fortælle, hvordan andre må bruge dine data. Det er også meget vigtigt, at du tjekker, om der er licenser tilknyttet eksisterende data, som du selv ønsker at bruge i dit projekt. Se lektion 3. Krav, rettigheder og ansvar. |
___________________________________________________________
Beslutningstræ for datadeling
Se beslutningstræet nedenfor. Det kan hjælpe dig med at beslutte, hvornår og hvordan du vil dele dine data. Du kan downloade det her Download her.
____________________________________________________________
Datadeling i praksis
Morten Arendt Rasmussen, vejleder ved Det Natur- og Biovidenskabelige Fakultet, forklarer, hvordan studerende kan dele rådata og kode ved hjælp af enten universitetets repositorier eller eksterne data- og kodedelingstjenester.
____________________________________________________________
Test dig selv
Tjek, om du har fået fat i hovedpunkterne i denne lektion:
____________________________________________________________
Arbejd videre på din DMP
Fortsæt med at arbejde på din datamanagementplan (DMP) ved at udfylde de sidste spørgsmål i afsnit 7. Deling af data.
7.a Skal nogle af dataene/materialet i projektet deles åbent med andre?
Hvis ja, beskriv hvilke datasæt.
7.b Hvis ja, hvordan skal dataene/materialet så deles åbent? Overvej, hvilket repositorium du forventer at bruge, og hvilken dokumentation der skal sendes sammen med dataene/materialet.
Hvis du ikke er begyndt at udfylde din DMP endnu, kan du finde DMP-skabelonen her: KU DMP for Studerende Download KU DMP for Studerende
Husk, at drøfte datamanagementplanen med din vejleder i starten af dit projekt. Opbevar DMP'en sammen med dine data.
____________________________________________________________
Praktiske tips til datadeling
- Drøft med din vejleder, om du har data i dit projekt, der kan eller bør deles åbent. Brug beslutningstræet i denne lektion.
- Brug som udgangspunkt et fag- eller datatypespecifikt repositorium. Drøft, hvilket repositorium der typisk bruges til din type data. Tag et kig på repositorie-browserne re3data.org
Links to an external site. og FAIRsharing
Links to an external site., hvor du kan søge efter tilgængelige fagspecifikke repositorier.
- Hvis der ikke findes noget åbenlyst fagspecifikt repositorium, skal du vælge et generelt repositorium. Vi anbefaler for eksempel Zenodo
Links to an external site., fordi det er nemt at bruge og tilbyder dokumentation og brugersupport. Når du gemmer dit projekt eller metadata, der beskriver dit projekt i Zenodo, vil dit projekt være synligt på Google og andre søgemaskiner i de næste ca. tyve år.
- Du kan også bruge KU's repositorium ERDA og tjenesten Data DOI. Data DOI er en tjeneste til forskere på KU, der primært ønsker at arkivere deres data langsigtet og forsyner forskningsdatasæt med en DOI.
- Sørg for, at du inkluderer oplysninger, der forklarer dataene, når du uploader dem. For eksempel ved at uploade en tilhørende ReadMe-fil. Find en skabelon her.
- Hvis repositoriet opretter en persistent identifikator til dig (f.eks. en DOI), skal du angive identifikatoren i dit speciale eller i en fremtidig forskningsartikel.
- Kommuniker eventuelle betingelser, der gælder for andres genbrug af data, f.eks. ved at bruge muligheden for at tilknytte en licens. En Creative Commons Attribution (CC-BY)-licens vil være et godt valg til de fleste (men ikke alle) datasæt. Den beder andre om at citere dig (og dine samarbejdspartnere, hvis du har nogen), når de genbruger dine data. Hvis du har spørgsmål til licenser, kan du kontakte dit fakultets bibliotek.
- Hvis din bacheloropgave eller dit speciale ikke indeholder personoplysninger eller fortrolige data eller på anden måde er begrænset, kan du aflevere en kopi af dit projekt på universitetsbiblioteket via Digital Exam. Når dit projekt er blevet bedømt, og du har bestået, bliver dit projekt offentligt tilgængeligt på Det Kongelige Bibliotek (soeg.kb.dk).
Find en vejledning her: KUnet > Studieinformation> [Vælg din studieportal > Specialer og andre projekter > Aflevering og bedømmelse > Hvordan gør jeg mit speciale tilgængeligt for udlån?
Find publicerede specialer, bachelorprojekter og andre studenteropgaver fra KU, Aarhus Universitet og Roskilde Universitet, dvs. projekter, som studerende har givet tilladelse til at dele her. Links to an external site.
- Slå forskningsdatamanagement-termer op i RDM-ordliste.
____________________________________________________________
Få mere at vide
Nedenfor er angivet nogle eksterne materialer, hvor du kan læse mere om nogle af de emner, der er nævnt i denne lektion.
Om licenserne. Creative Commons. (u.å.). Hentet 14. november 2024 fra: https://creativecommons.org/licenses/ Links to an external site.
GNU-operativsystem. (2007). Hentet 14. november 2024 fra: https://www.gnu.org/licenses/licenses.html Links to an external site.
____________________________________________________________
Publiceret i 2024