7. Åben deling af data

COBL_learningoutcome_40x40px_2017_15.png  Learning objectives

Når du har gennemført denne lektion, vil du være i stand til at:

  • forklare, hvordan det gavner både dig og andre, når du deler data 
  • forklare, hvad "åbne data" er 
  • beskrive, hvordan du deler dine projektdata i din datamanagementplan. 

____________________________________________________________

COBL_litterature_40x40px_2017_18.png  Hvad er deling af data?

Datadeling er, når du giver andre adgang til at bruge dine data, din kode, dine protokoller, din dokumentation og lignende. Datadeling kan forekomme inden for organisationer, mellem forskellige organisationer eller mellem enkeltpersoner. I lektion 6 behandlede vi lagringsværktøjer til deling af aktive data med projektmedlemmer, mens projektet er i gang (i et samarbejde). I denne lektion vil vi fokusere på deling af færdige datasæt ved at uploade disse datasæt til datalagre for at gøre dem åbent tilgængelige for andre. Det kaldes også datapublicering.

Før vi dykker ned i, hvorfor det er vigtigt, og hvad du bør overveje, når du deler data, vil vi præsentere dig for nogle nøglebegreber:

 Datarepositorium

Et datarepositorium er et datalager, hvor forskere og studerende kan deponere (uploade) digitale datasæt og andre digitale forskningsobjekter samt metadata tilknyttet deres projekt med henblik på at dele data med andre. 

 Åbne data

Åbne data, også kaldet offentlige data, er forskningsdata med gratis, ubegrænset online adgang. For åbent at dele dine data deponerer du dem typisk i datarepositorier uden at sætte begrænsninger eller stille betingelser for dataadgang. Det betyder, at andre blot kan downloade en kopi af dit datasæt uden først at bede om din tilladelse.

 Persistente identifikatorer (PID'er)

En persistent identifikator (PID) er et vedvarende, ubrydeligt internetlink til materiale såsom et dokument, datasæt, en internetside, software eller en forskningsartikel. Når du uploader dine data til et datarepositorium, vil repositoriet i mange tilfælde oprette en persistent identifikator til dine datasæt. Den mest almindelige persistente identifikator til artikler og datasæt er en digital objektidentifikator (DOI).

 Datalicens

En datalicens er en juridisk tekst, der specificerer vilkår og betingelser for andres genbrug af datasæt. Hvis du f.eks. ønsker, at andre skal citere dig, når de bruger dine data, skal du vedhæfte en licens, der angiver, at du ønsker at blive citeret, f.eks. en CC-BY-licens. Du kan i mange tilfælde vælge mellem forskellige licenstyper, når du uploader dine data til et datarepositorium.

____________________________________________________________

 

COBL_videolecture_40x40px_2017_4.png  Hvorfor skal du dele dataene fra dit projekt?

I videoen nedenfor kan du se, hvorfor du bør overveje at dele dine data.

Undertekster: Klik på CC-ikonet og vælg sprog
Hvis du oplever Access Denied, genindlæs da siden. Alternativt skift browser..

 

Når du deler data i repositorier:

  • betyder det, at dit arbejde kan bidrage til andre projekter og reducere dobbeltarbejde 
  • giver du andre mulighed for at validere og bygge videre på dit arbejde 
  • kræver det, at du præsenterer dine data på en organiseret og velbeskrevet måde, så andre (herunder du selv i fremtiden) kan forstå, hvad dataene viser, og hvordan du har indsamlet, analyseret og behandlet dataene
  • kan du bevare data efter projektets afslutning og sikre, at dataene forbliver tilgængelige for dig fremover (se lektion 8).

____________________________________________________________

 

COBL_litterature_40x40px_2017_18.png  Hvad skal man dele?

Før du deler dine data via et datarepositorium, skal du undersøge, om du rent faktisk har lov til det. I nogle tilfælde er datadeling forbudt, mens det i andre tilfælde er påkrævet. Her er nogle eksempler:

  • Hvis du arbejder med personoplysninger, skal du beskytte privatlivets fred for de personer, du har fået dataene fra. I de fleste tilfælde må du ikke dele personoplysninger, og du skal derfor destruere dataene, når dit projekt er slut. Du kan kun dele data åbent ved hjælp af datarepositorier, hvis dataene er fuldstændigt anonymiserede (det er ikke længere muligt at identificere personerne). I nogle meget specifikke tilfælde kan du dele personoplysninger i ikke-anonymiseret form, hvis deltagerne i din undersøgelse har givet informeret samtykke til dette, men i sådanne tilfælde bør der også være indgået en juridisk aftale (en datadelingsaftale), og du bør bruge en sikker infrastruktur (lektion 6) til at dele dataene i stedet for et datarepositorium.
  • Hvis du har genereret dataene i samarbejde med eksterne parter, f.eks. forskere fra andre universiteter eller virksomheder, skal du afgøre, hvem der har rettighederne til dataene, og om dataene må deles. Dette er ofte beskrevet i en aftale indgået med den eksterne part.
  • Hvis dine resultater er baseret på eksisterende data indhentet fra dataudbydere, f.eks. Danmarks Statistik eller Rigsarkivet, er det usandsynligt, at du må videregive disse data til andre. Du bør undersøge dataudbydernes politik.
  • Hvis du planlægger at publicere resultater i en tidsskriftsartikel, skal du tjekke udgiverens politik. Udgivere kræver i stigende grad, at datasæt, der er knyttet til en forskningsartikel, deles ved hjælp af datarepositorier.

 

  VIGTIGT

Tal altid med din vejleder, før du beslutter dig for:

1) om dataene må deles eller ej

2) om de data, du ønsker at dele, kan gøres åbent tilgængelige via et repositorium eller skal deles via mere restriktive delingsmetoder.

 

Du kan f.eks. beslutte, at dine data skal bevares internt på KU og kun deles fra person til person efter anmodning (se lektion 8. Databevaring ).

Resten af denne lektion omhandler kun situationer, hvor data må deles åbent via et datarepositorium.

____________________________________________________________

 

COBL_litterature_40x40px_2017_18.png  Hvordan deler du åbent dataene fra dit projekt?

Når du har fået bekræftet, at du må dele dine data åbent, skal du beslutte dig for den bedste måde at gøre det på.
Nedenfor er nogle tips, du kan overveje:

Undersøg, hvilket datarepositorium du vil bruge

Generelt er der tre forskellige typer repositorier.

Det kan være kompliceret at vælge et repositorium til datadeling. Her er en liste over overvejelser, der kan gøre det nemmere for dig at vælge:  

Tjekliste til valg af repositorium:

1. Er der krav til valg af datarepositorium?
Hvis du har planer om at publicere dine resultater i en forskningsartikel, kan udgiveren stille krav til, om og hvordan det datasæt, der ligger til grund for resultaterne, skal deles. Din vejleder eller den forskningsgruppe, hvor du udfører din forskning, kan også have nogle præferencer.

2. Hvilken målgruppe vil du dele dine data med? 
Hvis der ikke er specifikke krav, så tænk over, hvem der kunne være interesseret i dine data? Generelt er det bedst at bruge et domænespecifikt eller datatypespecifikt repositorium, hvis dit mål er at gøre dine data genanvendelige for forskere og studerende inden for samme fagområde. Hvis der ikke er et passende domæne- eller datatypespecifikt repositorium, kan en generalistløsning som Zenodo være et meget godt alternativ.

3. Hvor stabilt er repositoriet, og hvilke services tilbyder det til at sikre, at dine data kan findes og tilgås af andre?
Når du har valgt et repositorium, skal du undersøge de politikker, der gælder for det, for at se, om repositoriet:

    • sikrer langtidsbevaring af datasæt (f.eks. mindst 5 år)
    • giver andre mulighed for at tilgå dataene og downloade en kopi af dem
    • giver dig mulighed for at tilføje oplysninger om dataene, når du uploader dem
    • sender dig et link til datasættet efter upload (f.eks. en persistent identifikator).

4. Gælder der nogle betingelser eller krav for repositoriet, som du bør tage højde for?
For eksempel om repositoriet:

    • har begrænsninger for, hvor stort et datasæt du kan uploade?
    • opkræver gebyrer for opbevaring af data?
    • opkræver andre gebyrer for at få adgang til og downloade dine data?

Sørg for at inkludere dokumentation og metadata

Det giver ikke mening at dele datasæt, som ingen kan forstå. Derfor er det vigtigt, at der inkluderes en beskrivelse af dataene i repositoriet. Det kan du gøre på to måder.

Ved at uploade dokumenter, der beskriver dataene, sammen med datasættet
Du kan f.eks. overveje at uploade en ReadMe-fil sammen med datasættet, der beskriver, hvilke materialer der er blevet brugt, hvordan dataene blev oprettet, og hvad de beskriver. Læs mere om ReadMe-filer i lektion 5 om datadokumentation. Her finder du også en skabelon til en ReadMe-fil.

Udover at uploade en ReadMe-fil kan du også overveje at uploade andre relevante oplysninger, der kan give dataene kontekst, såsom en projektbeskrivelse, en protokol, en spørgevejledning, en litteraturliste, PowerPoint-slides, der præsenterer dit projekt osv.

Ved at udfylde oplysninger om datasættet i uploadformularen
Mange – hvis ikke alle – repositorier, kræver, at du udfylder en obligatorisk metadataformular, når du uploader dine datafiler. Du vil f.eks. blive bedt om at udfylde oplysninger om dig selv (navn, e-mailadresse, studiested) og om datasættet (titel, oprettelsesdato, filtype, anvendt sprog). Du vil højst sandsynligt også blive bedt om kort at beskrive dataene samt nøgleord, der beskriver dataene, resultaterne og forskningsdisciplinen. Det er meget vigtigt, at du angiver så mange oplysninger som muligt, da de kan indekseres i søgemaskinerne. Det betyder, at det bliver nemmere for andre at finde dine data, hvis de søger efter termer, som du har inkluderet i metadataene.

Få en persistent identifikator til dine data

Mange repositorier opretter en persistent identifikator til dit datasæt, når du uploader dine data. Identifikatorerne er vedvarende links til dine data, og et eksempel er en DOI, en digital objektidentifikator. Persistente identifikatorer er vigtige af forskellige årsager. Først og fremmest kan du (og andre) ligesom med tidsskriftsartikler bruge den persistente identifikator til at citere dine data, for eksempel når du vil henvise til dine data i dit speciale, på din hjemmeside eller i en tidsskriftsartikel. Du kopierer blot den persistente identifikator, som repositoriet har genereret for dig, og tilføjer den som reference til dit citat. Her er eksempler på, hvordan et citat fra et datasæt kan se ud:

Clarke, Harry (2022). A provisional checklist of European butterfly larval foodplants [Datasæt]. Dryad. https://doi.org/10.5061/dryad.6hdr7sr35 Links to an external site.

Meyers, Charlène, 2022, "Transcription of 20 sight translations by translation students coded with voiced pauses and silent pauses", https://doi.org/10.34934/DVN/KHQE0P Links to an external site., Social Sciences and Digital Humanities Archive – SODHA, V1

For det andet vil den persistente identifikator gøre det meget nemmere for andre at finde og tilgå dine data. De kan blot klikke på den persistente identifikator fra et hvilket som helst onlinedokument eller en hvilken som helst hjemmeside, der citerer fra dataene, og det vil føre dem direkte til dit datasæt i repositoriet.

Medtag oplysninger om, hvordan dine data kan genbruges af andre

Et sidste skridt, du skal tage, når du deler dine data åbent, er at fortælle, hvordan andre kan genbruge dine data. Kan andre gøre, hvad de vil med dataene? Eller er der begrænsninger? Kan dataene f.eks. bruges til kommercielle formål? Og vil du have andre til at citere dine data, når de genbruger dem? Tal med din vejleder og beslut sammen, om der skal være nogen krav til genbrug.

Du kan fortælle på forskellige måder, hvordan dine data må genbruges. Først og fremmest kan du blot beskrive dine krav i enhver dokumentation, du uploader sammen med datasættet (f.eks. ReadMe-filen) eller i de metadata, som repositoriet beder dig om at udfylde. Alternativt kan du bruge en licens til at beskrive dine betingelser.

 

Mere om licenser til genbrug
Licenser er juridiske dokumenter med en tekstbeskrivelse om, hvad man må gøre med dine data, din software, din kode eller algoritme og andet forskningsmateriale. Der findes forskellige typer licenser, og det er vigtigt, at du vælger en licens, der passer til den type data eller materialer, du har, og som beskriver, hvor åbne eller tilgængelige de må være. Du føjer licensen til dine data, når du uploader dataene til repositoriet. Det repositorium, du vælger, guider dig gennem processen. Bemærk dog, at nogle repositorier anvender en enkelt licenstype til alle de data, der uploades til repositoriet. 

Creative Commons-licenserne er den mest almindelige form for generiske licenser. Creative Commons-licenserne omfatter syv forskellige licenser, som du kan kombinere for præcist at definere, hvordan andre må bruge og dele dine data. Du kan bestemme, om og hvordan brugerne skal citere dig, når de bruger dataene, om dataene må bruges til kommercielle formål, eller om dataene på nogen måde må ændres eller tilpasses. Der findes også typespecifikke licenser. GNU-licenser er for eksempel til software og andre typer praktiske værker, såsom programmer, mens Unsplash-licenser er til fotografier, der frit kan deles. 

Når du vælger en licens og deler data og materialer, skal du sikre dig, at du har rettighederne til dataene. Det er kun rettighedshaveren, der kan give licens til dataene. Når du har givet licens til dine data, kan du ikke tilbagekalde licensen.

  VIGTIGT

Bemærk, at licenser går begge veje. Licenser kan ikke kun bruges af dig til at fortælle, hvordan andre må bruge dine data. Det er også meget vigtigt, at du tjekker, om der er licenser tilknyttet eksisterende data, som du selv ønsker at bruge i dit projekt. Se lektion 3. Krav, rettigheder og ansvar.

___________________________________________________________

 

COBL_litterature_40x40px_2017_18.png  Beslutningstræ for datadeling

 

Se beslutningstræet nedenfor. Det kan hjælpe dig med at beslutte, hvornår og hvordan du vil dele dine data. Du kan downloade det her Download her.

Decision tree DA-1.png

 

____________________________________________________________

 

COBL_videolecture_40x40px_2017_4.png  Datadeling i praksis

Morten Arendt Rasmussen, vejleder ved Det Natur- og Biovidenskabelige Fakultet, forklarer, hvordan studerende kan dele rådata og kode ved hjælp af enten universitetets repositorier eller eksterne data- og kodedelingstjenester.

____________________________________________________________

 

COBL_quiz_40x40px_2017_1.png  Test dig selv

Tjek, om du har fået fat i hovedpunkterne i denne lektion:

Quiz: Åben deling af data

____________________________________________________________

 

COBL_tasks_40x40px_2017_10.png  Arbejd videre på din DMP

Fortsæt med at arbejde på din datamanagementplan (DMP) ved at udfylde de sidste spørgsmål i afsnit 7. Deling af data.

 

7.a Skal nogle af dataene/materialet i projektet deles åbent med andre?

Hvis ja, beskriv hvilke datasæt. 

7.b Hvis ja, hvordan skal dataene/materialet så deles åbent? Overvej, hvilket repositorium du forventer at bruge, og hvilken dokumentation der skal sendes sammen med dataene/materialet.

 

Hvis du ikke er begyndt at udfylde din DMP endnu, kan du finde DMP-skabelonen her: KU DMP for Studerende Download KU DMP for Studerende

Husk, at drøfte datamanagementplanen med din vejleder i starten af dit projekt. Opbevar DMP'en sammen med dine data.

____________________________________________________________

 

COBL_sparks_40x40px_2017_19.png  Praktiske tips til datadeling

  1. Drøft med din vejleder, om du har data i dit projekt, der kan eller bør deles åbent. Brug beslutningstræet i denne lektion.

  1. Brug som udgangspunkt et fag- eller datatypespecifikt repositorium. Drøft, hvilket repositorium der typisk bruges til din type data. Tag et kig på repositorie-browserne re3data.org Links to an external site. og FAIRsharing Links to an external site., hvor du kan søge efter tilgængelige fagspecifikke repositorier.

  1. Hvis der ikke findes noget åbenlyst fagspecifikt repositorium, skal du vælge et generelt repositorium. Vi anbefaler for eksempel Zenodo Links to an external site., fordi det er nemt at bruge og tilbyder dokumentation og brugersupport. Når du gemmer dit projekt eller metadata, der beskriver dit projekt i Zenodo, vil dit projekt være synligt på Google og andre søgemaskiner i de næste ca. tyve år.

  1. Du kan også bruge KU's repositorium ERDA og tjenesten Data DOI. Data DOI er en tjeneste til forskere på KU, der primært ønsker at arkivere deres data langsigtet og forsyner forskningsdatasæt med en DOI.

  2. Sørg for, at du inkluderer oplysninger, der forklarer dataene, når du uploader dem. For eksempel ved at uploade en tilhørende ReadMe-fil. Find en skabelon her.

  3. Hvis repositoriet opretter en persistent identifikator til dig (f.eks. en DOI), skal du angive identifikatoren i dit speciale eller i en fremtidig forskningsartikel.

  4. Kommuniker eventuelle betingelser, der gælder for andres genbrug af data, f.eks. ved at bruge muligheden for at tilknytte en licens. En Creative Commons Attribution (CC-BY)-licens vil være et godt valg til de fleste (men ikke alle) datasæt. Den beder andre om at citere dig (og dine samarbejdspartnere, hvis du har nogen), når de genbruger dine data. Hvis du har spørgsmål til licenser, kan du kontakte dit fakultets bibliotek.

  5. Hvis din bacheloropgave eller dit speciale ikke indeholder personoplysninger eller fortrolige data eller på anden måde er begrænset, kan du aflevere en kopi af dit projekt på universitetsbiblioteket via Digital Exam. Når dit projekt er blevet bedømt, og du har bestået, bliver dit projekt offentligt tilgængeligt på Det Kongelige Bibliotek (soeg.kb.dk).  

            Find en vejledning her: KUnet > Studieinformation> [Vælg din studieportal > Specialer og andre projekter > Aflevering og bedømmelse > Hvordan gør jeg mit speciale tilgængeligt for udlån?

            Find publicerede specialer, bachelorprojekter og andre studenteropgaver fra KU, Aarhus Universitet og Roskilde Universitet, dvs. projekter, som studerende har givet tilladelse til at dele her. Links to an external site.

  6. Slå forskningsdatamanagement-termer op i RDM-ordliste.

____________________________________________________________

 

COBL_fieldtrip_40x40px_2017_8.png  Få mere at vide

Nedenfor er angivet nogle eksterne materialer, hvor du kan læse mere om nogle af de emner, der er nævnt i denne lektion.

Om licenserne. Creative Commons. (u.å.). Hentet 14. november 2024 fra: https://creativecommons.org/licenses/ Links to an external site.

GNU-operativsystem. (2007). Hentet 14. november 2024 fra: https://www.gnu.org/licenses/licenses.html Links to an external site.

____________________________________________________________

Publiceret i 2024