Underviservejledning til lektionen Beskriv dine data, så de kan forstås – om at genbruge data
PDF version Download PDF version
Formål
Formålet med denne lektion er at introducere de studerende til de mange begreber, overvejelser og processer, der er i dokumentation af data og metadatabeskrivelser af ens data. De får en introduktion til, hvad dokumentation kan indebære, og tips til at komme i gang med at skrive dokumentationen.
Målbeskrivelse
Når de studerende har gennemført lektionen, forventes det, at de:
• kan redegøre for, hvorfor dokumentation af data og datahåndtering er vigtig.
• kan give eksempler på, hvad denne type dokumentation kan bestå af.
Hvilke dannelsesspørgsmål behandler denne lektion?
• Hvordan håndterer jeg forskellige typer data sikkert og forsvarligt f.eks. under dataindsamling, opbevaring, deling, udveksling og genbrug?
• Hvordan håndterer jeg persondata i forbindelse med mit studie og mine undersøgelser?
Indholdsbeskrivelse
Denne korte lektion introducerer dokumentation, og hvilke slags dokumentation man kan indsamle i løbet af en opgave eller et projekt. Lektionen præsenterer dokumentationen på fire niveauer: variabel, fil/database, projekt og metadata.
Lektionen gør også opmærksom på, at forskellige typer data kræver forskellige typer dokumentation. Det er nødvendigt at begynde at indsamle dokumentation fra projekt-/opgavestart og løbende igennem projektet/opgaven. Man skal tænke kritisk over, hvilken dokumentation man skal bruge for at kunne indsamle data, dele data og for at kunne forstå dataene.
Der er fokus på, hvordan de studerende kommer godt i gang med datadokumentation og begynder at danne vaner, der vil komme dem til gavn gennem studielivet på KU.
Format og varighed
Lektionen består af tekst, videoer og refleksionsopgaver. Lektionen suppleres med en ordliste, hvor de studerende kan finde definitioner af anvendte begreber og en README-fil, som de kan downloade og bruge i deres egne opgaver/projekter.
Lektionen er estimeret til 20 min. varighed, ekskl. øvelserne og refleksionsopgaverne.
Målgruppe
Bachelorstuderende på hele Københavns Universitet.
Hvornår anbefales denne lektion inddraget i undervisningen?
Lektionen er udviklet, så den kan gennemføres som selvstændig aktivitet, men den vil være særlig relevant at inddrage som optakt til kurser eller lektioner, hvor de studerende skal indsamle data, observationer eller andre informationer for at svare på et undersøgelsesspørgsmål. Man kunne f.eks. inddrage lektionen i diskussioner af, hvilken dokumentation, herunder tilladelser og aftaler, de studerende har brug for i forhold til deres undersøgelser. I forbindelse med introduktion til bachelorprojekter eller kandidatspecialer bliver lektionen således særlig relevant at inddrage. Til det formål kan man dog alternativt med fordel anvende det mere udbyggede forløb Research data management for studerende.
Ligeledes skal studerende, der modtager sekundære data eller finder et datasæt, der er offentliggjort på nettet, lære at læse datasættets tilhørende dokumentation for at kunne forstå, hvordan de må arbejde med data.
Man kan med fordel inddrage lektionen i forbindelse med underviserudvalgte pensumtekster om videnskabelige metoder, Open Science og mere.
Hvordan anbefales denne lektion inddraget i undervisningen?
Den nyeste forskning om studerendes forberedelsesmønstre peger på, at der er større sandsynlighed for, at studerende engagerer sig i de foreslåede forberedelsesaktiviteter, hvis de oplever disse aktiviteter som relevante og kan se tegn på synlig læring. På den baggrund foreslås det, at aktiviteterne i denne lektion rammesættes tydeligt for de studerende, så de kan se formålet med dem i forhold til opnåede kompetencer og i forhold til, hvordan forberedelsesaktiviteten relaterer til, hvad der foregår i undervisningen. Herunder formuleres fire konkrete eksempler på, hvordan forberedelsesvejledning og undervisningsaktiviteter kan rammesættes over for de studerende.
A: Metadata i praksis
Denne opgave er en introduktion til metadata. Refleksionen begynder i kilderne, som er bekendt fra de studerendes dagligdag, for at afmystificere, hvad metadata kan være. Refleksionen bruger to faglige kilder: Københavns Universitetsbiblioteks katalog og OpenData.dk.
Forslag til forberedelsesvejledning i fagets Absalon-rum:
1) Se videoerne, og læs teksterne i lektionen ’Beskriv dine data, så de kan forstås – om at genbruge data’.
2) Undersøg og reflekter over følgende spørgsmål. Skriv dine svar og refleksioner ned, og tag dem med til undervisningen, hvor du skal dele dem med dine medstuderende.
• Hvilke metadata findes der om musiknumre på Spotify, og hvad (kan) de bruges til?
• Hvilke metadata findes der på Zalando.dk, og hvad (kan) de bruges til?
• Hvilke metadata findes der om billeder på Flickr, og hvad (kan) de bruges til?
• Hvilke metadata findes der om bøger i Københavns Universitets bibliotekskatalog, og hvad (kan) de bruges til?
• Find et datasæt i OpenData.dk
Links to an external site.. Hvilke metadata findes der om datasættet, og hvad (kan) de bruges til?
Forslag til undervisningsaktiviteter baseret på de studerendes forberedelse (i alt ca. 25 min.):
1) Gruppediskussion (grupper à ca. 3-4 studerende, ca. 15 min.):
• Sammenlign og diskuterer jeres svar på spørgsmålene fra forberedelsen.
2) Plenumopsamling mundtligt eller via padlet med særligt fokus på refleksionerne over metadataenes nytteværdi (ca. 10 min.).
B: Refleksion over egen praksis med datadokumentation
Forslag til forberedelsesvejledning i fagets Absalon-rum:
1) Se videoerne, og læs teksterne i lektionen ’Beskriv dine data, så de kan forstås – om at genbruge data’.
2) Datadokumentation skal bruges til at beskrive og forstå et datasæt. Dokumentation kan beskrive de specifikke forhold, hvorunder datasættet blev indsamlet, hvad hver kolonne i et regneark betyder, og hvilke metoder der blev brugt til at indsamle dataene. Når du opretter dokumentation, skal du spørge sig selv, om andre kan forstå datasættet, hvis du giver dem disse oplysninger. Der er mange forskellige måder at opsætte og organisere din dokumentation på. Reflekter over følgende spørgsmål. Skriv dine refleksioner ned, og tag dem med til undervisningen, hvor du skal dele dem med dine medstuderende.
• Tænk på et af dine projekter eller opgaver og de data, du arbejdede med. Hvilke former for datadokumentation brugte du eller kunne du have brugt? Hvorfor?
• Har du nogensinde haft problemer med at forstå dine egne data på grund af manglende dokumentation?
• Har du nogensinde haft problemer med at genbruge dine egne eller andres data på grund af manglende dokumentation?
Forslag til undervisningsaktiviteter baseret på de studerendes forberedelse (i alt ca. 25 min.):
1) Gruppediskussion (grupper à ca. 3-4 studerende, ca. 15 min.):
• Sammenlign og diskuterer jeres svar på spørgsmålene fra forberedelsen.
2) Plenumopsamling mundtligt eller via padlet med særligt fokus på refleksionerne over metadatenes nytteværdi (ca. 10 min.).
C: Skriv et udkast til en README
I denne øvelse introduceres de studerende til en README-fil. De studerende kan arbejde i grupper eller individuelt.
Forslag til forberedelsesvejledning i fagets Absalon-rum:
1) Se videoerne, og læs teksterne i lektionen ’Beskriv dine data, så de kan forstås – om at genbruge data’. I undervisningen kommer du til at bruge din viden om datadokumentation fra lektionen til at arbejde med at skrive en README-fil til et datasæt; du behøver derfor ikke at have lavet denne opgave på forhånd.
Forslag til undervisningsaktiviteter baseret på de studerendes forberedelse (i alt ca. 45-50 min.):
1) Vælg et datasæt, du tidligere har arbejdet med (5 min.).
[Underviseren kan evt. levere et datasæt, de studerende kan arbejde med som case.]
2) Download lektionens README Download Download lektionens README, og brug den til at beskrive datasættet (30 min.).
3) Opsamling i plenum mundtligt eller via padlet (10-15 min.). Diskussionspunkter kan være:
• Hvilke informationer beskrives i README?
• Er der nogen afsnit i README, som du ikke kunne udfylde? Hvorfor?
• Er der nogen termer eller begreber, som kræver yderligere forklaring?
• Hvilke informationer har du brug for at lære mere om?
• Hvornår vil det være hensigtsmæssigt at udfylde README?
• Hvordan kunne man arbejde med README i et gruppeprojekt?
D: Større hands-on-aktivitet: Byg dine metadata med LEGO®
Aktiviteten suppleres af flere skabeloner, der kan skræddersys faget, niveau og tid. Denne aktivitet er en forenklet udgave af et spil udviklet af Donaldson & Mahon (2019), "Lego: Metadata for Reproducibility”. Spillet indeholder flere diskussionspunkter, ideer til LEGO-modeller, skabeloner og undervisningsvejledninger, som kan tilpasses studerendes faglige niveau og undervisningskonteksten.
Opgaven er opdelt i tre dele:
• I del 1 opdeles de studerende i grupper. Hver gruppe får LEGO-klodser nok til at bygge en lille model: ca. 15-30 klodser i forskellige farver, størrelser og former. Formålet er at bygge en model og beskrive modellen med meningsfulde metadata.
• I del 2 bygger de studerende en anden gruppes model ved at følge metadatabeskrivelsen for at se, om de kan genskabe modellen.
• I en efterfølgende diskussion drøftes emner som bl.a. metadatakvalitet, evt. tvetydigheder i beskrivelserne, reproducerbarhed m.m.
Kilde: Donaldson, M. and Mahon, M. (2019); LEGO® Metadata for Reproducibility. University of Glasgow. DOI: http://dx.doi.org/10.36399/gla.pubs.196477 Links to an external site..
Herunder formuleres et konkret eksempel på, hvordan forberedelsesvejledning og undervisningsaktiviteter i denne øvelse kan rammesættes over for de studerende.
Forslag til forberedelsesvejledning i fagets Absalon-rum:
1) Se videoerne, og læs teksterne i lektionen ’Beskriv dine data, så de kan forstås – om at genbruge data’. I undervisningen kommer du til at skulle bygge dine metadata i LEGO® sammen med dine medstuderende.
Forslag til undervisningsaktiviteter baseret på de studerendes forberedelse (i alt ca. 90 min.):
1) Bygningsfase (ca. 45 min.):
1. Hver gruppe bygger en lille model med LEGO-klodserne. Modellen kan være lige så kompleks og detaljeret, som man har lyst til.
2. Hver gruppe noterer, hvordan de byggede modellen i denne skabelon
Download denne skabelon. Der kan bruges tekst eller billeder til at beskrive modellen og byggeprocessen. I hvilken rækkefølge tilføjede man klodser til modellen? Hvilke farver havde klodserne? Hvilken størrelse? Osv.
3. Pil modellen fra hinanden.
4. Klodserne og metadatabeskrivelsen gives videre til en anden gruppe, som nu skal forsøge at genskabe modellen.
2) Genskab en anden gruppes model (ca. 30 min.):
1. Følg instruktionerne udleveret af den anden gruppe, og byg den beskrevne LEGO-model.
2. Overvej, hvilke informationer der var nyttige, hvilke informationer der manglede, og hvor det var nødvendigt med mere information for at genskabe modellen.
3) Drøftelse i plenum (ca. 15 min.). Diskussionspunkter kan være:
• Hvordan gik det med at dokumentere jeres proces?
• Var der nogen detaljer, som var svære at fange i jeres beskrivelse?
• Hvordan gik det med at genskabe modellen ud fra den anden gruppes metadata?
• Stødte I på tvetydigheder i instruktionerne?
• Hvilke fordele og ulemper ser I ved at beskrive en proces med brug af frie termer frem for kontrollerede termer, som er en vedtaget liste af termer, der bruges til at beskrive en proces?
• Er der en metadatastandard for LEGO-klodser, som man kunne have brugt i beskrivelsen af modellen? Hvilke specifikke standarder findes i jeres fagområde?
Kilde – hvem har produceret indholdet?
Lektionen er produceret af Københavns Universitet som en del af Københavns Universitets læringsressourcer til digital dannelse, 2023.
Fagansvarlige:
• Lorna Wildgaard, ph.d., specialkonsulent, Københavns Universitetsbibliotek (KUB), Forskerservice
• Asger Væring Larsen, specialkonsulent, Københavns Universitetsbibliotek (KUB), Forskerservice
Lektionens relation til andre lektioner og/eller forløb, hvis relevant
Lektionen er udviklet til emnet ”Datahåndtering”, og alt andet indhold under dette emne vil også være relevant. Man kan kombinere lektioner, f.eks. i forhold til hvordan de studerende klassificerer deres data (lektionen ”Pas på dine data – om dataklassifikation og risici”), hvordan disse data skal opbevares (lektionen “Gem din data godt – om at gemme data og finde dem igen”), og hvordan man på en hensigtsmæssig måde kan dele disse data (lektionen “Del dine data med andre – om at data skal gøre maksimal nytte”; særligt relevant i kombination med denne lektion).
Der findes en række ressourcer, hvor de studerende kan lære mere om dataklassifikation og håndtering af persondata:
• Research data management for studerende (et længere forløb for viderekomne)
• GDPR for studerende
• Lektionen “God dataindsamlingspraksis” under emnet ”Digital undersøgelse og metode”