Pas på dine data – om dataklassifikation og risici

Time.png  Tid

Lektionen forventes at tage ca. 25 min. at gennemføre. Dertil kommer refleksionsøvelsen, som du med fordel kan lave sammen med dine medstuderende.

 

Datahåndtering.png  Om lektionen 'Pas på dine data – om dataklassifikation og risici'

I denne lektion vil du blive introduceret til data, dataklassifikation og risikovurdering. Data findes i mange former. Data kan være offentligt tilgængelige, og de kan også være hemmelige. Det, du skal huske at overveje, er: Hvad er det for data, jeg har at gøre med? Hvor skal mine data gemmes, så de er sikrede? Hvilke risici er der forbundet med den måde, jeg arbejder med mine data på? Hvordan reducerer jeg disse risici? 

Området dataklassifikation og risikovurdering kan være lidt komplekst, men du kommer rigtig langt med de værktøjer og metoder, du får præsenteret i denne lektion – og med almindelig sund fornuft. 

Der vil i denne lektion blive nævnt en række begreber, som kan være nye for dig. Du kan se definitioner af begreberne i ordlisten.

 

COBL_learningoutcome_40x40px_2017_15.png Læringsmål

Når du har gennemført lektionen, forventer vi, at du:

  • kan forklare, hvorfor det er vigtigt at vurdere, hvilke typer af data du arbejder med i dine studieopgaver og projekter gennem dataklassifikation.
  • kan udføre simpel dataklassifikation ved at identificere de datatyper, du arbejder med.
  • kan foretage en risikovurdering i forhold til datasikkerhed.
  • kan nævne metoder til at håndtere data på en sikker måde i forhold til datalækage og datatab.
  • kan finde yderligere information og vejledning om sikker datahåndtering på KU's intranet.

 

kilde.png  Kilde

Lektionen er produceret af Københavns Universitet som en del af Københavns Universitets læringsressourcer til digital dannelse, 2023.

Fagansvarlige:

  • Lorna Wildgaard, ph.d., specialkonsulent, Københavns Universitetsbibliotek (KUB), Forskerservice
  • Asger Væring Larsen, specialkonsulent, Københavns Universitetsbibliotek (KUB), Forskerservice

____________________________________________________________

 

COBL_videolecture_40x40px_2017_4.png  Hvad er data – og hvilke data skal du passe ekstra godt på?

Hvis du oplever Access Denied, genindlæs da siden. Alternativt skift browser.

 

Du skal passe ekstra godt på følgende data:

  • Fortrolige data: Det kan være oplysninger om identificerbare personer eller oplysninger, du skal holde hemmelige af forsknings- eller forretningshensyn. Vær opmærksom på, at anonymisererede eller pseudonymiserede personoplysninger ofte kan spores tilbage til specifikke individer, hvis man kan koble flere forskellige data til hinanden. Læs mere i afsnittet 'Kompenserende tiltag' nedenfor.
  • Data, der er tidskrævende, dyre eller umulige at genskabe.

Du skal passe godt på personoplysninger – både de følsomme og de ikke-følsomme

Du skal beskytte alle personoplysninger, der kan kobles til et fysisk individ – både de følsomme og de ikke-følsomme. Det handler om at respektere mennesker ved at beskytte deres data og identitet, så oplysningerne ikke kan misbruges af andre. 

Datatilsynet beskriver personoplysninger således:

En personoplysning er enhver form for information, der kan henføres til en bestemt person, også selv om personen kun kan identificeres, hvis oplysningen kombineres med andre oplysninger.

Personoplysninger kan for eksempel være personnumre, registreringsnumre, et billede, et fingeraftryk, en stemme, lægejournaler eller biologisk materiale, når det i praksis er muligt at identificere en person ud fra oplysningerne eller i kombination med andre. Man siger, at oplysningen er "personhenførbar".

Databeskyttelsesforordningen opdeler personoplysninger i tre typer:

  • Personoplysninger (ikke-følsomme oplysninger)
  • Særlige kategorier af personoplysninger (følsomme oplysninger) 
  • Oplysninger om straffedomme og lovovertrædelser eller tilknyttede sikkerhedsforanstaltninger

Opdelingen findes, fordi der gælder forskellige betingelser og procedurer for behandling af personoplysninger afhængig af oplysningernes følsomhed.

[...]

Personoplysninger (ikke-følsomme personoplysninger)

Personoplysninger omfatter alle oplysninger, der ikke er klassificeret som særlige kategorier af oplysninger (følsomme personoplysninger). Det kan for eksempel være identifikationsoplysninger som navn, adresse, alder og uddannelse. Det gælder også økonomiske forhold som skat og gæld. Personoplysninger indebærer også væsentlige sociale problemer, andre rent private forhold, sygedage eller tjenstlige forhold. Oplysninger i form af billede, familieforhold, bolig, bil, eksamen, ansøgning, CV, ansættelsesdato og -stilling, arbejdsområde og arbejdstelefon er også personoplysninger.

Særlige kategorier af personoplysninger (følsomme personoplysninger) 

Følsomme personoplysninger er udtrykkelig afgrænset i databeskyttelsesforordningen, og adgangen til at behandle sådanne oplysninger er snævrere end ved almindelige personoplysninger. 

Følsomme oplysninger er oplysninger om:

  • Race og etnisk oprindelse
  • Politisk overbevisning
  • Religiøs eller filosofisk overbevisning
  • Fagforeningsmæssige tilhørsforhold
  • Genetiske data
  • Biometriske data med henblik på entydig identifikation
  • Helbredsoplysninger
  • Seksuelle forhold eller seksuel orientering.

(Datatilsynet, Hvad er personoplysninger? Links to an external site. – 23. august 2023)

Derudover er der særlige regler for oplysninger om personers strafbare forhold.

Hvis du arbejder med ovenstående typer af data, bør du lave en risikovurdering og klassifikation af dine data for at finde ud af, hvor grundig du skal være.

De to typer analyse er udviklet, så arbejdspladser, organisationer og myndigheder kan håndtere andres data på en ordentlig måde. F.eks. skal KU behandle oplysninger om studerende og ansatte uden risiko for datatab eller datalækage. Det er ikke en proces, som enkeltpersoner normalt udfører på egne data på denne strukturerede måde, men det er vigtigt, at du har kendskab til, hvordan metoderne fungerer, og er i stand til at udføre risikovurderingen og dataklassifikationen, hvis du en dag skal håndtere personoplysninger eller andre fortrolige data i en virksomhed eller som led i et forskningsprojekt.

Hvis du ikke arbejder med personoplysninger, følsomme personoplysninger eller andre fortrolige data, så behøver du ikke tage særlige forholdsregler – ud over almindelig sund fornuft. 

Du skal blot sikre dig, at:

Hvis du har dine data liggende i 2-3 kopier, så er du sikker på, at du ikke mister noget, hvis din computer skulle bryde sammen eller blive stjålet.

Læs mere i lektionen Gem dine data godt.

___________________________________________________________

 

COBL_litterature_40x40px_2017_18-1.png  Hvad er en risikovurdering?

Når du laver en risikovurdering, vurderer du, hvor høj grad af sikkerhed der er nødvendig for at beskytte de data, du skal arbejde med. Dermed kan du undgå at overbeskytte alle data og i stedet koncentrere dig om at beskytte de data, der er særligt vigtige at beskytte.  

Når du arbejder med personoplysninger eller andre fortrolige data, skal du tænke nøje over: 

  • hvilke oplysninger du vil indsamle. – Undgå at indsamle flere data,end du har brug for
  • hvordan du vil indsamle dem. 
  • hvor du vil opbevare dem. 
  • hvem du har behov for at dele dem med i løbet af projektet, og efter at projektet er slut, og om du overhovedet må dele dem.
  • hvad der skal ske med data efter endt projekt/opgave?

Risikovurderingen består bl.a. af de tre følgende dele:  

  1. Dataklassifikation: Du identificer, hvilke data du arbejder med, og hvordan du bør beskytte dem mod misbrug og tab. 
  2. Vurdering af din løsnings overholdelse af sikkerhedskrav: ”Løsning” betyder i denne sammenhæng, hvor du har tænkt dig at gemme dine data, men også f.eks. hvordan du indsamler data, overfører dem til lagring, og hvordan du evt. vil dele dem med andre på en sikker måde – altså selve håndteringen af data. 
  3. Vurdering af kompenserende tiltag: Hvad kan du gøre for at rette op på en løsning, der har en indbygget risiko, f.eks. hvis der kun er en studerende i din studiegruppe, der har en kopi af jeres data på en USB-nøgle? Et kompenserende tiltag kunne være at have backup af jeres data på et fællesdrev. 

Hvordan du gør det i praksis, afhænger bl.a. af datas fortrolighed, og hvilken type data der er tale om.

____________________________________________________________

 

Literature.png  Hvordan laver jeg en dataklassifikation?

Dataklassifikationen laves som nævnt kun, hvis der er grund til det – altså hvis du skal håndtere persondata eller data, der af andre årsager skal holdes hemmelige. I de fleste tilfælde vil du af en underviser eller vejleder få at vide, hvor data skal ligge, og hvem der må have adgang, men det er godt at vide, hvordan disse beslutninger er truffet, så du selv kan træffe lignende beslutninger på et senere tidspunkt. Hensigten er at beskytte data på en systematisk og hensigtsmæssig måde.

Du bør nøje overveje følgende:

  Fortrolighed

Hvor fortrolige er de data, du behandler? Er der tale om sundhedsoplysninger på identificerbare personer, eller er det 100 tobaksplanters højde og vægt? Følsomme persondata skal betragtes som fortrolige, mens tobaksplanters højde og vægt formentlig ikke skal. Man opererer typisk med en skala på 1-4, hvor 1 er mest fortroligt (det kunne f.eks. være navngivne personers sundhedsoplysninger). Hvis du arbejder med data, som du har fået fra en virksomhed eller myndighed, kan data også godt være fortrolige, selvom der ikke er tale om persondata.

  Integritet

Integritet handler om, hvem der må have adgang til at ændre i data. Er det kun dig? Eller er der en samarbejdspartner eller underviser, der også må have adgang?

  Tilgængelighed

Tilgængelighed handler om, hvor stabilt du har adgang til dine data. Er det f.eks. OK, at en server ikke er tilgængelig en gang imellem på grund af vedligeholdelse, eller er det vigtigt, at det sted, hvor dine data ligger, er tilgængeligt 24/7. Det kunne f.eks. være, hvis et apparat står og måler på noget i tre døgn og gemmer data på en server. I det tilfælde skal serveren køre hele tiden, for ellers mister du noget.   

 

Sådan kan du gøre: Lav et skema over de tre elementer og deres inddeling på skalaen fra 1-4, når du klassificerer dine data. Det kunne f.eks. se sådan ud:

Dataklassifikation 1-4,
hvor 1 er højest
Note (eksempeltekst)
Fortrolighed 2 Data er ikke følsomme persondata, men almindelige persondata
Integritet 1 Data må kun ændres af mig og ingen andre
Tilgængelighed 3 Data må gerne være utilgængelige i særlige tilfælde, f.eks. ved servernedbrud el. vedligehold

 

Videoen herunder viser, hvordan de ansatte på Københavns Universitet skal arbejde med dataklassifikation.

____________________________________________________________

 

Literature.png  Hvordan vurderer jeg min løsnings overholdelse af sikkerhedskrav?

Når du har klassificeret dine data, skal du finde en passende løsning på, hvordan de skal opbevares,. F.eks. kunne en løsning være at gemme dine data på din computer med backup på en ekstern harddisk, T-drevet, OneDrive eller tilsvarende.

Gå løsningen igennem med henblik på at vurdere, om den lever op til sikkerhedskravene:  

  • Er løsningen egnet til persondata?  
  • Kan du med løsningen nemt dele data med din underviser, vejleder eller andre?
  • Bliver der taget backup af data?  
  • Skal man logge på med kode for at få adgang til data?  
  • Har du adgang til dine data, når du har brug for det?
  • Står løsningen mål med risikoen for, at data mistes, ændres eller lækkes.  

Undgå USB-nøgler 
Hvis data ikke er fortrolige, sker der ikke noget ved f.eks. at lægge dem over på en ukrypteret USB-nøgle, men er der tale om persondata eller andre data, der ikke må falde i andres hænder, er det et no-go. 

Generelt bør du undgå at bruge USB-nøgler, da de er små og dermed nemt kan mistes. Men risikoen for, at noget går galt, skal stå mål med konsekvensen. Hvis konsekvensen er meget lille, kan du måske godt leve med en risiko. F.eks. kan du nok godt leve med risikoen for at tabe USB-nøglen med data på, hvis du har en kopi på computeren eller netværksdrevet, men det går jo ikke, hvis data kun må ses af dig. Hvis du reelt ikke har noget andet valg end at gemme persondata på en USB-nøgle, skal du søge for, at den er krypteret, så kun den, der har koden, kan læse indholdet.

Brug en Risiko-Konsekvenstabel til at tænke dine løsning igennem 
Vi har lavet en tabel, som kan hjælpe dig med at tænke dine løsninger og procedurer igennem. Du bruger tabellen ved at vurdere risikoen for at "noget" kan ske med dine data i forbindelse med de løsninger, du bruger, og de procedurer, du udfører. 

Risiko/Konsekvens Uden betydning Nogen betydning Alvorligt Kritisk
Vil forekomme                                                                        
Meget sandsynligt                                                                        
Lidt sandsynligt                                                                        
Usandsynligt                                                                        

Grøn: Ingen ændringer er nødvendige
Gul: Indfør kompenserende tiltag (se "Vurdering af kompenserende tiltag
" nedenfor)
Rød: Find en anden løsning

Et eksempel på, hvordan du bruger tabellen:
Vurder f.eks. hvad risikoen er for, at nogen kommer til at se persondata, du har på papir, hvis du efterlader dit arbejde på dit skrivebord derhjemme, når du er færdig med dagens arbejde. 

Hvis risikoen er "Meget sandsynlig", fordi du bor sammen med andre, som har adgang til dit skrivebord, kigger du på den række, hvor der står "Meget sandsynligt". Du vurderer dernæst, at konsekvensen er alvorlig, da du ikke kan være sikker på, at vedkommende ikke vil bruge informationen til noget (f.eks. dele oplysningerne med andre). Du kan nu se, at farven er rød ud for kolonnen "Alvorligt".

Rød betyder, at du skal finde på en anden løsning. En anden løsning kunne være, at du kun har pseudonymiserede oplysninger på papir, så vedkommende ikke kan se, hvem de pågældende sundhedsoplysninger tilhører, at du scanner papirerne og kun arbejder med oplysningerne digitalt, eller at du låser papirerne inde i et skab, når du ikke arbejder med dem.

____________________________________________________________

 

Literature.png  Kompenserende tiltag – hvordan mindsker jeg en risiko?

Kompenserende tiltag handler om de ting, du kan gøre for at rette op på en løsning, der har en indbygget risiko – typisk dem, der er markeret med gul i tabellen ovenfor. 

Hvis du f.eks. arbejder med følsomme personoplysninger på papir, er det ikke godt at have dem liggende på et skrivebord natten over. Heller ikke derhjemme. Der er en risiko for, at andre, der ikke har noget med opgaven eller projektet at gøre, kan se oplysningerne. Alene transporten af papirerne fra universitetet til dit hjem indebærer en risiko for at miste dem, hvis f.eks. din taske bliver stjålet, eller du glemmer den i bussen.  

Kompenserende tiltag 1: Transportér ikke dine data nogen steder hen, men opbevar dem i stedet i et aflåst skab på din undervisers kontor, når du ikke arbejder med dem. Eller du kan evt. scanne dokumenterne ind og have de digitale udgaver liggende et sikkert sted, så du f.eks. kan arbejde med dem derhjemme.  

Kompenserende tiltag 2: Anonymiser eller pseudonymiser dine data. Så vil identiteten af de deltagende personer være bedre beskyttet.  

____________________________________________________________

 

Literature.png  Anonymisering og pseudonymisering

Anonymisering og pseudonymisering er metoder til at beskytte de personer, hvis data du behandler. GDPR og den danske databeskyttelseslov forholder sig kun til data, der ikke er anonymiserede, og hvor de personer, der indgår, altså er identificerbare. Hvis man med andre ord anonymiserer sine data, er de ikke længere omfattet af GDPR og de krav til opbevaring, det medfører. Men man skal passe på, for pseudonymisering er ikke det samme som anonymisering, og pseudonymiserede data ER omfattet af GDPR.

Men hvad er forskellen?  

  Pseudonymisering

Ved en pseudonymisering fjerner du direkte identifikatorer i dine data. Det kan f.eks. være navn eller CPR-nummer, og du erstatter dem med et pseudonym – dvs. et nummer eller en kode. På en liste, du opbevarer et andet sted end data, kobler du navn og pseudonym sammen, sådan at du kan finde tilbage til en person, der optræder i datasættet, hvis du f.eks. har behov for at kontakte vedkommende. 

Pseudonymisering er anbefalet som en ekstra sikkerhed, mens man arbejder med data og evt. deler dem med andre i projektgruppen, men man skal stadig betragte dem som data, man skal sikre mod uvedkommendes adgang. Kun ved fuldstændig anonymisering kan man dele data frit uden deltagernes samtykke.

  Anonymisering

Ved anonymisering erstatter man typisk også den direkte identifikator med en kode, og her har man ikke en liste, hvor de kobles sammen med navnet. Man kan dermed IKKE finde tilbage til den eller de personer, der optræder i datasættet. Ingen må kunne identificere personerne i et anonymiseret datasæt – heller ikke den, der har skabt datasættet. En tommelfingerregel er, at man heller ikke må kunne genkende sig selv, hvis man optræder i datasættet. Men det er ikke altid nok bare at erstatte navn og CPR-nummer med en kode. For at forhindre identifikation ved at kombinere datasættet med andre tilgængelige informationer kan du ved anonymisering også vælge at ændre i dataenes værdier. Det kan f.eks. ske ved, at du i stedet for personernes alder erstatter alderen med kategorier (0-9, 10-19, 20-29 osv.). Dette fjerner noget information fra datasættet, men til gengæld er identifikationen gjort sværere. For at et datasæt kan siges at være anonymt, må ingen kunne identificere deltagerne i datasættet – heller ikke med ulovlige midler.

Det er en svær øvelse at anonymisere data korrekt, så spørg din underviser eller vejleder til råds.

Se denne korte video, der forklarer forskellen mellem pseudonymisering og anonymisering. Videoen er på engelsk.

I videoen omtales 'Trump protection methods' (2:30), der henviser til en lov om "data protected against the unauthorised processing and disclosure of personal data", som blev vedtaget i USA under Trumps præsidentperiode.

 

____________________________________________________________

 

COBL_onlinediscussion_40x40px_2017_6-1.png  Refleksionsøvelse

Reflekter over følgende spørgsmål:

  • Hvordan vil du klassificere dine egne data, og hvilke risici kan du identificere i forbindelse med håndteringen af dem?
  • Hvad kan det betyde for dit valg af lagring af data, at du f.eks. indsamler følsomme persondata i form af interviews gemt som lydfiler?
  • Hvad skal du være opmærksom på?

Opgaver på KUnet

Gå ind på din studieside på KUnet, åbn “studieinformation”, og svar på følgende spørgsmål.

  1. Hvor finder du informationen om indsamling og håndtering af persondata?
  2. Åbn siden om indsamling og håndtering af persondata. Hvor finder du en samtykkeblanket?
  3. Læs samtykkeblanketten. Hvornår vil du bruge blanketten i et projekt?
  4. Forestil dig, at du arbejder i en gruppe og vil håndtere persondata. For at kunne håndtere persondata i et gruppeprojekt har du bruge for en blanket til fælles dataansvar. Hvor på KUnet finder du blanketten til fælles dataansvar?
  5. Når du begynder på at skrive dit bachelorprojekt eller din kandidatopgave, vil du have brug for at lære mere om forskningsdatamanagement. Hvor på KUnet kan du finde mere information om forskningsdatamanagement for studerende? 

____________________________________________________________

 

COBL_fieldtrip_40x40px_2017_8.png  Hvis du vil vide mere

KUnet > Studieinformation > [Vælg din studieportal] > Planlæg dit studie > Regler og dispensationer > Sådan indsamler og håndterer du persondata 

På studieinformationssiderne finder du: 

  • Reglerne for indsamling og opbevaring af persondata. 
  • Samtykkeblanketter, der over for deltagerne beskriver, hvordan du har tænkt dig at arbejde med deres data. 
  • Den blanket, du skal underskrive, hvis du indsamler persondata som led i et gruppeprojekt. 
  • Tilladelsesblanketter, som din vejleder skal underskrive, hvis du arbejder med data indsamlet fra f.eks. hospitaler. 
  • En vejledning til opsætning af OneDrive, som er der, vi anbefaler, at du opbevarer alle ikke-fortrolige data, blanketter og aftaler.
  • Information om dit personlige T-drev, som er der, vi anbefaler, at du opbevarer fortrolige data.

Hvordan skal du behandle persondata? 

Som studerende på KU er det dit ansvar, i samarbejde med din vejleder, at indsamle og opbevare persondata korrekt. For at du kan gennemføre et projekt omfattende persondata uden at overtræde persondatalovgivningen er det vigtigt, at du forstår, hvordan du overholder reglerne og arbejder ansvarligt med andre menneskers oplysninger. 

Klik her for at åbne GDPR for studerende. Links to an external site. 

____________________________________________________________