Underviservejledning til lektionen Hvordan kan vi bruge machine learning?

PDF version Download PDF version

Formål 
Lektionen har til formål at introducere den studerende til machine learning som den centrale teknologi bag kunstig intelligens og er tænkt som et oplæg til en diskussion om: ”Hvordan bruger vi ML i faget?”.


Målbeskrivelse

Når de studerende har gennemført forløbet, forventes det, at de:

•    kan nævne eksempler på, hvad machine learning kan bruges til i videnskabelig sammenhæng.
•    kan beskrive de grundlæggende trin, de skal gennemgå for at træne en ’supervised machine learning-model’.
•    kan forklare forskellen på unsupervised, supervised og reinforcement learning.
•    kan forklare, hvad ’overfitting’ er, samt hvordan de kan opdage og minimere overfitting.
•    kan reflektere over, hvilke typer af forskningsspørgsmål inden for deres eget fagområde der kan belyses ved at bruge en supervised machine learning-model.


Hvilke dannelsesspørgsmål behandler denne lektion?

•    Hvordan har digitaliseringen påvirket det faglige/professionelle felt, jeg befinder mig i?
•    Hvordan fungerer relevante digitale teknologier som eksempelvis algoritmer, søgemaskiner og machine learning?
•    Hvordan kan anvendelse af (fagligt) relevante digitale teknologier påvirke og forme kontekster (personlige, faglige, samfundsmæssige)?
•    Hvad kan jeg anvende digitale teknologier til (eksempelvis inden for mit fag)?
•    Hvilke kompetencer, handlemuligheder og problemløsningsstrategier kan jeg opnå ved anvendelse af digitale teknologier (eksempelvis inden for mit fag)?
•    Findes der eksempler på, at udvikling af algoritmer, kunstig intelligens og machine learning har påvirket mit fag?


Indholdsbeskrivelse

Lektionen introducerer de studerende til ML. Der gives eksempler på anvendelse af ML i videnskabelig sammenhæng. ML bliver beskrevet ud fra de tre grundelementer data, model og ML-algoritme. Derudover beskrives de tre læringsscenarier unsupervised, supervised og reinforcement learning. Hovedindholdet i lektionen er et videoeksempel, der gennemgår, hvordan man kan bruge supervised ML til at træne en model til at segmentere blodårer i retina-billeder. Overfitting og bias illustreres i videoen. Lektionen indeholder en afsluttende refleksionsøvelse, hvor de studerende skal formulere en fagrelevant problemstilling som et ML-problem.


Format og varighed

Lektionen er primært videobaseret med en afsluttende øvelse, der kan løses individuelt eller i grupper.
Lektionen er estimeret til ca. 20 min. varighed, ekskl. refleksions- og arbejdsspørgsmålene.


Målgruppe

Bachelorstuderende på hele Københavns Universitet.


Hvornår anbefales denne lektion inddraget i undervisningen? 

Fagligt vil lektionen primært være relevant i forbindelse med undervisning i metoder. Hvis det vurderes, at machine learning vil være en relevant metode inden for faget, bør lektionen inddrages tidligt, så de studerende har mulighed for at tilegne sig mere viden, inden de skal anvende machine learning.


Hvordan anbefales denne lektion inddraget i undervisningen?

Den nyeste forskning om studerendes forberedelsesmønstre peger på, at der er større sandsynlighed for, at studerende engagerer sig i de foreslåede forberedelsesaktiviteter, hvis de oplever disse aktiviteter som relevante og kan se tegn på synlig læring. På den baggrund foreslås det, at aktiviteterne i denne lektion rammesættes tydeligt for de studerende, så de kan se formålet med dem i forhold til opnåede kompetencer og i forhold til, hvordan forberedelsesaktiviteten relaterer til, hvad der foregår i undervisningen. Herunder gives der nogle generelle overvejelser samt nogle forslag til refleksions- og arbejdsspørgsmål til inspiration.


Inden for nogle fag vil det være oplagt at bruge lektionen i forbindelse med projektarbejde, hvor de studerende kan bruge det som springbræt til at formulere et projekt, hvor ML indgår. I den forbindelse vil det være relevant at inddrage fagrelevante eksempler på anvendt ML, gerne fra bachelorprojekter eller kandidatspecialer. Nedenstående refleksions- og arbejdsspørgsmål kan tjene som grundlag for inspiration hertil:

•    Formuler et spørgsmål inden for dit fagområde, der kræver analyse af en stor mængde data. Du skal fokusere på, hvad det kan være spændende at svare på, ikke hvordan du vil svare på det. Det kan f.eks. være:
•    Har dialekt indflydelse på den hjælp, du modtager ved telefonsupport?

•    Beskriv, hvilke data og annoteringer der skal bruges til at svare på dit spørgsmål. 
•    Data: Lydoptagelser af telefonsupport.
•    Annoteringer: Klassifikation af dialekt. Vurdering af hjælpens kvalitet.

•    Overvej, hvordan du kan måle, om en ML model kan løse annoteringsproblemet. 
•    Klassifikation af dialekt: Hvis modellen rangordner mulige dialekter efter, hvilken der er mest sandsynlig, kan man tælle, hvor ofte den rigtige er med i top 3.
•    Vurdering af hjælpens kvalitet: Hvis modellen forudsiger god/dårlig, kan man tælle, hvor ofte forudsigelsen er korrekt.

•    Undersøg, om der findes tilgængelige værktøjer, der kan løse annoteringsproblemet
•    Et godt sted at starte er https://github.com/heartexlabs/awesome-data-labeling Links to an external site.


Inden for andre fag vil lektionen egne sig bedre til en mere grundlæggende diskussion om, hvordan ML kan bruges i faget med fokus på, hvilke nye forskningsmuligheder ML åbner for. Her drejer det sig særligt om, at de studerende skal lære at være åbne for ny viden og nye værktøjer og øve sig i at se, hvordan de kan udnytte det i deres eget arbejde. 


Kilde – hvem har produceret indholdet?

Lektionen er produceret af Københavns Universitet som en del af Københavns Universitets læringsressourcer til digital dannelse, 2023.

Fagansvarlig:
•    Silas Nyboe Ørting, postdoc, Datalogisk Institut 


Lektionens relation til andre lektioner og/eller forløb, hvis relevant
Denne lektion udgør anden del af en naturligt sammenhængende, todelt lektion om kunstig intelligens og maskinlæring. Første del hedder Hvordan kan vi bruge machine learning?

Derudover er lektionen først og fremmest relevant for lektionerne under temaerne ”Digital videnskabelig informationssøgning” og “Digital refleksion”, særligt i forhold til bias. Forløbet Elements of AI giver endelig en mere dybdegående forståelse af kunstig intelligens.