Studerende fortæller

Mød studerende, som fortæller om bacheloruddannelsen i machine learning og datavidenskab:

Lige nu er en baby er bedre til at lære sprog end en computer

Computere er stadig ret dårlige til at forstå menneskesprog. Som Ph.d-studerende arbejder 27-årige Yova Kementchedjhieva på at ændre dette – det er nemlig nødvendigt, hvis flere mennesker skal have adgang til de værktøjer, som er blevet en selvfølgelig del af vores hverdag.

PhD student Yova Kementchedjhieva, Machine Learning og datavidenskab, Københavns Universitet — Foto: Yova Kementchedjhieva

“Straight children play best”. Sådan ser resultatet ud, når man beder Google Translate oversætte: ”Lige børn leger bedst”. Og hvem kender ikke lignende ubrugelige oversættelser. Det er sprogteknologien NLP, der her er i spil.

NLP – der står for Natural Language Processing – er det felt inden for kunstig intelligens, der handler om at lære computere at forstå og producere sprog. De fleste af os er i kontakt med NLP-teknologi i dagligdagen – ikke kun i form af Google Translate, men også som chatbots, email-filtre, autokorrektur og digitale assistenter som Siri og Alexa.

Men computerne har endnu meget at lære, som oversættelsen ovenover viser. For maskinerne har stadig svært ved sådan rigtigt at forstå menneskesprog, forklarer Yova Kementchedjhieva, der som Ph.d-studerende på Datalogisk Institut forsker i NLP:

”Når Google Translate ofte giver os den slags uduelige oversættelser, er det fordi computeren kun anvender en overfladisk viden om sprogene og egentlig ikke forstår det indhold, den oversætter på det abstrakte niveau, som vi mennesker gør,” siger hun.

Computere skal ”tænke” som mennesker

Målet inden for NLP-forskning er derfor netop at give computere en stærkere forbindelse til den virkelige verden, så de bliver i stand til at lære og ræsonnere mere ligesom mennesker.

”Computeren kan efterabe menneskeadfærd, men den lærer og ræsonnerer ikke på samme måde som et menneske. En baby behøver stadig langt mindre input for at lære sprog, end en computer gør. Det håber jeg, vi kan ændre. Forestillingen om computere, der ”tænker” som mennesker, får måske dystre sci-fi-agtige scenarier frem på nethinden hos nogle. Men mange af de opgaver, computere allerede løser for os, kan blot løses bedre, hvis vi lærer at træne computerne til at forstå vores sprog på et mere nuanceret plan,” siger Yova.

Det var først og fremmest en interesse for sprog, der førte 27-årige Yova Kementchedjhieva til NLP-forskningsfeltet. Efter en bachelorgrad i lingvistik og en master i NLP på University of Edinburgh, kom hun til Københavns Universitet, hvor hun nu er ved at gøre sin ph.d. færdig.

”Jeg synes det er ret cool at stå med et problem, hvor du både skal bruge algoritmer og lægge sproglige puslespil. Det er teoretisk og anvendeligt på samme tid. Du er nødt til at forstå et sprogs egenskaber for at kunne fodre computeren, men du skal også forstå, hvad computeren kan og ikke kan. Du arbejder i krydsfeltet mellem mennesketænkning og computerberegning – og forsøger så at bygge bro mellem de to,” siger Yova.

Hendes fokus er såkaldte multilingual NLP-metoder, hvor en central udfordring er at udvikle algoritmer, der virker med meget små mængder data.

”Det meste NLP er centreret om det engelske sprog, og det meste data er derfor på engelsk. Men vi vil også gerne udvikle redskaber på andre sprog. Mange vigtige stemmer rundt om i verden har i dag ikke adgang til NLP-værktøjer, der bliver mere og mere uundværlige, fordi deres sprog ikke rangerer højt nok til at blive prioriteret. Selv på et sprog som dansk er et værktøj som autokorrektur meget dårligere, end det er på engelsk. Så der er millioner af mennesker, der kan få gavn af bedre NLP-systemer. På den måde kan NLP have en demokratiserende effekt,” slutter Yova.

Thomas vil løse verdens komplicerede problemer

At forstå machine learning har krævet hårdt arbejde for Thomas Christensen, der nu glæder sig til at bruge sin viden til at løse nogle af verdens problemer. Nøglen til det hele har været det stærke sociale liv på studiet.

Kunstskøjteløbere, svømmetrænere, gamere og festaber. Det er bare et udpluk af de mange personligheder, som Thomas Christensen har mødt på sin uddannelse.

"Det sociale er helt klart det bedste ved at studere på Datalogisk Institut (DIKU). Jeg synes virkelig, at der er plads til alt og alle. Det er sjældent, man ser et socialt miljø, som er så åbent og accepterende", siger Thomas.

Og det er noget han har sat stor pris på. Han er del af den første årgang på bacheloruddannelsen i machine learning og datavidenskab. Et studie som kan være hårdt arbejde en gang i mellem. "Men det sociale sammenhold er klart noget som har hjulpet mig igennem de stressede dage", siger Thomas.

For ham har det fælles liv på DIKU (Datalogisk Institut på Københavns Universitet), med foreninger der går på tværs af årgange og uddannelser, været afgørende for, at han er faldet godt til. Du kan læse mere om foreningerne her >>

Lærer mere

Uddannelsen i machine learning og datavidenskab har ifølge Thomas Christensen den mest optimale kombination af matematik og programmering:

"Jeg elsker studiet, men det har også krævet en noget større arbejdsbyrde, end da jeg gik i gymnasiet. Dengang kom alting rimelig let til mig. Her føler jeg virkelig, at jeg lærer noget spændende hver uge", siger han og fortsætter:

"Den største overraskelse, jeg har haft indtil videre, er mængden af teori, der skal til for at forstå machine learning og datavidenskab. Studiet rammer dog en god balance imellem at være udfordrende, men ikke alt for krævende."

På studiet er der også en del valgfrihed til at supplere med kurser i fx statistik, etik og datalogi.

Vil løse spændende og komplicerede problemer

Mulighederne for at præge uddannelsen i forskellige retninger passer Thomas Christensen rigtig godt. Han har nemlig ikke låst sig fast på et bestemt område, som han vil arbejde inden for endnu.

"Jeg ser mere min uddannelse som en vej til at arbejde med de spændende og komplicerede problemer, vi bruger kunstig intelligens til at løse. Ikke en lige vej til et bestemt job."

Og i en verden, der i stigende grad efterspørger eksperter i datavidenskab og machine learning, så kommer der hele tiden nye og spændende områder, hvor Thomas Christensen kan bruge sin uddannelse til at løse problemer:

"Alle steder der bruges data, vil jeg kunne bidrage med noget, og derfor kan jeg også vælge at gøre karriere, der hvor jeg føler, jeg kan have indflydelse. Det er vigtigt for mig."