Bachelor i Datavidenskab: Uddannelsens opbygning

Obligatorisk
Valgfag

Bachelor i Datavidenskab: kursusbeskrivelser

Introduktion til sandsynlighedsteori og statistik

Sandsynlighedsteorien beskæftiger sig med en matematisk beskrivelse af tilfældige systemer. Et af kursets formål er at introducere den studerende til dette område med fokus på fundamentale egenskaber for stokastiske variable, som f.eks., deres middelværdi og varians. Et andet formål er at blive fortrolig med et udvalg af standardfordelingerne inden for sandsynlighedsteori og statistik, og udføre statistiske test for hypoteser for givne modeller. Derudover, giver kurset en introduktion til programpakken R som vil blive anvendt til simulation af stokastiske variable og beregning af statistiske tests.

Introduktion til datavidenskab

Kurset fokuserer på gradvist at blive fortrolig med arbejdsgangen i dataundersøgelser i et datavidenskabsprojekt samt implementering af denne arbejdsgang. Kurset vil kombinere elementer af programmering med undersøgleser af to konkrete datasæt som bruges gennem hele semesteret for at illustrere metoderne til at visualisere, bearbejde og undersøge data.

Parallelt med dette vil der køre et spor, hvor indhold og muligheder i datavidenskab bliver perspektiveret. Anvendelsesområder for datavidenskab, den samfundsmæssige kontekst og den forventede betydning for virksomhed og samfund kan alle være emner i denne del af kurset, såvel som omtale af jobmuligheder for en kandidat i datavidenskab. Emnerne vil blive dækket gennem gæsteforedrag med personer med indsigt i datavidenskab, gennem præsentation af projekter hvor datavidenskab anvendes og eventuelt gennem virksomhedsbesøg.

Matematisk analyse og konveks optimering

Kurset er en introduktion til matematisk analyse med fokus på metoder og teknikker specielt med henblik på optimering. Vi begynder med en kort introduktion til lineær optimering i form af Fourier-Motzkin elimination. Derefter bevæger vi os i retning af konvekse mængder. Undervejs introduceres euklidiske rum og basal matrixregning. Differentialregning i en og flere variable behandles med speciel fokus på kædereglen og Newtons metode. I sidste del af kurset fokuseres på konvekse funktioner af flere variable og konveks optimering bl.a. Karush-Kuhn-Tucker betingelserne. Optimeringsdelen vil blive illustreret med eksempler på anvendelser i machine learning.

Matematisk statistik

Kurset giver en introduktion til fundamentale begreber og ræsonnementsmåder i matematisk statistik. Du vil lære at analysere data ved hjælp af klassiske parametriske metoder og få et indblik i inferens baseret på simulationer. Vægten ligger på at opnå en konceptuel forståelse for statistisk modellering og inferens. Vi vil bruge det programpakken R til at analysere data og til stokastiske simulationer, der illustrerer ideerne bagved de statistiske metoder.

Introduktion til programmering med videnskabelige anvendelser

Kurset giver en introduktion til programmering med videnskabelige applikationer. Programmeringsbegreber og teknikker introduceres ved hjælp af programmeringssproget Python. Begreberne vil desuden blive illustreret i andre programmeringssprog.

Blandt grundlæggende programmeringsbegreber omtales: datatyper, operatorer, variable, kontrolstruktur, betingelser, løkker, funktioner, rekursion, scope, undtagelser.

I kurset omtales også Objekt Orienteret Programming: abstracte datatyper, klasser, nedarvning, indkapsling; Grundlæggende Algoritmiske Teknikker: sortering, binær søgning, dynamisk programmering; og Systematisk Udvikling af Programmer: test og fejlfinding.

Endelig vil kurset også omtale: fil-baseret input/output, numerisk analyse, funktionel programmering og Scientific Computing ved hjælp af standard pakker i Python.

Numerisk lineær algebra

Et introducerende kursus i lineær algebra med fokus på anvendelser, numeriske metoder og praktiske algoritmer til løsning af lineære ligninger. Kurset kører sideløbende med kurset Introduktion til Programmering med Videnskabelige Anvendelser og programmeringssproget python benyttes som platform. Ved kursets afslutning forventes den studerende at kunne anvende grundlæggende begreber i lineær algebra og relatere dem til stabile numeriske algoritmer i numerisk lineær algebra.

Causal inference

Med udgangspunkt i teorien erhvervet gennem forudgående kurser i sandsynlighedsteori og statistik i uddannelsen analyseres kausale spørgsmål baseret på observationer specielt i økonomisk kontekst. Ved kursets afslutning forventes den studerende at kunne identificere kausale spørgsmål, formulere kausale spørgsmål matematisk og estimere modeller ved maximum likelihood og udlede egenskaber af estimatorer og tests.

Introduktion til Statistical Learning og Machine Learning

Kurset indeholder fundamentale læringsalgoritmer i machine learning (automatisk læring) delt op på henholdsvis supervised learning og unsupervised learning. Blandt supervised learning metoderne omtales grundlæggende klassifikation, træmodeller og support vector machines. Blandt de unsupervised learning metoder berøres principalkomponentanalyse (PCA), clustering og hierarchical clustering. Ved kursets afslutning forventes den studerende at kunne redegøre for og anvende fundamentale algoritmer i machine learning både for supervised og unsupervised learning.

Grundlæggende algoritmer og datastrukturer

Deltagerne vil i kurset blive præsenteret for algoritmer som model for sekventielle beregningsprocesser og som grundlag for formelle korrekthedsbeviser og analyse af ressourceforbrug af beregninger. Desuden vil man få detaljeret viden om flere konkrete implementeringer af grundlæggende datastrukturer, grafalgoritmer og anvendelser af algoritme-design-paradigmer. Deltagerne vil også få erfaring med at implementere og evaluere algoritmers ydeevne på simple algoritmiske problemer.

Introduktion til databaser

Deltagerne vil i kurset få indsigt i teori og praksis for relationelle databaser samt praktisk erfaring med anvendelse af et moderne databasesystem på basalt niveau.

Implementering og anvendelser af databaser

Kurset diskuterer relationsalgebra som et eksempel på teorien bag databasesystemer og basale teknikker for forespørgselsoptimering. Avancerede teknikker for samtidige transaktioner i et DBMS (database management system) bliver behandlet. Vi studerer distribuerede databaser, og algoritmer for processering af distribuerede transaktioner. Kurset kommer også ind på data warehouses og online analytical processing såvel som stream databaser. Vi introducerer aktuelle alternativer til relationelle DBMSer (NoSQL).

Modellering og Optimizing Decision Problems

Kurset omhandler optimeringsproblemer, som kan modelleres i matematiske modeller med beslutningsvariable. Algoritmerne til løsning eller approksimation af disse optimeringsproblemer berøres, herunder heuristikker, heltalsoptimering, simulation og Markov beslutningsprocesser. Der lægges vægt på hands-on experience gennem datasæt og øvelser under brug af optimeringssoftware. Ved kursets afslutning forventes den studerende at kunne opstille optimeringsmodeller og anvende kursets algoritmer på praktiske problemer under inddragelse af optimeringssoftware.

Dataprojekt

<ingen oplysninger på nuværende tidspunkt>

Deep learning

Kurset omhandler centrale emner i uddannelsen: Den grundlæggende teori for neurale netværk og deres træning.

Undervejs inddrages praktiske problemer som f.eks. tale- og billedgenkendelse. Forskellige typer af netværk berøres, herunder convolutional neural networks og recurrent neural networks. Specielt vil kurset introducere reinforcement learning i kombination med deep neural networks i beslutningsprocesser. Ved kursets afslutning forventes den studerende at kunne anvende teknikker for design og træning af deep neural networks i realistiske problemstillinger.

Videnskabsteori og etik

Videnskabsteori i kontekst af datavidenskab med problemstillinger fra machine learning og kunstig intelligens, samt problemstillinger relateret til indsamling og anvendelse af data fra store puljer af data, der opbygges på basis af individers adfærd fx. kørselsmønstre, telefoni, datatransport eller andet.

Ved kursets afslutning forventes den studerende at kunne reflektere kritisk over datavidenskabens rolle og ansvar i forhold til forskning, erhverv, samfund og kultur.

Bachelorprojekt

Her kan den studerende fordybe sig i et emne inden for datavidenskab. Emnet vælges i samarbejde med en underviser.