3.3 Flere fordelinger, og simple statistiske mål

Ovenfor har vi simuleret fra to kontinuerte fordelinger: den uniforme fordeling, og normalfordelingen (i øvelserne 3.2 og 3.3). I kender da til flere fordelinger, såsom binomialfordelingen og Poisson-fordelingen. Disse to fordelinger er diskrete, dvs., der findes kun endeligt eller tælleligt mange mulige udfald.

Husk, at Binomialfordelingen \(Bin(n, p)\) kan tolkes som fordelingen på antal af “succes” i et eksperiment, der gentages \(n\) gange, og som kun giver udfald “succes” eller “fiasko”. I hver eneste eksperiment er sandsynligheden for succes lig med \(p\). I R hedder binomialfordelingens parameter size (\(n\)) og prob (\(p\)). For at simulere 5 udfald fra en \(Bin(10, 0.7)\)-fordeling skriver vi

rbinom (5, size = 10, prob = 0.7)
## [1] 7 5 9 6 8

eller bare rbinom(5, 10, 0.7).

En binomialfordelt stokastisk variabel \(X\sim Bin(n,p)\) har middelværdi \(\mathrm{E}X = np\) og varians \(\mathrm{Var} X = np(1-p)\). I eksemplet ovenover med \(n=10\) og \(p=0.7\) har vi altså \(\mathrm{E}X = 7\) og \(\mathrm{Var} X = 2.1\). Disse værdier kan sammenlignes med de empiriske statistike mål, gennemsnittet og stikprøvevariansen, som fås i R ved funktionerne mean og var.

Vi gemmer først vores udfald i en variabel:

x <- rbinom (5, size = 10, prob = 0.7)
x
## [1] 7 6 7 8 5
mean(x)
## [1] 6.6
var(x)
## [1] 1.3

høv, det ligger nok noget ved siden af de teoretiske værdier!

Øvelse 3.4

Gentag eksperimentet ovenover, om gennemsnittet og variansen af binomialfordelte udfald, fem gange, og notér resultaterne. Hvad skal der ændres for at komme tættere på de teoretiske værdier?

Poisson-fordelingen \(Pois(\lambda)\) bruges tit som model for tilfældig antal af enheder, såsom kliks i en Geigertæller. Hvis en stokastisk variabel \(X\) har en \(Pois(\lambda)\)-fordeling så gælder der, at \(\mathrm{E}X = \mathrm{Var} X = \lambda\). Der simuleres fra en Poisson-fordeling ved R-funktionen rpois, og parameter-argumentet hedder der lambda.

x <- rpois (5, lambda = 10)
x
## [1]  9 11  9  7  6
mean(x)
## [1] 8.4
var(x)
## [1] 3.8