3.3 Flere fordelinger, og simple statistiske mål
Ovenfor har vi simuleret fra to kontinuerte fordelinger: den uniforme fordeling, og normalfordelingen (i øvelserne 3.2 og 3.3). I kender da til flere fordelinger, såsom binomialfordelingen og Poisson-fordelingen. Disse to fordelinger er diskrete, dvs., der findes kun endeligt eller tælleligt mange mulige udfald.
Husk, at Binomialfordelingen Bin(n,p) kan tolkes som fordelingen på antal af “succes” i et eksperiment, der gentages n gange, og som kun giver udfald “succes” eller “fiasko”. I hver eneste eksperiment er sandsynligheden for succes lig med p. I R hedder binomialfordelingens parameter size
(n) og prob
(p). For at simulere 5 udfald fra en Bin(10,0.7)-fordeling skriver vi
rbinom (5, size = 10, prob = 0.7)
## [1] 7 5 9 6 8
eller bare rbinom(5, 10, 0.7)
.
En binomialfordelt stokastisk variabel X∼Bin(n,p) har middelværdi EX=np og varians VarX=np(1−p). I eksemplet ovenover med n=10 og p=0.7 har vi altså EX=7 og VarX=2.1. Disse værdier kan sammenlignes med de empiriske statistike mål, gennemsnittet og stikprøvevariansen, som fås i R ved funktionerne mean
og var
.
Vi gemmer først vores udfald i en variabel:
rbinom (5, size = 10, prob = 0.7)
x <- x
## [1] 7 6 7 8 5
mean(x)
## [1] 6.6
var(x)
## [1] 1.3
høv, det ligger nok noget ved siden af de teoretiske værdier!
Øvelse 3.4
Gentag eksperimentet ovenover, om gennemsnittet og variansen af binomialfordelte udfald, fem gange, og notér resultaterne. Hvad skal der ændres for at komme tættere på de teoretiske værdier?
Poisson-fordelingen Pois(λ) bruges tit som model for tilfældig antal af enheder, såsom kliks i en Geigertæller. Hvis en stokastisk variabel X har en Pois(λ)-fordeling så gælder der, at EX=VarX=λ. Der simuleres fra en Poisson-fordeling ved R-funktionen rpois
, og parameter-argumentet hedder der lambda
.
rpois (5, lambda = 10)
x <- x
## [1] 9 11 9 7 6
mean(x)
## [1] 8.4
var(x)
## [1] 3.8