Statistikk og Simulering

Økt 4. Snitt og spredning

Introduksjon i timen

5.1. Introduksjon i timen

5.1.1. Gjennomsnitt

Oppgåve 5.1 (Diskusjon) Sjå på ein tjuesida terning (D20). Kva kan me seia om sannsynsfordelinga for eit kast med terninga?

Oppgåve 5.2 (Socrative) Tenk deg at me kastar terninga (D20) mange gongar. Kva ventar du at terninga gjev i gjennomsnitt?

Oppgåve 5.3 (Socrative) Ta eit kast med fem terningar (5D20). Rekn ut gjennomsnittet over terningane.

Oppgåve 5.4 (Diskusjon) Samanlikn dei to gjennomsnitta frå dei to spørsmåla over. Kvifor er dei ulike?

Oppgåve 5.5 Kva regel har de brukt for å koma fram til utvalsgjennomsnittet (Øving 5.2).

Oppgåve 5.6 Kva regel har de brukt for å koma fram til populasjonsgjennomsnittet (Øving 5.3).

5.1.2. Andre sannsynsfordelingar

Definisjon 2 (Uniform sannsynsfordeling) Ein stokastisk variabel X har uniform sannsynsfordeling dersom alle moglege utfall x har same sannsyn P(X = x).

Oppgåve 5.7 (Socrative) Sann/Usann: Kastet med ei D20 er uniformt fordelt.

Oppgåve 5.8 (Socrative) Sjå på eit kast med to vanlege terningar (2D6). Sant/Usant: Talet på augo totalt på terningane er uniformt fordelt.

Oppgåve 5.9 (Socrative) Kva er (populasjons)gjennomsnittet for eit slikt kast med 2D6?

Oppgåve 5.10 Kva regel har de brukt for å koma fram til gjennomsnittet for 2D6 (over)?

5.1.3. Standardavvik og varians

Me skal sjå på to ulike eksperiment.

1.
Du kastar ei terning (D6). Lat resultatet vera den stokastiske variabelen X.
2.
Du kastar to terningar (2D6) og deler på to. Lat resultatet vera den stokastiske variabelen Y .

Oppgåve 5.11 (Socrative) Kva er utfallsrommet for X?

Oppgåve 5.12 (Socrative) Kva er utfallsrommet for Y ?

Oppgåve 5.13 (Socrative) Kva er gjennomsnittet for X? Dette vert òg kalt forventingsverdien E(X).

Oppgåve 5.14 (Socrative) Kva er gjennomsnittet for Y ? (Dvs. forventingsverdien E(Y ).)

Lat oss no generera utval for X og Y . Nedanståande matlabkode gjer kvart eksperiment 25 gongar, lagrar resultata i tabellane x og y, og plottar dei.

1clear 
2n=25 
3x = ceil(6*rand(1,n)) 
4 % simulate n experiments with 1D6 
5y = (ceil(6*rand(1,n)) + ceil(6*rand(1,n)))/2 
6 % simulate n experiments with 2D6/2 
7t=1:n 
8plot(t,x,t,y,’LineStyle’,’none’, ’Marker’,’diamond’)

Oppgåve 5.15 Sjå på dei to datasetta og teikna eit histogram for kvart datasett.

Oppgåve 5.16 Korleis vil du samanlikna dei to fordelingane? Kva legg du merke til? Kva skilnader ser du?

Definisjon 3 (Utvalsvarians) Utvalsvariansen for observasjonane x1,x2,,xn er definert som

s2 = 1 n 1 i=1n(x i x̄)2. (5) 

Legg merke til at (xi x̄) er avstanden mellom observasjonen og gjennomsnittet. Ved å kvadrera får me alltid eit positivt tal. Stor spreidning i utvalet tyder at mange av desse kvadratavstandane er store. Det er forvirrande at me deler på n 1. Dersom hadde delt på n, so hadde me sagt at s2 er gjennomsnittet av kvadratavstandane, men det viser seg at n 1 gjev eit betre mål.

Definisjon 4 (Utvalsstandardavvik) Kvadratroten av variansen,

s = 1 n 1 i=1n(xi x̄)2, (6) 

vert kalt for standardavviket.

Oppgåve 5.17 Rekna ut variansen og standardavviket for utvalet x1,x2,,xn.

Oppgåve 5.18 (Socrative) Kva er variansen for y1,y2,,yn.

Oppgåve 5.19 (Socrative) Kva er standardavviket for y1,y2,,yn.

På same måte som me skil mellom utvals- og populasjonsgjennomsnitt, so skil me òg mellom utvals- og populasjonsvarians, og tilsvarande for standardavvik.

Definisjon 5 (Populasjonsvarians) Populasjonsvariansen for ein variabel X med moglege utfall x1,x2,,xn er definert som

σ2 = i=1nP(X = x i)(xi x̄)2. (7) 

Standardavviket er σ = σ2.

Oppgåve 5.20 Rekna ut variansen og standardavviket for Y .

Oppgåve 5.21 (Socrative) Kva er variansen for X.

Oppgåve 5.22 (Socrative) Kva er standardavviket for X.