Statistikk og Simulering

Økt 11. Confidence Intervals

Konfidensintervall

12.2. Konfidensintervall

Definisjon 14 Dersom x̂ er ein estimator for x, so kallar me standardavviket σ åt x̂ for standardfeilen åt estimatoren, og skriv

S.E.(x̂) = σ.

Sats 2 Feilraten p̂ er ein estimator for feilsannsynet p, og standardfeilen er gjeve som

S.E.(p̂) = p(1 p) n ,

når feilraten er rekna over n forsøk. Ein estimator for standardfeilen er

S.E.̂(p̂) = p ̂ (1 p ̂ ) n .

Dersom me tek fylgjande intervall rundt punktestimatoren p̂

(p̂ S.E.̂(p̂),p̂ + S.E.̂(p̂))

går det an å visa at sannsynet for at intervallet omfattar parameteren p er cirka 68%. Meir presist

P(p > p̂ + S.E.̂(p̂)) = 0.1587 (24)  P(p̂ S.E.̂(p̂) < p < p̂ + S.E.̂(p̂)) = 0.683 (25)  P(p < p̂ S.E.̂(p̂)) = 0.1587 (26) 

Me kaller intervallet for eit 68.3% konfidensintervall for dekodingsfeilssannsynet p. Talet 68.3% konfidensnivået.

Merk at det er intervallet som er stokastisk, medan parameteren p er konstant (men ukjent). Me kan difor ikkje tala om sannsynet for at p ligg i intervallet.

Oppgåve 12.5 Using your simulation results with m = 100 tests, calculate a 68.3% confidence interval for the decoding error probability pd when the [7, 4, 3] Hamming code is used on BSC(p).

Oppgåve 12.6 Redo Exercise 12.7 with m = 20 and m = 500. Compare the three confidence intervals. What do you see?

The confidence level of 68.3% is very low, and we usually want more confidence. A β = 1 2α confidence interval is given by

(p̂ zαS.E.̂(p̂),p̂ + zαS.E.̂(p̂)),

der me finn zα i Matlab, vha. 

1zalpha = icdf(’norm’,-alpha,0,1) Fylgjande verdiar er mykje brukt og kan vera nyttige å hugsa:
1.
z0.1586 = 1 for the 68.3% confidence interval
2.
z0.025 = 1.96 for the 95% confidence interval
3.
z0.023 = 2 for the 95.4% confidence interval
4.
z0.001 = 3 for the 99.8% confidence interval

Me skal drøfta konstanten zα vidare når me kjem til normalfordelinga og sentralgrensesatsen i neste økt.

Oppgåve 12.7 Using your simulation results with m = 100 tests, calculate a 95% confidence interval for the decoding error probability pd when the [7, 4, 3] Hamming code is used on BSC(p).

12.2.1. One pitfall to avoid

Consider the following to statements:

1.
When you are going to calculate a 95% confidence interval for p, the probability is 95% that you get an interval which encloses p.
2.
When you have calculated a 95% confidence interval (l,u) for p, the probability is 95% that l p u.

Oppgåve 12.8 Compare the two statements above. Are they equivalent or not? Is the first statement true? Is the second statement true?