∆ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Η Σηµειακή εκτιµητική δεν ποσοτικοποιεί την αβεβαιότητά µας για την άγνωστη παράµετρο. Παίρνουν µία τιµή και δεν γνωρίζουµε πόσο αβέβαιοι είµαστε για την τιµή αυτή. Σχεδόν πάντα, µε πιθανότητα 0, η εκτίµηση θα είναι ακριβώς ίση µε την πραγµατική τιµή της παραµέτρου. Κατασκευή ∆ιαστηµάτων Εµπιστοσύνης Ζητούµε LB ( X ) , UB ( X ) (LowerBound και UpperBound), τέτοια ώστε, η πιθανότητα P LB ( X ) < θ < UB ( X ) = 1 − a , συνήθως 95%, δηλαδή α=0,05. ∆εν αποκλείεται όµως, να ληφθεί και α=0,01 (99%) ή α=0,1 (90%) 95%=100(1-α)%. Παράδειγµα Άσκηση: Έχουµε X 1 , X 2 ,…, X v από κανονική κατανοµή N ( µ ,σ 2 ) , µε σ2 γνωστό. Ζητείται ένα διάστηµα εµπιστοσύνης για το µ, µε α=0,05 Λύση: Το α δεν έχει καµία σηµασία! =µ=X . Είναι γνωστό ότι µ Θεωρούµε την κατανοµή του. α/2 X i ~ N ( µ ,σ 2 ) και, δεδοµένου ότι το σ2 είναι γνωστό , σ2 X ~ N µ , . Είναι γνωστό v επίσης ότι z =
X −µ
σ
~ N ( 0,1)
-zα/2
α/2
0
α/2 zα/2 x
α/2
x v µ x − za σ x + za σ 2 2 v • Το µ αυτό είναι το πραγµαv τικό, όχι το δειγµατικό. • Από το συνολικό διάγραµµα πρέπει να «κόψουµε» µια ποσότητα α (εδώ 5%), για να µείνει το 1-α • επειδή η κανονική κατανοµή είναι συµµετρική, είναι το ίδιο αν «κόψουµε» ένα α/2 από κάθε πλευρά του γραφήµατος, οπότε πάλι παραµένει στο µέσο µία ποσότητα 1-α . x − µ P − za ≤ z ≤ z a = 1 − a ⇒ P − za ≤ ≤ za = σ 2 2 2 2 v = P z σ = P − za σ ≤ x − µ ≤ za σ ≥ µ − x ≥ − za σ a 2 2 2 v v v v 2 = P x − z σ =1− a P − za σ ≤ µ − x ≤ za σ ≤ µ ≤ x + za σ a 2 2 2 2 v v v v
(
)
1
Άρα λοιπόν LB ( µ ) = x − za σ 2
v
και UB ( µ ) = x + za σ 2
v
, Άρα το (1 − a )100% ∆Ε = x − za σ , x + za σ 2 2 v v όπου: 1 v X = ∑ xi , v i =1 το za βρίσκεται από τους πίνακες τυποποιηµένης κανονικής κατανοµής 2
N ( 0,1) , για την τιµή του α/2. σ ,v από τη δοθείσα κατανοµή και δείγµα. Ερµηνεία του ∆ιαστήµατος Εµπιστοσύνης Αν επαναλάβουµε το πείραµα πολλές φορές, µε διαφορετικά δεδοµένα και κατασκευάσουµε διαφορετικά 100(1-α)% ∆Ε, στο 100(1-α)% των περιπτώσεων το πραγµατικό µ θα βρίσκεται εντός του ∆Ε. Παρατηρήσεις 1) Εάν X 1 = x1 , X 2 = x2 ,…, X v = xv , τότε X = x είναι γνωστός αριθµός και το
διάστηµα (∆Ε) που είδαµε, x ± za σ
είναι γνωστό διάστηµα. Άρα σε συγκεv κριµένο δείγµα, το µ θα περιέχεται ή δεν θα περιέχεται στο ∆Ε, αλλά δεν γνωρίζουµε το πραγµατικό µ. 2) Όσο αυξάνεται το µέγεθος του δείγµατος (ν) τόσο το µήκος του ∆Ε µι= κραίνει. L ( ∆Ε ) = UB ( X ) − LB ( X ) = X + za σ − X − za σ 2 2 v v (περισσότερη X + za σ − X + za σ = za σ +z σ = 2 za σ 2 2 2 2 v v v a2 v v πληροφορία → λιγότερη αβεβαιότητα) 3) Για συγκεκριµένο µέγεθος δείγµατος, το µήκος µικραίνει, όσο µεγαλώνει το α, δηλ. όσο µικραίνει ο συντελεστής εµπιστοσύνης 1-α). 2
∆Ε για Άγνωστη Παράµετρο Πληθυσµού. Έστω X 1 , X 2 ,…, X v τ.δ. από κατανοµή µε σ.π. (ή σ.π.π.) f ( x;θ ) . Ζητούµε τυχαία όρια LB ( X ) , UB ( X ) , τέτοια ώστε: P LB ( X ) < θ < UB ( X ) = 1 − a (για πολυδιάστατες παραµέτρους, Ζώνη Εµπιστοσύνης). Γενική Μέθοδος Εάν T ( X ) = T ( X 1 , X 2 ,…, X v ) είναι εκτιµήτρια του θ και µία συνάρτηση της Τ
και της παραµέτρου θ, Y (T ,θ ) , µε κατανοµή ανεξάρτητη από άγνωστες παρα-
µέτρους, τότε επιλέγονται σταθερές τέτοιες ώστε: P c1 < Y (T ,θ ) < c2 = 1 − a , µπορούµε να πάρουµε 100(1-α)% ∆Ε για το θ, επιλύοντας τη διπλή ανίσωση, ως προς θ. 2
Παράδειγµα Άσκηση: Έστω X 1 , X 2 ,…, X v τ.δ. από κανονική κατανοµή N ( µ ,σ 2 ) . Να βρεθεί ∆Ε για το µ. Λύση: Χρήση της γενικής µεθόδου: T ( X ) = X εκτιµήτρια για το µ. Επειδή το σ2 είναι άγνωστο, µπορούµε να χρησιµοποιήσουµε την εκτίµηση: 2 1 v 2 s = xi − x , η οποία είναι και αµερόληπτη. ∑ v − 1 i =1 σ2 x−µ Γνωρίζουµε πάλι ότι X ~ N µ , και εποµένως z = ~ N ( 0,1) σ v v s 2 ( v − 1) Επίσης γνωρίζουµε ότι: ~ X(2v−1) (µε ν-1 βαθµούς ελευθερίας) 2
(
)
σ (γνωρίζουµε από τη θεωρία, ότι τα x και ν είναι ανεξάρτητα) (Παρένθεση)
z ~ N ( 0,1)
U ~ X(2r ) και, εάν είναι ανεξάρτητες και παίρνω την ποσότητα T=
N ( 0,1) z = ~ t( r ) , r < 30 (κατανοµή Student) 2 u/r X( r ) r
σ 2 = s 2 Γ ( v + 1)
Student fT ( t ) =
( 2 ) 1 + tv 2
2 π vΓ v
v +1 2
, −∞ < t < ∞
Η κατανοµή t( v−1) δεν εξαρτάται από άγνωστες παραµέτρους, είναι συµµετρική ως προς το 0, µονοκόρυφη, σχηµατικά είναι όπως και η τυποποιηµένη κανονική µε πιο «βαριά» άκρα, και για v ≥ 30 , συγκλίνει προς την αυτή. Η z ακολουθεί την Ν(0,1). Αν θεωρήσω τη z, x−µ x−µ z T= = u/r
σ v 2 ( v − 1) s v −1
σ =
σ2
s2
(x − µ)
v =
2 σ s
σ2
3
v
σ2
=
x−µ ~ t( v −1) s v
Ζητούµε σταθερές c1 , c2 τέτοιες ώστε: P ( c1 < t < c2 ) = 1 − a ⇒ X −µ X −µ P ( c1 < t < c2 ) = 1 − a ⇒ P c1 < < c2 = P −ta ( v −1) < < ta ( v−1) = s s 2 2 v v P −ta ( v −1) s < X − µ < ta ( v−1) s = 2 v v 2 P −ta ( v −1) s < X − µ < ta ( v−1) s = 2 v v 2 P −ta ( v −1) s ≤ µ − X ≤ ta ( v −1) s = 2 v v 2 P X − ta ( v −1) s ≤ µ ≤ X + ta ( v −1) s = 1 − a . 2 2 v v Συνεπώς: το (1 − a ) ⋅ 100%∆Ε = x − ta ( v −1) s , x + ta ( v−1) s 2 2 v v 2 Η ίδια έκφραση µε πριν, αλλά αντί για σ έχουµε s και, αντί της τυποποιηµένης κανονικής κατανοµής, την Student t.
Αριθµητικά Παραδείγµατα: Άσκηση: Έχουµε X 1 , X 2 ,…, X 16 από κανονική κατανοµή N ( µ ,σ 2 = 1) . Ζητείται ένα διάστηµα εµπιστοσύνης 95% για το µ. ∆ίνονται: X = 2 , za = z0,975 = 1,96 . 2
Λύση: X −µ 1 X i ~ N ( µ ,σ 2 = 1) , X ~ N µ , , z = ~ N ( 0,1) σ v v = 95%∆Ε= (1 − 0,05 )100% ∆Ε = X − z0,025 σ , X + z0,025 σ v v 1 1 1 1 2 − 1,96 ,2 + 1,96 = 2 − 1,96 , 2 + 1,96 = [ 2 − 0,49, 2 + 0, 49] = 4 4 16 16 [1,51;2, 49] Άσκηση: Έχουµε. ∆ίνονται: X 1 , X 2 ,…, X 16 από κανονική κατανοµή N ( µ ,σ 2 ) , µε X = 2 , s 2 = 4 .
Να βρεθεί ∆Ε για το µ. ∆ίνονται: t0,025 (15 ) = 2,131 , t0,05 (15 ) = 1,753 , t0,025 (16 ) = 2,120 , t0,05 (16 ) = 1,746 . Λύση: 100 (1 − a ) % = 95% ⇒ 100 − 100a = 95 ⇒ a = (100 − 95 ) ÷ 100 = 0,05 . 4
Άρα ΕΕ για το µ είναι: (1 − a ) ⋅ 100%∆Ε = x − ta 2 ( v − 1) s , x + ta 2 ( v − 1) s = v v x − t = 2 − 2,131 2 , 2 + 2.131 2 = 2 , x + t0,025 (15 ) 2 0,025 (15 ) 4 4 16 16 [ 2 − 1,0655;2 + 1,0655] = [0,9345;2,0655]
5