ΜΕΡΟΣ IV
∆ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
∆ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Η Σηµειακή εκτιµητική δεν ποσοτικοποιεί την αβεβαιότητά µας για την άγνωστη παράµετρο. Παίρνουν µία τιµή και δεν γνωρίζουµε πόσο αβέβαιοι είµαστε για την τιµή αυτή. Σχεδόν πάντα, µε πιθανότητα 0, η εκτίµηση θα είναι ακριβώς ίση µε την πραγµατική τιµή της παραµέτρου. Κατασκευή ∆ιαστηµάτων Εµπιστοσύνης Ζητούµε LB ( X ) , UB ( X ) (LowerBound και UpperBound), τέτοια ώστε, η πιθανότητα P LB ( X ) < θ < UB ( X ) = 1 − a , συνήθως 95%, δηλαδή α=0,05. ∆εν αποκλείεται όµως, να ληφθεί και α=0,01 (99%) ή α=0,1 (90%) 95%=100(1-α)%. Παράδειγµα Άσκηση: Έχουµε X 1 , X 2 ,…, X v από κανονική κατανοµή N ( µ ,σ 2 ) , µε σ2 γνωστό. Ζητείται ένα διάστηµα εµπιστοσύνης για το µ, µε α=0,05 Λύση: Το α δεν έχει καµία σηµασία! =µ=X . Είναι γνωστό ότι µ Θεωρούµε την κατανοµή του. α/2 X i ~ N ( µ ,σ 2 ) και, δεδοµένου ότι το σ2 είναι γνωστό , σ2 X ~ N µ , . Είναι γνωστό v επίσης ότι z =
X −µ
σ
~ N ( 0,1)
-zα/2
α/2
0
α/2 zα/2 x
α/2
x v µ x − za σ x + za σ 2 2 v • Το µ αυτό είναι το πραγµαv τικό, όχι το δειγµατικό. • Από το συνολικό διάγραµµα πρέπει να «κόψουµε» µια ποσότητα α (εδώ 5%), για να µείνει το 1-α • επειδή η κανονική κατανοµή είναι συµµετρική, είναι το ίδιο αν «κόψουµε» ένα α/2 από κάθε πλευρά του γραφήµατος, οπότε πάλι παραµένει στο µέσο µία ποσότητα 1-α . x − µ P − za ≤ z ≤ z a = 1 − a ⇒ P − za ≤ ≤ za = σ 2 2 2 2 v = P z σ = P − za σ ≤ x − µ ≤ za σ ≥ µ − x ≥ − za σ a 2 2 2 v v v v 2 = P x − z σ =1− a P − za σ ≤ µ − x ≤ za σ ≤ µ ≤ x + za σ a 2 2 2 2 v v v v
(
)
3
Άρα λοιπόν LB ( µ ) = x − za σ 2
v
και UB ( µ ) = x + za σ 2
v
, Άρα το (1 − a )100% ∆Ε = x − za σ , x + za σ 2 2 v v όπου: 1 v X = ∑ xi , v i =1 το za βρίσκεται από τους πίνακες τυποποιηµένης κανονικής κατανοµής 2
N ( 0,1) , για την τιµή του α/2. σ ,v από τη δοθείσα κατανοµή και δείγµα. Ερµηνεία του ∆ιαστήµατος Εµπιστοσύνης Αν επαναλάβουµε το πείραµα πολλές φορές, µε διαφορετικά δεδοµένα και κατασκευάσουµε διαφορετικά 100(1-α)% ∆Ε, στο 100(1-α)% των περιπτώσεων το πραγµατικό µ θα βρίσκεται εντός του ∆Ε. Παρατηρήσεις 1) Εάν X 1 = x1 , X 2 = x2 ,…, X v = xv , τότε X = x είναι γνωστός αριθµός και το
διάστηµα (∆Ε) που είδαµε, x ± za σ
είναι γνωστό διάστηµα. Άρα σε συγκεv κριµένο δείγµα, το µ θα περιέχεται ή δεν θα περιέχεται στο ∆Ε, αλλά δεν γνωρίζουµε το πραγµατικό µ. 2) Όσο αυξάνεται το µέγεθος του δείγµατος (ν) τόσο το µήκος του ∆Ε µι= κραίνει. L ( ∆Ε ) = UB ( X ) − LB ( X ) = X + za σ − X − za σ 2 2 v v (περισσότερη X + za σ − X + za σ = za σ +z σ = 2 za σ 2 2 2 2 v v v a2 v v πληροφορία → λιγότερη αβεβαιότητα) 3) Για συγκεκριµένο µέγεθος δείγµατος, το µήκος µικραίνει, όσο µεγαλώνει το α, δηλ. όσο µικραίνει ο συντελεστής εµπιστοσύνης 1-α). 2
∆Ε για Άγνωστη Παράµετρο Πληθυσµού. Έστω X 1 , X 2 ,…, X v τ.δ. από κατανοµή µε σ.π. (ή σ.π.π.) f ( x;θ ) . Ζητούµε τυχαία όρια LB ( X ) , UB ( X ) , τέτοια ώστε: P LB ( X ) < θ < UB ( X ) = 1 − a (για πολυδιάστατες παραµέτρους, Ζώνη Εµπιστοσύνης). Γενική Μέθοδος Εάν T ( X ) = T ( X 1 , X 2 ,…, X v ) είναι εκτιµήτρια του θ και µία συνάρτηση της Τ
και της παραµέτρου θ, Y (T ,θ ) , µε κατανοµή ανεξάρτητη από άγνωστες παρα-
µέτρους, τότε επιλέγονται σταθερές τέτοιες ώστε: P c1 < Y (T ,θ ) < c2 = 1 − a , µπορούµε να πάρουµε 100(1-α)% ∆Ε για το θ, επιλύοντας τη διπλή ανίσωση, ως προς θ. 4
Παράδειγµα Άσκηση: Έστω X 1 , X 2 ,…, X v τ.δ. από κανονική κατανοµή N ( µ ,σ 2 ) . Να βρεθεί ∆Ε για το µ. Λύση: Χρήση της γενικής µεθόδου: T ( X ) = X εκτιµήτρια για το µ. Επειδή το σ2 είναι άγνωστο, µπορούµε να χρησιµοποιήσουµε την εκτίµηση: 2 1 v 2 s = xi − x , η οποία είναι και αµερόληπτη. ∑ v − 1 i =1 σ2 x−µ Γνωρίζουµε πάλι ότι X ~ N µ , και εποµένως z = ~ N ( 0,1) σ v v s 2 ( v − 1) Επίσης γνωρίζουµε ότι: ~ X(2v−1) (µε ν-1 βαθµούς ελευθερίας) 2
(
)
σ (γνωρίζουµε από τη θεωρία, ότι τα x και ν είναι ανεξάρτητα) (Παρένθεση)
z ~ N ( 0,1)
U ~ X(2r ) και, εάν είναι ανεξάρτητες και παίρνω την ποσότητα T=
N ( 0,1) z = ~ t( r ) , r < 30 (κατανοµή Student) 2 u/r X( r ) r
σ 2 = s 2 Γ ( v + 1)
Student fT ( t ) =
( 2 ) 1 + tv 2
2 π vΓ v
v +1 2
, −∞ < t < ∞
Η κατανοµή t( v−1) δεν εξαρτάται από άγνωστες παραµέτρους, είναι συµµετρική ως προς το 0, µονοκόρυφη, σχηµατικά είναι όπως και η τυποποιηµένη κανονική µε πιο «βαριά» άκρα, και για v ≥ 30 , συγκλίνει προς την αυτή. Η z ακολουθεί την Ν(0,1). Αν θεωρήσω τη z, x−µ x−µ z T= = u/r
σ v 2 ( v − 1) s v −1
σ =
σ2
s2
(x − µ)
v =
2 σ s
σ2
5
v
σ2
=
x−µ ~ t( v −1) s v
Ζητούµε σταθερές c1 , c2 τέτοιες ώστε: P ( c1 < t < c2 ) = 1 − a ⇒ X −µ X −µ P ( c1 < t < c2 ) = 1 − a ⇒ P c1 < < c2 = P −ta ( v −1) < < ta ( v−1) = s s 2 2 v v P −ta ( v −1) s < X − µ < ta ( v−1) s = 2 v v 2 P −ta ( v −1) s < X − µ < ta ( v−1) s = 2 v v 2 P −ta ( v −1) s ≤ µ − X ≤ ta ( v −1) s = 2 v v 2 P X − ta ( v −1) s ≤ µ ≤ X + ta ( v −1) s = 1 − a . 2 2 v v Συνεπώς: το (1 − a ) ⋅ 100%∆Ε = x − ta ( v −1) s , x + ta ( v−1) s 2 2 v v 2 Η ίδια έκφραση µε πριν, αλλά αντί για σ έχουµε s και, αντί της τυποποιηµένης κανονικής κατανοµής, την Student t.
Αριθµητικά Παραδείγµατα: Άσκηση: Έχουµε X 1 , X 2 ,…, X 16 από κανονική κατανοµή N ( µ ,σ 2 = 1) . Ζητείται ένα διάστηµα εµπιστοσύνης 95% για το µ. ∆ίνονται: X = 2 , za = z0,975 = 1,96 . 2
Λύση: X −µ 1 X i ~ N ( µ ,σ 2 = 1) , X ~ N µ , , z = ~ N ( 0,1) σ v v = 95%∆Ε= (1 − 0,05 )100% ∆Ε = X − z0,025 σ , X + z0,025 σ v v 1 1 1 1 2 − 1,96 ,2 + 1,96 = 2 − 1,96 , 2 + 1,96 = [ 2 − 0,49, 2 + 0, 49] = 4 4 16 16 [1,51;2, 49] Άσκηση: Έχουµε. ∆ίνονται: X 1 , X 2 ,…, X 16 από κανονική κατανοµή N ( µ ,σ 2 ) , µε X = 2 , s 2 = 4 .
Να βρεθεί ∆Ε για το µ. ∆ίνονται: t0,025 (15 ) = 2,131 , t0,05 (15 ) = 1,753 , t0,025 (16 ) = 2,120 , t0,05 (16 ) = 1,746 . Λύση: 100 (1 − a ) % = 95% ⇒ 100 − 100a = 95 ⇒ a = (100 − 95 ) ÷ 100 = 0,05 . 6
Άρα ΕΕ για το µ είναι: (1 − a ) ⋅ 100%∆Ε = x − ta 2 ( v − 1) s , x + ta 2 ( v − 1) s = v v x − t = 2 − 2,131 2 , 2 + 2.131 2 = 2 , x + t0,025 (15 ) 2 0,025 (15 ) 4 4 16 16 [ 2 − 1,0655;2 + 1,0655] = [0,9345;2,0655] Παράδειγµα – Άσκηση (Άσκηση δοσµένη για το σπίτι) Έστω X 1 , X 2 ,…, X v τ.δ. από κανονική κατανοµή N ( µ ,σ 2 ) α) Να κατασκευασθεί ένα (1-α) ∆.Ε. για το µ β) Να βρεθεί η σχέση που πρέπει να ικανοποιεί το µέγεθος του δείγµατος ν, ώστε το µήκος του ∆Ε να είναι µικρότερο από το 2σ, µε πιθανότητα 1-β. Λύση: α) (1 − a ) ⋅ 100%∆Ε = X − ta 2( v−1) s , X + ta 2(v−1) s v v β) Μήκος ∆Ε = UB ( X ) − LB ( X ) = X + ta ( v −1) s − X − ta ( v −1) s = 2 2 v v − X + ta s = 2ta s X + ta s 2 2 2 v v v s v s ≤ 2σ = 1 − β ⇒ P ≤ =1− β ⇒ P 2ta ( v −1) v σ ta ( v −1) 2 2 s v P > =β ⇒ σ ta ( v −1) 2 2 s v =β ⇒ P 2 > 2 σ ta ( v −1) 2 s2 v − 1 v v − 1 ( ) > ( )= β ⇒ P σ2 ta2 ( v−1) 0 2 2 s ( v − 1) Θέτουµε: Y = , τότε 2
σ
2 v −1
Y ~X
και P (Y > Xβ2,v −1 ) = β ⇒
v ( v − 1) 2 2 = Xβ2,v−1 ⇒ v ( v − 1) = ta ,v −1 ⋅ Xβ ,v−1 2 2 ta ,v−1 2
7
β
Xβ2,v−1
∆.Ε. συντελεστή (1-α) για το µέσο µ, κανονικής κατανοµής: x−µ α) Αν το σ2 είναι γνωστό, το ∆.Ε. βασίζεται στη z = ~ N ( 0,1) και έχει
σ
v
άκρα x ± za σ 2
v
.
Αν το σ2 είναι άγνωστο, το ∆.Ε. βασίζεται στην T =
β)
άκρα τα x ± ta
2
,v −1
x−µ ~ t( v−1) και έχει s v
s v
Αν σ2 είναι άγνωστο και v > 30 , προσεγγιστικά, ∆.Ε., µε βάση κανονική κα. τανοµή ∆Ε = x − za σ , x + za σ 2 2 v v Παρατήρηση: Σε περίπτωση µη κανονικού πληθυσµού: i) Αν σ2 είναι γνωστό και v > 30 , από Κεντρικό Οριακό Θεώρηµα, x−µ z= ~ N ( 0,1) και παίρνουµε προσεγγιστικά
σ
v ασυµπτωτικά. ∆Ε = x − za σ , x + za σ 2 2 v v x−µ ii) Αν σ2 είναι άγνωστο και v > 30 , η τ.µ. ~ t( v −1) ασυµπτωτικά. s v
∆.Ε. για τη ∆ιαφορά Μέσων ∆ύο Κανονικών Πληθυσµών Έστω X 1 , X 2 ,…, X v1 τ.δ. από κανονική κατανοµή ~ N ( µ1 ,σ 12 ) και Y1 , Y2 ,…, Yv2 τ.δ. από κανονική κατανοµή ~ N ( µ 2 ,σ 2 2 ) .
Να βρεθεί ∆Ε για τη διαφορά µ1 − µ 2 Λύση: ∆ειγµατική µέσα: X , Y (εκτιµήτριες για τα µ1 , µ 2 ), µε σ 12 σ 22 X ~ N µ1 , και Y ~ N µ 2 , και X , Y ανεξάρτητα. v1 v2 σ 12 σ 2 2 Ισχύει: X − Y ~ N µ1 − µ2 , + (απόδειξη µε ροπογεννήτριες). v1 v2 t ( X −Y ) M X −Y ( t ) = E e = E et X ⋅ e− tY = E et X ⋅ E e −tY = M X ( t ) ⋅ M Y ( t ) .
8
σ 2t 2 X ~ N ( µ1 ,σ 1 ) , M X ( t ) = exp µt + 2 σ 12t 2 σ 2 2t 2 M X −Y ( t ) = M X ( t ) − M Y ( t ) = exp µ1t + exp − µ2t + = 2v1 2v2 2
t 2 σ 12 σ 2 2 exp ( µ1 − µ 2 ) t + + 2 v1 v2 Συνεπώς: X − Y − ( µ1 − µ 2 ) z= ~ N ( 0,1) και
(
X ~ N ( µ X ,σ 2 X ) , Y ~ N ( µY ,σ 2Y )
)
σ 12 v1
+
και Χ,Υ ανεξάρτητα, τότε X ± Y ~ N ( µ X ± µY ,σ 2 X + σ 2Y )
σ 22 v2
X − Y − ( µ1 − µ2 ) P − za < z < z a = 1 − a ⇒ P − za < < za = 1 − a ⇒ 2 2 2 2 2 2 σ σ 1 2 + v v 1 2 σ 12 σ 2 2 σ 12 σ 2 2 P X − Y − za ⋅ + < ( µ1 − µ 2 ) < X − Y + za ⋅ + =1− a , 2 2 v v v v 1 2 1 2 εποµένως: σ 12 σ 2 2 σ 12 σ 2 2 ∆Ε για µ1 − µ 2 = X − Y − za + , X − Y + za + . 2 2 v v v v 1 2 1 2 α) Αν σ 1 ,σ 2 είναι γνωστά, 100(1-α)% ∆.Ε. για τη διαφορά µ1 − µ 2 :
(
)
(
(
)
)
(
)
σ 12 σ 2 2 σ 12 σ 2 2 + , X − Y + za + X − Y − za 2 2 v v v v 1 2 1 2 β) Αν σ 1 ,σ 2 είναι άγνωστα, i) αν v1 , v2 > 30 , προσεγγιστικά το ∆.Ε. συντελεστή 1-α είναι: s12 s2 2 s12 s2 2 + , X − Y + za + X − Y − za 2 2 v v v v 1 2 1 2 ii)
Αν ένα από τα v1 , v2 < 30 , τότε κάνω την υπόθεση ότι σ 1 = σ 2 = σ και:
οπότε
( v1 − 1) s12 ~ X 2 σ2
v1 −1
και
( v2 − 1) s2 2 ~ X 2 σ2
( v1 − 1) s12 + ( v2 − 1) s22 ~ X 2 σ2
v1 + v2 − 2
9
*
v2 −1
ανεξάρτητα,
Επίσης: z =
( X −Y ) − (µ − µ ) 1
σ 12 v1
+
2
σ 22 v2
( X −Y ) − (µ − µ ) 1
σ2 v1
Η τ.µ. Τ µε T =
+
2
σ2 v2
( v1 − 1) s12 + ( v2 − 1) s22 σ 2 ( v1 + v2 − 2 ) ( X − Y ) − ( µ1 − µ2 ) 1 1 + v1 v2
( v1 − 1) s12 + ( v2 − 1) s2 2
=
= ~ t( v1 +v2 −2)
v1 + v2 − 2
Άρα T =
(
P −ta
( X −Y ) − (µ − µ ) 1
( v1 − 1) s1 + ( v2 − 1) s2 2
v1 + v2 − 2 2
,v1 + v2 −2
≤ T ≤ ta
2
,v1 + v2 − 2
2
2
1 1 ⋅ + v1 v2
~ t( v1 +v2 −2) και συνεπώς:
) =1− a ⇒
1 1 1 1 ∆Ε(1 − a)% = X − Y − ta ,v +v −2 s 2 + , X − Y + ta ,v +v −2 s 2 + 2 1 2 2 1 2 v1 v2 v1 v2
αν σ 1 = σ 2 , z =
( X − Y ) − ( µ − µ ) ~ N ( 0,1) 1
σ
2
1 1 + v1 v2
∆.Ε. για τη ∆ιασπορά Κανονικού Πληθυσµού. Έστω: X 1 , X 2 ,…, X v τ.δ. από κανονική κατανοµή N ( µ ,σ 2 ) ,σ 2 > 0 . Ζητείται ∆.Ε. για το σ 2 . n
2 1 2 α) Αν ο µ είναι γνωστός: σ = ∑ ( xi − µ ) Ε.Μ.Π., η οποία είναι και αv i =1 µερόληπτη, γιατί το µ είναι γνωστό. 2 Ζητούµε Y σ ,σ 2 µε κατανοµή ανεξάρτητη από άγνωστες παραµέτρους:
(
)
10
X 1 , X 2 ,…, X v ~ N ( µ ,σ 2 ) zi =
xi − µ
σ
2
x −µ 2 ~ N ( 0,1) ⇒ zi = i ~ X(1) σ 2
Η Ε.Μ.Π. διαιρείται µε ν, είναι αµερόληπτη, αν µ άγνωστο δεν είναι αµερόληπτη και γι’ αυτό διαιρείται µε ν-1. Το µέγεθος του δείγµατος (ν) δεν θεωρείται άγνωστη παράµετρος. v xi − µ ) ( vσ xi − µ 2 ~ X( v ) ⇒ ~ X(2v ) ∑ =∑ 2 2 σ i =1 σ σ i =1 2 v 2 x − µ ( ) σ v < Xa2 ( v ) = P X12−a ( v ) < 2 = ∑ i 2 2 2 σ σ i =1 2 2 2 1 σ 1 v σ v σ 2 = P = P 2 > > >σ > 2 X1−a ( v ) vσ 2 Xa2 ( v ) X12−a ( v ) Xa ( v ) 2 2 2 2 v v 2 2 2 x − µ x − µ ( ) ( ) 2 ∑ ∑ i i vσ vσ 2 i =1 = P i=1 =1− a P 2 <σ 2 < 2 < < σ 2 Xa ( v ) X1−a ( v ) X12−a ( v ) Xa ( v ) 2 2 2 2 v v 2 2 ∑ ( xi − µ ) ∑ ( xi − µ ) Άρα 100(1-α)% ∆.Ε. για το σ 2 : i =1 2 , i =1 2 v v X X ( ) ( ) a 1− a 2 2 • Η γενική µέθοδος για τα ∆.Ε. µας βρίσκει ∆.Ε. για οποιαδήποτε παράµετρο. • Προσέχω πώς είναι η κατανοµή µας (συµµετρική ή όχι κ.λ.π.) v
2
2
2
β)
Αν ο µ είναι άγνωστος: 2 1 v s2 = xi − x ∑ v − 1 i =1
(
Είναι γνωστό ότι
)
v −1
σ2
2 ( v −1)
~X
, άρα Y ( s ,σ 2
Ακριβώς η ίδια διαδικασία µε X(2v−1)
11
2
)=
( v − 1) s 2 ~ X 2 σ2
( v −1)
Η Κατανοµή
F
Εάν U ~ X(2v ) και V ~ X(2m ) και U, V ανεU /n ~F V / m ( n ,m ) (Κατανοµή F, µε δύο βαθµούς ελευθερίας). 1 Προφανώς θα ισχύει η ~ F( m,n ) F( n ,m )
F( n ,m )
ξάρτητες, τότε F =
1-α α
F(n,m) ( a)
0
∆Ε για το Λόγο ∆ύο ∆ιασπορώνδύο Κανονικών ∆ιασπορών. Έστω X 1 , X 2 ,…, X v1 ~ N ( µ X ,σ X 2 ) και Y1 , Y2 ,…, Yv2 ~ N ( µY ,σ Y 2 ) , ανεξάρτητα τυχαία δείγµατα.
σX2 Να βρεθεί ∆Ε για το λόγο σY 2 α) Αν τα µ X , µY είναι γνωστά (τότε δεν χάνω βαθµούς ελευθερίας). 1 2 2 ~ X σ X = ∑ ( xi − µ X ) v 2 σ v i =1 X ⇒ v 2 2 1 2 mσ Y 2 σ Y = ∑ ( yi − µY ) ~ X m 2 m i =1 σY 2
vσ X
v
2
µ X , µY γνωστά, συνεπώς θα οδηγηθούµε σε Fm,v
β)
Αν τα µ X , µY είναι άγνωστα*. Έχουµε: s X
2
1 v1 = ∑ xi − x v1 − 1 i =1
(
Επίσης γνωρίζουµε ότι:
( v1 − 1) s X 2 F=
v1 − 1
σX2
( v2 − 1) sY 2 σY 2
1 v1 και sY = ∑ yi − y v2 − 1 i =1 v1 −1
σX2
σX2 sY 2
σY 2
=
(
2
( v1 − 1) s X 2 ~ X 2
sX 2
= v2 − 1
)
2
σY 2 σX2 sY 2 sX 2
πώς: 12
και
)
2
( v2 − 1) sY 2 ~ X 2
~ F( v1 −1,v2 −1) ⇒
σY 2
σX2 σY 2 sX 2 sY 2
v2 −1
~ F( v2 −1,v1 −1) , συνε-
σX2 2 σY P f a ( v2 − 1, v1 − 1) < 2 < f1−a ( v2 − 1, v1 − 1) = 2 sX 2 2 sY sX 2 σ X 2 sX 2 P f a ( v2 − 1, v1 − 1) ⋅ 2 < 2 < f1−a ( v2 − 1, v1 − 1) ⋅ 2 = 1 − a ⇒ 2 σY sY sY 2 1− a ⇒
σX2 Άρα ∆Ε(1-α)% για το είναι: σY 2 sX 2 sX 2 f a 2 ( v2 − 1, v1 − 1) ⋅ 2 , f1−a 2 ( v2 − 1, v1 − 1) ⋅ 2 sY sY (*) Το s χρησιµοποιείται όταν τα µ X , µY είναι άγνωστα.
∆Ε για Ποσοστό. Έστω X 1 , X 2 ,…, X v ~ Bernoulli ( p ) . Ζητείται ένα ∆Ε για το p. Λύση: Μία Ε.Μ.Π. για το p είναι η: v p = x = 1 x ∑i v i =1 v
Θέτουµε: Y = ∑ xi i =1
Y ~ Binomial ( v, p ) ⇒ E (Y ) = vp και V (Y ) = vp (1 − p ) * Κεντικό Οριακό Θεώρηµα Ασυµπτωτικό Αποτέλεσµα Όταν έχουµε X 1 , X 2 ,..., X v ανεξάρτητες και ισόνοµες τ.µ. από κατανοµή µε
κοινό E ( X i ) = µ και V ( X i ) = σ 2 , τότε ο δειγµατικός µέσος ακολουθεί ασυµπτωτικά ( v → ∞ ) τυποποιηµένη κανονική κατανοµή:
X −µ
σ v
13
~ N ( 0,1) , v → ∞
Από το Κ.Ο.Θ. γνωρίζουµε ότι
Y − E (Y )
=
V (Y )
Y − vp vp (1 − p )
~ N ( 0,1) ⇒
Y − p Y − vp v Pr − za ≤ ≤ za = Pr − za ≤ ≤ za = 2 2 2 2 vp (1 − p ) p (1 − p ) v Y 2 −p 2 Yv− p Pr v ≤ za = Pr ≤ za = p (1 − p ) p − p 1 2 2 ( ) v v
(
)
( )
2 2 p (1 − p ) Pr Y − p − za ≤ 0 = v 2 v 2 2 z z a a 2 2Yp 2 Pr Y − + p2 − 2 p + p2 ≤ 0 = v v v v 2 2 z z a a 2 2 2 2 Pr 1 + p − 2 p + p + p ≤ 0 = 1 − a (1) v v Οι ρίζες του τριωνύµου στην (1) είναι:
(
( )
)
( ) ( )
( )
( )
( )
( ) ∓z 2
p +
za
2
2v
p1 , p2 =
(
p 1 − p a
2
z ) ( 1+ a
v
)+(
za
2
)
2
4v 2
2
2
v
∆Ε. Όταν v >> 0 , τότε: p 1 − p p1 , p2 = p ∓ za και το ∆Ε είναι: 2 v p 1 − p p 1 − p p − z p + z , a a 2 2 v v
(
(
)
)
(
)
οπότε η (1) γίνεται:
14
, και προσδιορίζουν τα άκρα του
p− p Pr − za ≤ ≤ za = 1 − a . Αν επιλύσουµε την ανισότητα ως προς p, 2 2 p 1 − p v p (1 − p ) p (1 − p ) Pr p − za ⋅ ≤ p ≤ p + za ⋅ =1− a 2 2 v v p (1 − p ) p (1 − p ) Εποµένως ∆Ε 100(1-α)%= p − za ⋅ , p + za ⋅ 2 2 v v
(
)
∆ιάστηµα Εµπιστοσύνης για τη ∆ιαφορά δύο ποσοστών. Έστω X 1 , X 2 ,…, X v1 ~ Bernoulli ( p1 ) και W1 ,W2 ,…,Wv2 ~ Bernoulli ( p2 ) Ζητείται ∆.Ε. για το p1 − p2 . v1
v
p =
∑x
i
i =1
v
Y → Y1 = , όπου v → Y2
Y1 = ∑ xi
Y p (1 − p ) ~ N p, v2 n n Y2 = ∑ wi i =1
i =1
Y1 ~ Bin ( v1 , p1 ) ⇒ E (Y1 ) = v1 p1 V (Y1 ) = v1 p1 (1 − p1 ) Y2 ~ Bin ( v1 , p1 ) ⇒ E (Y2 ) = v2 p2 V (Y2 ) = v2 p2 (1 − p2 ) Y Y Η τ.µ. 1 − 2 έχει: v1 v2 Y Y Y Y 1 1 1 1 E 1 − 2 = E 1 − E 2 = E [Y1 ] − E [Y2 ] = v1 p1 − v2 p2 = v2 v1 v2 v1 v2 v1 v2 v1 p1 − p2 , άρα είναι µια αµερόληπτη εκτιµήτρια για τη διαφορά ποσοστού p1 − p2 . Y Y Y Y 1 1 V 1 − 2 = V 1 + V 2 = 2 V [Y1 ] + 2 V [Y2 ] = v2 v1 v2 v1 v2 v1 p1 (1 − p1 ) p2 (1 − p2 ) 1 1 v p 1 − p + v p 1 − p = + . ( ) ( ) 1 1 1 2 2 2 v12 v2 2 v1 v2 Y1 Y2 v − v − ( p1 − p2 ) 1 2 ~ N ( 0,1) ασυp1 (1 − p1 ) p2 (1 − p2 ) + v1 v2
Από το Κ.Ο.Θ. (για ν>30), έχουµε ότι:
µπτωτικά.
15
Y Y 1 2 − − ( p1 − p2 ) v1 v2 Pr ≤ za = 2 p1 (1 − p1 ) + p2 (1 − p2 ) v v 1 2 Y Y p1 (1 − p1 ) p2 (1 − p2 ) Pr 1 − 2 − ( p1 − p2 ) ≤ za + = v1 v2 2 v v 1 2 Y Y p1 (1 − p1 ) p2 (1 − p2 ) 1 2 Pr − − ( p1 − p2 ) ≤ za + =1− a ⇒ v1 v2 2 v v 1 2 ……. Y1 Y2 − ± za 2 v 1 v2
(1 − a ) %∆Ε =
Y1 Y1 Y2 Y2 1 − 1 − v1 v1 v2 v2 + , v1 , v2 µεγάλα. v1 v2
Άσκηση (Παλιό Θέµα και µέρος Θέµατος Σεπτ 2009) Έστω από X 1 , X 2 ,…, X v τ.δ. από κατανοµή µε σ.π. f ( x;θ ) = θ xθ −1 ,0 < x < 1 . α) Να βρεθεί η εκτιµήτρια ροπών του θ, θ και η Ε.Μ.Π. του 1 , έστω δ.
θ
β)
Να βρεθεί ∆Ε για το θ (Υπόδειξη: Y = 2vθδ ~ X , 2 2v
Y ~ Gamma (θ , v ) =
γ)
θv
y v−1e−θ y
Γ (v) Αν ένα τ.δ. από την παραπάνω κατανοµή έδωσε τις τιµές xi = 0,2 , 0,7, 0,3, 0,4, 0,9, ποιο θα είναι το ∆.Ε. για το θ, µε σ.ε. 95%; ∆ίνονται 2 2 X0,975 (10 ) = 3,24 , X0,025 (10 ) = 20, 48 .
Λύση: α) Μέθοδος των ροπών: Μία παράµετρος ροπής πρώτης τάξεως: 1
E ( x ) = ∫ xf ( x ) dx = 0
θ
1
∫ xθ x
1
dx = θ ∫ xθ dx =
θ −1
0
0
θ
θ
1
xθ +1 = 0 θ +1 θ +1
(
)
x θ +1 1− x Θα βρω την εκτιµήτρια του θ και µετά, µέσω του αναλλοίωτου, θα βρω για την 1 .
άρα
= x ⇒ θ =θ x + x ⇒ θ −θ x =θ 1− x = x ⇒ θ =
θ
Άρα L (θ ) = f ( x;θ ) =
v
θ −1
v
∏ f ( x ;θ ) = ∏θ x i
i =1
i
i =1
16
θ −1
v = θ ∏ xi i =1 v
v v θ −1 v l (θ ) = ln L (θ ) = ln θ ∏ xi = v ln θ + (θ − 1) ln ∏ xi = i =1 i =1 n
v ln θ + (θ − 1) ∑ ln xi i =1
n ∂ v ln θ + (θ − 1) ∑ ln xi v v ∂l (θ ) i =1 = v + ln x = 0 ⇒ v = − ln x ⇒ = ∑ i ∑ i θ i=1 θ ∂θ ∂θ i =1 v
θɵ = −
v v
∑ ln x
ln xi ∑ 1 i =1 ⇒ δ =δ (X ) = = − v θɵ
i
i =1
β)
Έστω W = − ln x FW (W ) = Pr (W ≤ w ) = Pr ( − ln x ≤ w ) = Pr ( x > e− w ) = 1 − Pr ( x ≤ e− w ) =
1 − FX ( e − w )
d d 1 − FX ( e− w ) = − ( −e− w ) f X ( e− w ) = FW (W ) = dw dw − wθ = e − wθ e− wθ e w = θ e− wθ ⇒ fW (W ) = θ e → exp (θ )
Άρα fW (W ) = e− wθ e
− w(θ −1)
Wi = − ln xi ~ exp (θ ) v
v
i =1
i =1
T = ∑ [ − ln xi ] = −∑ ln xi ~ Gamma ( v,θ ) (άθροισµα εκθετικών ακολου-
θεί κατανοµή Γάµµα) T v Y = 2vθδ = 2vθ −∑ ln xi = 2vθ = 2θ T v i =1 y * FY ( y ) = Pr (Y ≤ y ) = Pr ( 2θ T ≤ y ) = Pr T ≤ 2θ y v v −1 −θ 1 1 θ y y 2θ * fY ( y ) = fT = e = v −1 v −1 2θ 2θ 2θ Γ ( v ) 2 θ
(
y − 1 v −1 2 y e ~ Gamma v, 1 2 2v Γ ( v )
)
1 Γ ,2v ~ X(22 v ) 2 Άρα Y = 2vθδ ~ X(22 v )
17
y = FT 2θ
Pr Xa2 ≤ Y ≤ X 2 a = 1 − a ⇒ Pr Xa2 ≤ 2θ T ≤ X 2 a = 1 − a ⇒ 1− ,2 v 1− ,2 v 2 ,2v 2 2 ,2v 2 2 2 Xa X a v ,2 1− ,2 v 2 Pr 2 ≤ θ ≤ =1− a 2 T 2 T Xa2 X 2 a ,2 v 1− ,2v Άρα ∆.Ε.100(1-α)%= 2 , 2 2T 2T v
γ)
T = −∑ ln xi = 4,19 , ν=5 i =1
X(20,025,10) X(12−0,025,10) 3,24 20,48 ∆.Ε. 95%= , , = = [ 0,3866;2,4439] 2 ⋅ 4,19 2 ⋅ 4,19 8,38 8,38
18