Τρίτη, 12 Ιανουαρίου 2010. Έλεγχος Απλής Υποθέσεως H 0 Έναντι Απλής H1 . H 0 : θ = θ 0 έναντι της H1 : θ = θ1 Για την εύρεση Ισχυρότατη κρίσιµη περιοχή, συγκεκριµένου µεγέθους α είναι η κρίσιµη περιοχή µε τη µεγαλύτερη ισχύ (ή ισοδύναµα µε τη µικρότερη πιθανότητα σφάλµατος τύπου ΙΙ) ανάµεσα σε όλες τις κρίσιµες περιοχές µεγέθους α. Παράδειγµα Ελέγχουµε τη µεροληψία ενός κέρµατος. 1 3 H0: p = , H1: p = . 2 4 Έστω ν=6 (6 ρίψεις του νοµίσµατος) Να βρεθεί η ισχυρότατη κρίσιµη περιοχή µεγέθους a = 7 64 Μπορούµε να κατασκευάσουµε τον παρακάτω πίνακα: S 0 1 2 3 4 5 6
1 2 = 0,015625
H0 : p = 1
64
3 4 = 0,000244
H1 : p = 1
4096 6 = 0,09375 18 = 0,004395 64 4096 15 = 0, 234375 135 = 0,032959 64 4096 20 = 0,3125 540 = 0,131836 64 4096 15 = 0, 234375 1215 = 0,296631 64 4096 6 = 0,09375 1458 = 0,355957 64 4096 1 = 0,015625 729 = 0,177979 64 4096
∆ιακρίνουµε όλες τις περιοχές απόρριψης της H 0 , οι οποίες συνολικά έχουν πιθανότητα a = 7 . 64 Έτσι έχουµε: C1 = {S = 0,1} , C2 = {S = 5,6} , C3 = {S = 0,5} και C4 = {S = 1,6} . 3 Ισχύς ελέγχου = 1 - P C | p = 4 3 Ισχύς ελέγχου C1 = 1 − P C1 | p = = 1 − 0,000244 − 0,004395 = 4 1 − 0,004639 = 0,995361 1
3 Ισχύς ελέγχου C2 = 1 − P C2 | p = = 1 − 0,355957 − 0,177979 = 4 1 − 0,355957 − 0,177979 = 1 − 0,533936 = 0,466064 3 Ισχύς ελέγχου C3 = 1 − P C3 | p = = 1 − 0,000244 − 0,355957 = 4 1 − 0,356201 = 0,643799 3 Ισχύς ελέγχου C4 = 1 − P C4 | p = = 1 − 0,000244 − 0,177979 = 4 1 − 0,178223 = 0,821777 Άρα η ισχυρότερη περιοχή ελέγχου είναι η C2 = {S = 5,6} , η οποία µεγιστοποιεί την P ( C | H1 ) = 1 − P (σϕ .τ .ΙΙ )
Λήµµα Neyman – Pearson Γενική Μέθοδος Εύρεση Ισχυρότατης κρίσιµης περιοχής. Έστω X 1 , X 2 ,..., X n τυχαίο δείγµα από κατανοµή µε σ.π. f ( x;θ ) και έστω παραµετρικός χώρος Θ = {θ 0 ,θ1} . Θέλουµε Ισχυρότατο έλεγχο µεγέθους α για τις H 0 : θ = θ 0 έναντι της H1 : θ = θ1 Υπενθύµιση: Συνάρτηση πιθανοφάνειας L (θ ) = f ( x;θ ) =
n
∏ f ( x ,θ ) i
i =1
Εάν υπάρχει θετική σταθερά κ και περιοχή C του δειγµατικού χώρου, τέτοια ώστε: L (θ 0 ) i) ≤ k , εάν ( X 1 , X 2 ,..., X n ) ∈ C L (θ1 ) ii)
L (θ 0 ) ≥ k , εάν ( X 1 , X 2 ,..., X n ) ∈C L (θ1 )
iii)
Pr ( X 1 , X 2 ,..., X n ) ∈ C | θ 0 = a
Τότε η C θα είναι ισχυρότατη κρίσιµη περιοχή µεγέθους α, για τον έλεγχο H 0 : θ = θ 0 έναντι της H1 : θ = θ1 (απλής έναντι απλής). Παράδειγµα - Άσκηση: Έστω X 1 , X 2 ,..., X n τ.δ. από κανονική κατανοµή ( µ ,σ 2 = 36 ) Να ελεγχθεί η H 0 : µ = 50 , έναντι της υποθέσεως H1 : µ = 55 , σε επίπεδο σηµαντικότητας α. Λύση: Συνάρτηση πιθανοφάνειας
2
L ( µ ) = f ( x; µ ) =
n
n
∏ f ( x ;µ ) = ∏ i
i =1
i =1
( xi − µ )2 1 exp − = 2 ⋅ 36 2π 36
n 2 xi − µ ) ( ∑ n − ( 72π ) 2 exp − i=1 72 n 2 xi − 50 ) ( ∑ n − ( 72π ) 2 exp − i=1 n 72 exp − 1 ∑ ( xi − 50 )2 L ( µ = 50 ) 72 i =1 = = = n n L ( µ = 55 ) 2 1 2 xi − 55 ) exp − ∑ ( xi − 55 ) ( ∑ n − 72 i =1 ( 72π ) 2 exp − i=1 72 n 1 n 2 2 exp − ∑ ( xi − 50 ) − ∑ ( xi − 55 ) = i =1 72 i=1 n 1 n exp − ∑ ( xi 2 − 2 xi ⋅ 50 + 502 ) − ∑ xi 2 − 2 xi 55 + 552 = i =1 72 i =1 n n n n n 1 n exp − ∑ xi 2 − ∑100 xi + ∑ 502 − ∑ xi 2 + ∑110 xi − ∑ 552 = i =1 i =1 i =1 i =1 i =1 72 i =1 1 n 1 n 2 2 exp − 10∑ xi + n50 − n55 = exp − 10∑ xi + n ( 502 − 552 ) = 72 i =1 72 i =1 n xi ∑ 1 i =1 exp − 10n + n ( 50 − 55 )( 50 + 55 ) = 72 n 1 1 exp − 10n X + n ( −5 ) ⋅ 105 = exp − 10n X − 525n 72 72 L ( 50 ) 1 1 ≤ k ⇔ exp − 10n X − 525n ≤ k ⇔ − 10n X − 525n ≤ ln k ⇔ L ( 55 ) 72 72
(
(
)
(
525 10 X ln k 10 X 525 ln k − ≤ ⇔ ≥ − ⇔ 72 72 n 72 72 n 525 72ln k 1 X≥ − = ( 525n − 72ln k ) = c 10 10n 10n άρα I ΚΠ = C : ( X 1 , X 2 ,..., X n ) : X ≥ c
{
)
}
3
)
Pr ( X 1 , X 2 ,..., X n ) ∈ C | µ = 50 = a
Αριθµητικά παραδείγµατα: Εφαρµογή: Να βρεθεί η σταθερά c, αν α=0,05 και n = 16 . P ( X 1 , X 2 ,..., X n ) ∈ C | H 0 = a = 0,05
(
)
P X ≥ c | µ = 50 = 0,05 3 2 X −µ 36 X ~ N ( µ ,36 ) ⇔ X ~ N µ , = N µ , ⇔ z = ~ N ( 0,1) ⇔ 2 3 16 2 X − 50 c − 50 c − 50 z P ≥ = 0,05 ⇔ Pr ≥ = 0,05 ⇔ 3 3 3 2 2 2 c − 50 c − 50 c − 50 z 1 − Pr z < = 0,05 ⇔ Pr < = 0,95 ⇔ Φ 3 = 0,95 ⇒ 3 3 2 2 2 c − 50 c − 50 3 ⋅ 1,645 4,935 Φ = Φ (1,645 ) ⇒ = 1,645 ⇒ c = 50 + = 50 + = 3 3 2 2 2 2 50 + 2,4675 = 52, 4675
Άσκηση: (συνέχεια προηγούµενης) Έστω n = 16 και c = 53 . Να βρεθεί το επίπεδο στατιστικής σηµαντικότητας α. Λύση Χ − 50 53 − 50 a = P (απ όρρ . Η 0 | Η 0 αληθ ής ) = P Χ ≥ c | µ = 50 = P ≥ = σ 3 2 n P ( z ≥ 2 ) = 1 − P ( z < 2 ) = 1 − Φ ( 2 ) = 0,0228
(
)
Άσκηση: Έστω X 1 , X 2 ,..., X n τυχαίο δείγµα από κανονική κατανοµή N (θ ,1) . i) Να βρεθεί η ισχυρότατη κρίσιµη περιοχή του ελέγχου H 0 : θ = 0 έναντι της H1 : θ = −1 . ii) Ν.δ.ό. αν n = 25 και α=0,05, η ισχύς του ισχυρότατου ελέγχου είναι 0,999, όταν η H1 είναι αληθής. 4
Λύση Πιθανοφάνεια L (θ ) = f ( X 1 , X 2 ,..., X n ) =
i)
n
∏ f ( x ,θ ) = i
i =1
1 n 2 1 n 2 − − 1 2 2 π − x − θ = π − x − θ 2 exp 2 exp ( ) ( ) ( ) ( ) ∑ ∏ i i 2 i =1 2 i =1 n
1 n 2 1 n 2 exp − ∑ xi ( 2π ) exp − ∑ ( xi − 0 ) L (θ 0 ) L ( 0 ) 2 i =1 2 i =1 = = = = n 2 1 n 1 n L (θ1 ) L ( −1) 2 − 2 2 exp 1 exp − x − − π ( ) ∑ i ( ) − ∑ ( xi + 1) 2 i =1 2 i=1 n n n n 1 1 1 2 2 exp − ∑ xi 2 + ∑ ( xi + 1) = exp ∑ ( xi + 1) − ∑ xi 2 = 2 i =1 i =1 2 i=1 2 i =1 −
n 2
n n 1 n 1 n exp ∑ xi 2 + 2 xi + 1 − ∑ xi 2 = exp ∑ ( xi 2 + 2 xi + 1) − ∑ xi 2 = i =1 i =1 2 i =1 2 i =1 n n n 1 n 1 n exp ∑ xi 2 + ∑ 2 xi + ∑1 − ∑ xi 2 = exp 2∑ xi + n = i =1 i =1 i =1 2 i=1 2 i =1
n 1 ln k ln k 1 n exp n X + ≤ k ⇒ n X + ≤ ln k ⇒ X + ≤ ⇒ X≤ − =c 2 2 2 n n 2 Άρα η κρίσιµη περιοχή µεγέθους α είναι: C = ( X 1 , X 2 ,..., X n ) : X ≤ c , έτσι ώστε P ( ( X 1 , X 2 ,..., X n ) | H 0 ) = a
{
}
ln k 1 − , δηλαδή απορρίπτουµε την H 0 έναντι n 2 της H1 , όταν C = ( X 1 , X 2 ,..., X n ) : X ≤ c
ii)
Είδαµε ότι: X ≤ c , c =
{
}
άρα P ( ( X 1 , X 2 ,..., X n ) | H 0 ) = a
(
)
P ( C | θ = 0 ) = a = 0,05 ⇔ P X ≤ c | θ = 0 = 0,05 ⇔ X − 0 c − 0 = 0,05 ⇔ P ( z ≤ 5c ) = 0,05 ⇔ 5c = − z = −1,645 ⇒ P ≤ 0,05 1 1 25 25 1,645 c=− , άρα απορρίπτουµε όταν z < −1,645 ( Φ ( −1,645 ) = 0,05 ) , 5 z0,05 = 1,645 ⇒ − z0,05 = −1,645 Συνάρτηση ισχύος: Π (θ ) = P ( C | θ ) , όταν H1 είναι αληθής
(
)
(
)
Π (θ1 ) = P ( C | θ = −1) = P X ≤ c | θ = −1 = P X ≤ −0,329 | θ = −1 =
5
X + 1 − 0,329 + 1 = P ( z ≤ 3,3) = Φ ( 3,3) = 0,999 , ό.έ.δ. P ≤ 1 1 25 25
6