Μπορείτε να βρείτε ύλες, ανακοινώσεις , παλαιότερα θέματα, προγράμματα, λυμένα θέματα καθώς και άλλα φυλλάδια στο τραπεζάκι της Δαπ η στο dap-oikonomikou.gr Για απορίες γραφτείτε στο Φόρουμ του https://www.facebook.com/groups/econnomikis
Για οποιαδήποτε άλλη πληροφορία μπορείτε επικοινωνήσετε στο dap.oikonomikou@gmail.com
ΔΑΠ-ΟΙΚΟΝΟΜΙΚΟΥ ΠΑΝΤΑ ΚΟΝΤΑ ΣΤΟ ΦΟΙΤΗΤΗ
να
Σεπτέµβριος 2008 – Στατιστική 2 – Λυµένα Θέµατα
2
ΘΕΜΑΤΑ * να γραφούν 2 από τα 3 θέµατα ΘΕΜΑ I (βαθµοί 5) Οκτώ υποψήφιοι διαγωνίστηκαν στη Στατιστική και τα Μαθηµατικά και έλαβαν την παρακάτω βαθµολογία: Υποψήφιοι Μαθηµατικά Στατιστική
Α 61
Β 40
Γ 28
∆ 60
Ε 71
Ζ 17
Η 28
Θ 47
84 72 43 51 62 31 27 58 a. Υπολογίστε τον συντελεστή συσχέτισης r κατά Pearson και βρείτε την καλύτερη εκτίµηση του βαθµού στη Στατιστική που πρέπει να πάρει ο υποψήφιος που έχασε την εξέταση, αλλά έλαβε 67 στα Μαθηµατικά. Με τι ποσοστό εµπιστοσύνης θα το έκανε ο καθηγητής αυτό; b. Ελέγξτε την υπόθεση H 0 : β1 = 0 ενάντια της Hα : β1 ≠ 0 , σε επίπεδο σηµαντικότητας α = 0.05 . c. Ελέγξτε την υπόθεση H 0 : ρ = 0 ενάντια της Hα : ρ > 0 , σε επίπεδο σηµαντικότητας α = 0.05 . ¾ ∆ίνεται ότι: t6 = 1.94 και F 1,6,0.05 = 5.99 ,
∑Y
2
= 25588 ,
∑X
2
∑ Y = 428
,
∑ X = 352
,
∑ YX = 20679
,
= 18028 .
ΘΕΜΑ II (βαθµοί 5) a. Ποια η έννοια του µέγιστου περιθωριακού σφάλµατος (Maximum Marginal Error); Η εταιρεία δηµοσκοπήσεων ALCO πραγµατοποίησε δηµοσκόπηση από 20 – 24 Σεπτεµβρίου 2002. Το δείγµα για την Αθήνα ήταν 1.200 άτοµα. Για το ∆ήµο Αθηναίων έδωσε σηµειακή εκτίµηση υπέρ ενός υποψηφίου 44,3%. Εσείς που µάθατε Στατιστική, πώς θα πρέπει να το ερµηνεύσετε αυτό το ποσοστό µε τη χρήση διαστήµατος εµπιστοσύνης b. ∆ύο ανεξάρτητα δείγµατα µεγέθους 60 και 70 επιλέγονται από πληθυσµό ανδρών (Α) και γυναικών (Γ) ηλικίας 40 – 59 ετών για να συγκριθεί η επίδραση ενός υπνωτικού χαπιού στα δύο φύλα. Καταγράφηκε ο αριθµός των ωρών που κοιµήθηκαν τα επιµέρους άτοµα µετά τη λήψη του χαπιού και τα αποτελέσµατα 2 2 συνοψίζονται ως εξής: X A = 8.65 , S A = 9 , X Γ = 7.15 , S Γ = 5 .
i) Να εξεταστεί αν η επίδραση του υπνωτικού χαπιού είναι ίδια στους άνδρες και τις γυναίκες; ii) Ποια είναι η ακριβής πιθανότητα της παρατηρούµενης τιµής του κατάλληλου στατιστικού; ∆ηλαδή βρείτε την p-value. ¾ ∆ίνεται ότι: z 0.025 = 1.96 και G ( 3.19 ) = 0.9993 .
ΘΕΜΑ III (βαθµοί 5) Τέσσερις διαφορετικές µάρκες ελαστικών αυτοκινήτου µε τρία set στην κάθε µάρκα ελέγχονται στο ίδιο αυτοκίνητο και κάτω από τις ίδιες συνθήκες. Ο µέσος αριθµός ποδών που απαιτείται για να σταµατήσουν τρέχοντας µε 10 µίλια/ώρα καταγράφεται για κάθε οµάδα των τεσσάρων τύπων. Τύπος I: 22 24 23 Τύπος II: 23 26 23 Τύπος III: 24 26 25 Τύπος IV: 24 25 23 a. Υποθέτοντας ότι ο µέσος αριθµός ποδών που απαιτείται για το σταµάτηµα είναι κανονικά κατανεµηµένος, ελέγξτε σε επίπεδο σηµαντικότητας α = 0.05 την ποιότητα των τεσσάρων τύπων ελαστικών, δηλαδή αν υπάρχουν διαφορές στις αποδόσεις τους. b. Βρείτε ένα 95% διάστηµα εµπιστοσύνης για τη διαφορά µ II − µ IV . ¾ ∆ίνεται ότι: t 0.05,3,8 = 4.07 , t 0.025,4 = 3.4954 .
Μία προσφορά της ∆ΑΠ Οικονοµικού – www.dap-oikonomikou.gr
Σεπτέµβριος 2008 – Στατιστική 2 – Λυµένα Θέµατα
3
ΛΥΣΕΙΣ ΘΕΜΑ I
r=
a.
∑ XY − n X Y − n ( X ) ⎤ ⎡∑ Y ⎥⎦ ⎢⎣
, ⎤ −n Y ⎥⎦ 352 428 = 44 , Y = = 53,5 Υ : Στατιστική, Χ : Μαθηµατικά, X = 8 8 20674 − ( 8 × 44 × 53.5 ) r= ⇔ r = 0.706 . ⎡18028 − ( 8 × 442 ) ⎤ ⎡ 25588 − ( 8 × 53.52 ) ⎤ ⎣ ⎦⎣ ⎦
{
⎡ X2 ⎢⎣ ∑
2
( )
2
}
2
{
}
Για να βρούµε την καλύτερη εκτίµηση, θα βρούµε την παλινδρόµηση της Υ πάνω στη Χ και θα θέσουµε όπου x = 67 : ∧ n ( XY ) − ( X )( Y ) yi = b0 + b1 xi και b1 = ∑ 2 ∑ ∑2 n (∑ X ) − (∑ X )
b1 = ⇒
∧
y
i
8 × 20679 − ( 352 )( 428 ) 8 ×18028 − ( 352 )
= 21.512 + 0.727 xi ⇒
2
(
)
= 0.727 και b0 = y + b1 x = 53.5 − ( 0.727 × 44 ) = 21.512 . ∧
∧
yi ( x = 67 ) = 21.512 + ( 0.727 × 67 ) ⇔ yi = 70.221 .
b. H 0 : β1 = 0 και H1 : β1 ≠ 0. Όµως : t =
b ∧
1− 0
σb
. Αλλά, περιοχή απόρριψης : t ≥ t n − 2, α , 2
∧
1
∧ 2
∧
σb ∧
1
S
2 x
∑x =
2
()
−n x
2
n −1 ∧ 2
σ
ε
=
=
σ
∧ 2
ε
∑ ( x − x)
2
και σ ε =
18028 − 8 × 44 = = 362.85 7 2
S
2 y
n −1 2 2 2 ⎡ S y − b1 S x ⎤⎦ n−2 ⎣
∑y =
2
( )
−n y
2
n −1
7⎡ 2 384.28 − ( 0.727 ) × 362.85⎤ = 224.587 ⎦ 6⎣
∧
σb ∧
1
25588 − 8 × ( 53.5 ) = = 384.28 7 2
=
224.587 = 0.088 2540
0.727 ⇔ t = 8.261 0.088 Επειδή t = 8.261 > 1.94 , η H 0 : β1 = 0 απορρίπτεται µε πιθανότητα 95%. Άρα, β1 ≠ 0 (στατιστικά →t =
σηµαντικός). c.
H 0 : ρ = 0 και H1 : ρ > 0. Όµως : t =
r n−2
. Αλλά, στατιστική περιοχή απόρριψης : t ≥ t n − 2, α 1− r2 0.706 × 8 − 2 t= ⇔ t = 2.445 . 2 1 − ( 0.706 )
Επειδή, t = 2.445 > 1.64 = zα , η H 0 απορρίπτεται, άρα ρ > 0.
Μία προσφορά της ∆ΑΠ Οικονοµικού – www.dap-oikonomikou.gr
Σεπτέµβριος 2008 – Στατιστική 2 – Λυµένα Θέµατα
4
ΘΕΜΑ II a. Θα χρησιµοποιήσουµε τον τύπο του διαστήµατος εµπιστοσύνης για το ποσοστό ρˆ διωνυµικού πληθυσµού. Το αληθινό ποσοστό ρ θα βρίσκεται, µε πιθανότητα 95%, στο διάστηµα:
⎡⎛ ρˆ (1 − ρˆ ) ⎞ ⎛ ρˆ (1 − ρˆ ) ⎞ ⎤ ⎢⎜ ( ρˆ − za 2 ) × ⎟ , ⎜ ( ρˆ − za 2 ) × ⎟ ⎥ , ρˆ = 0.443 και za 2 = 1.96. ⎟ ⎜ ⎟⎥ n n ⎢⎣⎜⎝ ⎠ ⎝ ⎠⎦ ⎡⎛ 0.443 × 0.557 ⎞ ⎛ 0.443 × 0.557 ⎞ ⎤ ⎢⎜⎜ ( 0.443 − 1.96 ) × ⎟⎟ , ⎜⎜ ( 0.443 + 1.96 ) × ⎟⎟ ⎥ ⇔ 1200 1200 ⎢⎣⎝ ⎠ ⎝ ⎠ ⎥⎦ ⇔ ⎡⎣( 0.443 − 0.0143) , ( 0.443 + 0.0143) ⎤⎦ ⇔ ⇔
( 0.4287, 0.4573)
ή ( 42.87%, 45.73% )
Το δειγµατικό ποσοστό βρίσκεται στο διάστηµα εµπιστοσύνης για το ποσοστό ρ µε µικρό σφάλµα 1.43%, άρα η δηµοσκόπηση θεωρείται αξιόπιστη! b. nA = 60 και n Γ = 70 και X A = 8.65 και
S
2 A
= 9 και X Γ = 7.15 και
S
2 Γ
=5.
i) Έχουµε έλεγχο διαφοράς µέσων πληθυσµών µε άγνωστες διακυµάνσεις (θεωρούµε ότι οι πληθυσµοί είναι κανονικοί). Υπόθεση Ελέγχου : H 0 : µ Α − µ Γ = 0 ή µ Α = µ Γ και H1 : µ Α − µ Γ ≠ 0 ή µ Α ≠ µ Γ . Και η Στατιστική ελέγχου είναι : z =
X A − XΓ
S
2
2
, µε περιοχή απόρριψης της H 0 : z ≥ zα 2
+ SΓ nA n Γ 8.65 − 7.15 → z= ⇔ z = 3.188 . 9 5 + 60 70 Επειδή, z = 3.188 > 1.96 = za 2 , η H 0 απορρίπτεται, άρα µα ≠ µγ A
ii)
Μία προσφορά της ∆ΑΠ Οικονοµικού – www.dap-oikonomikou.gr
Σεπτέµβριος 2008 – Στατιστική 2 – Λυµένα Θέµατα
5
ΘΕΜΑ III a. Έλεγχος ανάλυσης διακύµανσης ως προς ένα παράγοντα (απόδοση ελαστικών) Υπόθεση: H 0 : µ1 = µ 2 = µ3 = µ 4 = µ και H1 : µi ≠ µ , για τουλάχιστον µία τιµή του i = 1, 2,3, 4 .
ΜΜ∆ (κ − 1) ΜΕ∆ κ ( n − 1)
Στατιστική Ελέγχου: f =
Περιοχή απόρριψης: F ≥ f α, κ −1, κ ( n −1) , όπου
1⎛ 1 2⎞ T Μεταβλητότητα Μεταξύ ∆ειγµάτων: ΜΜ∆ = ⎜ ∑ Ti 2 − n⎝ κ n .. ⎟⎠ 1 2 Μεταβλητότητα Ολόκληρου του ∆είγµατος: ΜΟ∆ = ∑∑ xij2 − T κ n .. Μεταβλητότητα Εντός ∆ειγµάτων ή Τυχαία Σφάλµατα: ΜΕ∆ = ΜΟ∆ – ΜΜ∆ Ti.2 : είναι το άθροισµα των παρατηρήσεων των κ δειγµάτων xij : i = 1, 2, 3, 4, …, κ και j = 1, 2, 3, 4, …, n είναι η nj παρατήρηση του i δείγµατος.
ΠΙΝΑΚΑΣ ΑΝΑΛΥΣΗΣ ∆ΙΑΚΥΜΑΝΣΗΣ ΩΣ ΠΡΟΣ ΕΝΑ ΠΑΡΑΓΟΝΤΑ ΠΗΓΗ ΑΘΡΟΙΣΜΑ ΒΑΘΜΟΙ ΜΕΣΟ ΑΘΡΟΙΣΜΑ ∆ΙΑΚΥΜΑΝΣΗΣ ΤΕΤΡΑΓΩΝΩΝ ΕΛΕΥΘΕΡΙΑΣ ΤΕΤΡΑΓΩΝΩΝ Παράγουν
ΜΜ∆ = 6
Κατάλοιπα
ΜΕ∆ = 12
Σύνολο
ΜΟ∆ = 18
F - ΣΤΑΤΙΣΤΙΚΗ
ΜΜ∆ =2 S12 2 κ −1 1,333 f = 2 = ΜΕ∆ 12 S2 12 8 2 = κ ( n - 1 ) = 8 S2 = κ ( n − 1) 8 S12 =
κ-1=3
κn - 1
n = 3, κ = 4, T1. = 69, T2. = 72, T3. = 75, T4. = 72
∑T
2 i.
= 69 + 72 + 752 + 722 = 20754, T00 = 69 + 72 + 75 + 72 = 288, T002 = ( 288 ) = 82944 2
2
2
1⎛ 1 ⎞ = 6930, ΜΜ∆ = ⎜ 20754 − × 82944 ⎟ = 6, 3⎝ 4×3 ⎠ 6 ΜΟ∆ = 18, ΜΕ∆ = 18 - 6 = 12, f = 3 1.333 12 8 Επειδή f = 1.333 < 4.07 = f 0.05, 3, 8 , γίνεται δεκτή η Η0 µε πιθανότητα 95%. Άρα, δεν υπάρχει διαφορά
∑∑ x
2 ij
στην απόδοση των ελαστικών! b. Το διάστηµα εµπιστοσύνης για τη διαφορά µ II − µ IV είναι (πληθυσµοί κανονικοί µε άγνωστες αλλά ίσες
(
)) (
(
))
(
διακυµάνσεις) : ⎡ xII − xIV − t nII + nIV − 2, a 2 × SΘ , xII − xIV + t nII + nIV − 2, a 2 × SΘ ⎤ . ⎣ ⎦
SΘ =
( nII − 1) S II2 + ( nIV − 1) S IV2 ⎛
1 1 ⎞ 72 + = 24 και xIV = 24 και ⎜ ⎟ και xII = n n 3 IV ⎠ ⎝ II
nII + nIV − 2
∑ xIV2 = 1730 και SII2
∑x =
2 II
( )
− nII xII nII − 1
2
1734 − 3 × 242 = = 3 και S IV2 = 2
∑x
2 IV
( )
− nIV xIV nIV − 1
∑x 2
=
2 II
= 1734 και
1730 − 3 × 242 =1 2
Μία προσφορά της ∆ΑΠ Οικονοµικού – www.dap-oikonomikou.gr
Σεπτέµβριος 2008 – Στατιστική 2 – Λυµένα Θέµατα
SΘ =
( 3 − 1) 3 + ( 3 − 1)1 ⎛ 1 + 1 ⎞ = 1.154 . Άρα, το διάστηµα εµπιστοσύνης είναι: 3+3− 2
⎜ ⎟ ⎝3 3⎠
⎡⎣( 24 − 24 − ( 3.4954 × 1.154 ) ) , ( 24 − 24 + ( 3.4954 × 1.154 ) ) ⎤⎦ ⇔ ⇔ ( − 4.033 , + 4.033)
Μία προσφορά της ∆ΑΠ Οικονοµικού – www.dap-oikonomikou.gr
6