《主 題 一》 敘述統計.................................................... 1-1 《主 題 二》 機率論........................................................ 2-1 《主 題 三》 單變數函數之機率分配............................ 3-1 《主 題 四》 雙變數函數之機率分配............................ 4-1 《主 題 五》 特殊機率分配............................................ 5-1 《主 題 六》 抽樣方法與抽樣分配................................ 6-1 《主 題 七》 估 計........................................................ 7-1 《主 題 八》 假設檢定.................................................... 8-1 《主 題 九》 變異數分析................................................ 9-1 《主 題 十》 迴歸與相關................................................ 10-1 《主題十一》 無母數統計................................................ 11-1 《附 錄》 統計機率分配表........................................ 12-1
主題一 敘述統計
1 -3
1 在一組隨機樣本 17、15、23、7、9、13 中,已得知變異數 33.2,計算 平均數、變異係數(CV),以及全距(range)與四分位距(IQR)各 是多少?(12 分)
【普考】
n
: X
xi ∑ i =1
CV
n
17 + 15 + 23 + 7 + 9 + 13 14 6
33.2 S 0.4116 X 14
Range Max Min 23 7 16 資料由小到大排列:7, 9, 13, 15, 17, 23,n 6
n 6 1.5 Q1 X(2) 9 4 4 3n 18 4.5 Q3 X(5) 17 4 4 IQR Q3 Q1 17 9 8
2 請回答下列問題: 寫出樣本平均數與樣本變異數的計算公式。(8 分) 寫出母體(population)平均數與母體變異數的定義及計算公式。(8 分) 說明什麼狀況下,會以樣本平均數來替代(估計)母體平均數?(5 分)
【地四】
1-4 n
:樣本平均數 X
xi ∑ i =1
n n 1 樣本變異數 S2 [ ∑(x i − x)2 ] n − 1 i =1
母體平均數為所有資料在數線上的一個平衡的位置,其公式為 N
∑ xi i =1
N
。
母體變異數為離均差平方和再除以總個數,它是所有變異量數中 N 1 最常用且最穩定的一個,其公式為2 [ ∑(x i −)2 ]。 N i =1 若欲計算母體的母數且須用到母體平均數時,但母體平均數未知,
則可以利用樣本平均數來替代(估計)母體平均數。
3 甲公司品管檢驗員抽驗該公司生產之燈泡 20 盒,得各盒不良品件數 x 的分配如下表所示: X
0
1
2
3
4
5
盒數
1
8
5
3
2
1
試求不良品件數的下列項目:(每小題 5 分,共 25 分) 平均數。 中位數。 眾數。 標準差。 四分位距(Interquartile Range)。
【地四】
K
: X
mifi ∑ i =1 n
01 1 8 2 5 3 3 4 2 51 2 20
主題一 敘述統計
Me
X(10)X(11) 2
1-5
2 2 2 2
Mo 1(出現最多次) K
∑ f i mi2 1 02 8 12 5 22 3 32 2 42 1 52 i =1
112 標準差 S
K 1 1 [∑ f i m i2 nx 2] [112 202 2] 201 n 1 i =1
標準差 S 1.2978
X X n 20 11 5 Q1 (5) (6) 1 4 4 2 2 X X 3 3 33 n 20 15 Q3 (15) (16) 3 4 4 2 2
四分位距 IQR Q3 Q1 3 1 2
4 某大學統計學系之大一統計學課程,依學生高中時期之數學程度分成甲 、乙兩班,甲班學生 40 人,其統計學期末考試之平均成續為 35 分,標 準差為 5 分;乙班學生 60 人,其平均成績為 80 分,標準差為 4 分。 試問兩班全體學生統計學期末考試之平均成績為多少分? 甲班學生之考試成績頗不理想,故老師決定每位學生之成績均「乘以
2 後再減 5 分」,試問經調整分數後,該班學生成績之平均數及標準 差分別為何? 乙班學生中有 1 人夾帶小抄舞弊,其成績為 60 分,經開會決議應以
0 分計算,試問乙班統計學期末考試成績之平均數標及標準差應修正 為多少分?
: x
35408060 62 4060
【普考】
1-6 設調整後成績為 Y Y 2X 5 Y 2 X 5 2 35 5 65 SY 2SX 2 5 10 x
806060 79 60 n
調整前 ∑ X i2 16 60 60 802 384960 i =1 n
調整後 ∑ X i2 384960 602 381360 i =1
S2
n 1 1 [ ∑ X i2 n X 2 ] [381360 60 792] 115 n 60 i =1
S 115 10.72
5 8 個項目分別為:溫度、性別、智商、體重、距離、所屬學院別、滿意 度分數(1, 2, 3)、教育程度(小學、中學、大學)。 那些項目為衡量尺度( Measurement Scale )中的順序尺度( Ordinal
Scale)? 那些項目為衡量尺度中的區間尺度(Interval Scale)? 那些項目為衡量尺度中的比例尺度(Ratio Scale)?
【地四】
:滿意度,教育程度。 溫度,智商。 體重,距離。
6 某連鎖店在甲、乙兩城市各分店之業績如下:(資料自小排到大,省略 中間部分資料) 甲:21 23 23 27……58 60 61 65 65 122
主題一 敘述統計
1 -7
乙:24 24 25 28………………68 69 69 70 72 彙整資料如下: 城市 分店數
業 績 平均數 標準差 全距 中位數 第 1 四分位 第 3 四分位
甲
35
49.8
12.5
101
42
35
53
乙
40
44.3
7.3
48
46
36
58
甲、乙兩城市之業績,何者較差?請述明理由。 甲、乙兩城市之業績,何者較分散?請述明理由。 如乙城市各分店之業績皆加 7,則乙城市業績之平均數、中位數及標 準差分別變化多少?
【關務四】
:此題有離群值,故以中位數代表資料集中的位置。因為中位數不受
離群值的影響。甲的中位數為 42,乙的中位數為 46。所以甲城市 的業績較乙城市差。 此題有離群值,做以四分位差做為資料的分散程度:
Q 3Q1
5335 9 2 2 Q Q1 5836 乙城市 Q.D 3 11 2 2
甲城市 Q.D
乙城市的業績較甲城市分散 Y X 7 Y X 7 乙城市的平均數為 44.3 7 51.3 Y X 7 Md 也會加 7 乙城市的中位數為 46 7 53 Y X 7 Y X 乙城市的標準差為 7.3
7 生產一批貨品其重量(單位為 0.1 公斤)如下莖葉圖所示:
1-8 9 8 7 6 5 4 3
27 148 0234667 123558 8 8
試畫出箱型圖(Box Plot),並判定是否有離群值?
【普考】
:資料由小排列到大為 38 , 58 , 61 , 62 , 63 , 65 , 65 , 68 , 70 , 72 , 73 , 74 ,
76 , 76 , 77 , 81 , 84 , 88 , 92 , 97 n 20
Min 38,Max 97 x +x 20 63 + 65 n 5 Q1 (5) (6) 64(單位為 0.1 公斤) 4 4 2 2 x +x 20 72 + 73 n 10 Q2 (10) (11) 72.5(單位為 0.1 公斤) 2 2 2 2 x +x 3n 60 77 + 81 15 Q3 (15) (16) 79(單位為 0.1 公斤) 4 4 2 2 箱型圖:(單位為 0.1 公斤)
離群值為在(Q1 1.5 IQR , Q3 1.5 IQR)以外 (64 1.5 15 , 79 1.5 15)以外 (41.5 , 101.5)以外 有離群值 38(單位為 0.1 公斤)
8 下列是 10 位學生的身高資料:
主題一 敘述統計
1 -9
172 168 164 170 176 160 154 179 160 166 求中位數。 求四分位距(Inter Quartile Range)。 求第 90 百分位數。
【普考】
:由小到大:(n 10)
154,160,160,164,166,168,170,172,176,179 X(5)X(6) 166168 Me 167 2 2 n 10 2.5 Q1 X(3) 160 4 4 3n 30 7.5 Q3 X(8) 172 4 4 IQR Q3 Q1 172 160 12
9n 90 9 10 10 X(9)X(10) 176179 P90 177.5 2 2
9 下列是 5 位學生的身高與體重資料: 身高(x)
172
168
164
170
176
體重(y)
62
54
58
64
62
請問那一個變數的離勢(Dispersion)較大? :身高與體重單位不同,利用變異係數判斷變數的離勢 身高(x):172 , 168 , 164 , 170 , 176 n
x i 172 168 …… 176 850 ∑ i =1 n
x i2 1722 1682 …… 1762 144580 ∑ i =1
【高三】
1-10 n
x
xi ∑ i =1
n
850 170 5 n
(∑ x i)2 1 n 2 1 8502 x [∑ x i − i =1 ] [144580 − ] 4 n i =1 n 5 5 4 CV1 x 0.0235 x 170 體重(y):62 , 54 , 58 , 64 , 62 n
y i 62 54 …… 62 300 ∑ i =1 n
yi2 622 542 …… 622 18064 ∑ i =1 n
y
yi ∑ i =1 n
300 60 5 n
(∑ yi)2 1 1 3002 y [∑ yi2 − i =1 ] [18064 − ] 3.58 n i =1 n 5 5 y 3.58 CV2 0.0597 y 60 n
CV1 CV2 體重的離勢比身高大
10 若有一組 80 筆的樣本資料,資料已整理成次數分配表,如下表:(每 小題 5 分,共 25 分) 組 限
30~50
50~70
70~90
90~110
110~130
組次數
5
20
30
40
5
試計算:平均數。標準差。中位數。第 28 個百分位數。第
3 個四分位數。
【普考】
主題一 敘述統計
1-11
組 限
30~50
50~70
70~90
90~110
110~130
組中點
40
60
80
100
120
組次數
5
20
30
40
5
以下累積次數
5
25
55
95
100
:
此題應該共有 100 筆資料而非 80 筆 K
x
mifi ∑ i =1
40 × 5 + 60 × 20 + 80 × 30 + 100 × 40 + 120 × 5 84 100
n K 1 S2 [ ∑ f i m i2 nx 2 ] n − 1 i =1
其中 f i m i2 5 402 20 602 30 802 40 1002 5 1202 744000 S
1 [744000 − 100 × 84 2] 19.6946 100 − 1
N 100 50(個) 2 2 中位數落在 70~90 組
100 N − 25 − Fi −1 Md a i −1 2 C 70 2 20 86.67 30 fi 第 28 個百分位數落在 70~90 組 28 N − Fi −1 28 − 25 100 P28 C 70 20 72 fi 30
3 3 N 100 75(個) 4 4 Q3 落在 90~110 組
3 N − Fi −1 Q3 a i −1 4 C fi 3 × 100 − 55 90 4 20 100 40
1-12
11 下列資料是某快遞公司在運送 50 個小額包裹費用(單位:元)的次數 分配表如下:(20 分) 組別
組 界
次 數
1
20 X 32
8
2
32 X 44
20
3
44 X 56
12
4
56 X 68
6
5
68 X 80
4
組中點
相對次數
累積相對次數
描繪出相對次數直方圖。 依此計算平均數。 : 組 別
【關務四】
組 界
次 數
組中點
相對次數
累積相對次數
1
20 X 32
8
26
0.16
0.16
2
32 X 44
20
38
0.40
0.56
3
44 X 56
12
50
0.24
0.80
4
56 X 68
6
62
0.12
0.92
5
68 X 80
4
74
0.08
1.00
K
x
mifi ∑ i =1 n
26 × 8 + 38 × 20 + 50 × 12 + 62 × 6 + 74 × 4 44.72(元) 50