第一章 敘述統計 ...............................................
1-1
1-1 統計的基本概念 ............................................................ 1-2 1-2 次數分配表與統計圖 .................................................... 1-5 1-3 集中量數(Measure of Central Tendency) ................. 1-11 1-4 變異量數(Measure of Dispersion) ............................ 1-17 1-5 偏態與峰態係數 ............................................................ 1-30
第二章 機率論 ...................................................
2-1
2-1 集合論(Set) ............................................................... 2-2 2-2 機率論 ............................................................................ 2-5 2-3 幾何機率 ........................................................................ 2-8 2-4 條件機率與獨立事件 .................................................... 2-9 2-5 貝氏定理 ........................................................................ 2-16
第三章 單變數函數之機率分配 .........................
3-1
3-1 機率函數 ........................................................................ 3-2 3-2 累積分配函數(Cumulative Distribution Function) .. 3-4 3-3 期望值與變異數 ............................................................ 3-8 3-4 動差母函數(Moment Generating Function) ............. 3-14 3-5 馬可夫不等式與柴比雪夫不等式................................. 3-17 3-6 單變數函數之變數變換 ................................................ 3-21
第四章 雙變數函數之機率分配 .........................
4-1
4-1 聯合機率函數(Joint Probability Function) ............... 4-2 4-2 條件機率分配 ................................................................ 4-7 4-3 條件期望值與條件變異數............................................. 4-10 4-4 共變數與相關係數 ........................................................ 4-14 4-5 雙變數函數之變數變換 ................................................ 4-23
第五章 特殊機率分配 ........................................
5-1
5-1 離散均等分配(Discrete Uniform Distribution) ........ 5-2 伯努力分配(Bernoulli Distribution) .........................
5-2
5-3 二項分配(Binomial Distribution) .............................
5-8
5-5
5-4 多項分配(Multinomial Distribution) ........................ 5-14 5-5 超幾何分配(Hyper Geometry Distribution) ............. 5-18 5-6 幾何分配(Geometry Distribution) ............................ 5-24 5-7 負二項分配(Negative Binomial Distribution) .......... 5-28 5-8 卜瓦松分配(Poisson Distribution) ............................ 5-32 5-9 連續均等分配(Continuous Uniform Distribution) ... 5-39 5-10 常態分配(Normal Distribution) ................................ 5-45 5-11 指數分配(Exponential Distribution) ......................... 5-57 5-12 Gamma Distribution ....................................................... 5-62 5-13 Beta 分配........................................................................ 5-67 5-14 順序統計量 .................................................................... 5-71
第六章 抽樣方法與抽樣分配 .............................
6-1
6-1 抽樣方法 ........................................................................ 6-2 6-2 抽樣分配 ........................................................................ 6-7 6-3 大數法則與中央極限定理............................................. 6-16 6-4 常用的抽樣分配 ............................................................ 6-22 2
第七章 估計 ......................................................
7-1
7-1 點估計(Point Estimation) .......................................... 7-2 7-2 求估計式之方法 ............................................................ 7-17 7-3 母體平均數的區間估計............................................. 7-33 7-4 兩獨立母體平均數差1 2 之區間估計 .................. 7-44 7-5 兩相關母體平均數差1 2 之區間估計 .................. 7-52 7-6 常態母體變異數2 之區間估計 ................................... 7-54
12 之區間估計 .......................... 7-60 22 7-8 母體比例 p 之區間估計 ................................................ 7-65 7-7 兩常態母體變異數比
7-9 兩母體比例差 p1 p2 之區間估計 ............................... 7-69
第八章 假設檢定 ...............................................
8-1
8-1 概述 ............................................................................. 8-2 8-2 作業特性函數與檢定力函數......................................... 8-9 8-3 母體平均數之檢定 .................................................... 8-11 8-4 兩獨立母體平均數差1 2 之檢定........................... 8-20 8-5 兩相關母體平均數差1 2 之檢定........................... 8-25 8-6 常態母體變異數2 之檢定............................................ 8-28
12 之檢定 .......................... 8-31 22 8-8 單一母體比例 p 之檢定 ................................................ 8-36 8-7 兩獨立常態母體變異數比
8-9 兩獨立母體比例差 p1 p2 之檢定 ............................... 8-42 8-10 兩相關母體比例差 p1 p2 之檢定 ............................... 8-46 8-11 最強力檢定與概度比檢定............................................. 8-48
第九章 變異數分析 ...........................................
9-1
9-1 概述 ............................................................................. 9-2 9-2 單因子變異數分析 ........................................................ 9-4 9-3 母體平均數線性組合之估計與檢定............................. 9-14 9-4 變異數同質性的檢定 .................................................... 9-23 9-5 多重比較法(Multiple Comparison) .......................... 9-26 9-6 二因子未重複試驗變異數分析..................................... 9-33 9-7 二因子重複試驗變異數分析......................................... 9-42 9-8 拉丁方格 ........................................................................ 9-50
第十章 簡單迴歸與相關 ....................................
10-1
10-1 概述 ............................................................................. 10-2 10-2 簡單直線迴歸 .............................................................. 10-3 10-3 迴歸分析之變異數分析 .............................................. 10-26 10-4 簡單相關 ...................................................................... 10-32 10-5 殘差分析(Residual Analysis).................................. 10-50 10-6 特殊迴歸模式 .............................................................. 10-53
第十一章 複迴歸與複相關 .................................
11-1
11-1 複迴歸模式分析 .......................................................... 11-2 11-2 複相關與複判定係數 .................................................. 11-13 11-3 偏相關與偏判定係數 .................................................. 11-16 11-4 啞變數(Dummy Variable) ....................................... 11-20
第十二章 無母數統計 ........................................
12-1
12-1 卡方檢定 ...................................................................... 12-2 12-2 符號檢定(Sign Test) ............................................... 12-18 12-3 Wilcoxon 符號等級檢定(Wilcoxon Sign Rank Test) 12-23 4
12-4 Wilcoxon 等級和檢定(Wilcoxon Rank Sum Test) 12-26 12-5 M-W-W 檢定(Mann-Whitney-Wilcoxon Test) ...... 12-28 12-6 K-W 檢定(Kruskal-Wallis Test) ............................. 12-30 12-7 Friedman 檢定 .............................................................. 12-33 12-8 中位數檢定 .................................................................. 12-35 12-9 Spearman Rank 相關係數 ............................................ 12-37 12-10 連檢定或隨機性檢定(Run Test) ............................ 12-41
第十三章 統計決策、時間數列與指數...............
13-1
13-1 統計決策理論 .............................................................. 13-2 13-2 時間數列 ...................................................................... 13-4 13-3 指數 ............................................................................. 13-8
附錄 統計機率分配表 ........................................
14-1
表一 標準常態分配表 .......................................................... 14-3 表二 t 分配右尾百分點 t ................................................... 14-5 表三 2 分配右尾百分比2 (d.f.) .................................. 14-6 表四 F 分配表....................................................................... 14-7 表五 Spearman 等級相關係數的臨界值 ............................. 14-13
1-2 統計學
1-1 統計的基本概念 一、統計(Statistics)的意義 統計學是研究在母體未知條件下的一種方法或過程,藉由科學的精神 對樣本資料做研判而下決策的一門知識,教導我們如何蒐集、整理及 分析資料,透過機率的方式,對事情下決策或預測。 推論 母 體 Population
樣 本 Sample 抽樣
其中母體的值稱為母數或參數,樣本的值稱為樣本統計量。其符號如 下: 母體
平均數 ,M
樣本
x
變異數 2 2
s , ŝ
相關係數
2
r
比例
P p̂
二、統計的種類 敘述統計(Descriptive Statistics): 將雜亂無章的資料利用敘述、測量、計算……等方法加以整理、分析 、解釋。主要是對母體或樣本特性做個別的討論。 推論統計(Inferentail Statistics): 由於母群體的資料過多,則利用隨機抽樣得到適當的樣本數,將樣本 研究後之結果來推論母群體的特性。主要探討母體與樣本之間的關聯 性。推論統計可分為母數統計學( Parametric Statistics)與無母數統 計學(Nonparametric Statistics)。 實驗設計(Experimental Design): 實驗設計為近代的產物。主要為透過操弄自變項觀察對依變項的影響 ,了解其因果關係。 三、測量尺度種類 S. S. Stevens 將測量尺度依不同變數的特性,分成以下 四種變數【原住民三】 名義變項(Nominal Variable): 又稱類別變項,通常為不連續變項,主要目的為分辨類別。例如:性
第一章 敘述統計 1-3
別、身分證字號、血型、星座、眾數……等。 次序變項(Ordinal Variable): 又稱順序變項,通常為不連續變項,主要目的為比較大小。例如:名 次、相關係數、PR 值、中位數……等。 等距變項(Interval Variable): 又稱區間變項,通常為連續變項,主要目的為可以求出距離。例如: 溫度,成績,音量,平均數……等。 比例變項(Ratio Variable): 又稱等比變項,通常為連續變項,主要目的為可以求出倍數的關係。 例如:身高、體重……等。 範 例
下列何者為敘述統計?何者為推論統計? 行政院農業委員會估計,加入 WTO 以後將有十萬農民失業。 由於景氣不佳,英國「經濟學人」雜誌預測 2001 年全球景氣經濟成 長率將由 2000 年的 5.1%降至 2.6%。 90 學年度大學聯招,有 2,352 人英文科得 0 分。 由臺灣地區過去 100 年的紀錄,我們預期臺灣約每 30 年會發生一次 規模 7 級以上的大地震。
【原住民三】
:推論統計。 推論統計。 敘述統計。 推論統計。 :估計、預測、預期、推論……,均為推論統計。 範 例
在變數的型態中,通常可分成名義變數、順序變數、等距變數和等比變 數四類型,試寫出下列變數應為何種變數型態? 學生的學號。 成績單上的成績排名。 軍隊軍官職位資料。
1-4 統計學
年齡在 19 歲以下、20 歲到 64 歲、65 歲以上。 某產品銷售金額。
【地方四】
:名義變數。 順序變數。 順序變數。 順序變數。 等比變數。 範 例
8 個項目分別為:溫度、性別、智商、體重、距離、所屬學院別、滿意 度分數(1, 2, 3)、教育程度(小學、中學、大學)。 那些項目為衡量尺度( Measurement Scale )中的順序尺度( Ordinal
Scale)? 那些項目為衡量尺度中的區間尺度(Interval Scale)? 那些項目為衡量尺度中的比例尺度(Ratio Scale)?
【地方四】
:滿意度,教育程度。 溫度,智商。 體重,距離。 範 例
下列何者為母體參數值?何者為樣本統計量的觀察值? 估計約有 10 萬名網友參加網路使用滿意度的民調結果。 行政院主計處調查結果顯示,88 年臺灣地區自有住宅比率約為 84.91%。 衛生局抽查冰店散裝冰品的不合格率約為 36%。 內政部公布每年的臺灣地區結婚、離婚對數。 :母體參數值。 樣本統計量的觀察值。 樣本統計量的觀察值。 母體參數值。
【地方四】
第一章 敘述統計 1-5
1-2 次數分配表與統計圖 一、次數分配表 次數分配表是將一組統計資料,依照資料之類別或特性分成若干組, 再將原始資料一一歸類,以便用於統計分析。分配表之製作須符合互 斥與周延兩個特質。其編製步驟如下: 決定組數 K(Number of Classes): 依 Sturge’s 公式:
K 1 3.322 log N(N 為資料個數) 依 2K N 來決定 K。 求全距 R(Range):
R 最大值最小值 決定組距 C(Width of The Classes): 全距(R) C (無條件進位到整數) 組數(K) 決定組限(Class Limit): 下限(Lower Limit) ai 1 上限(Upper Limit) ai ai 1 C 劃記次數: :
組 數
1 2 i K 合 計
組 界 a0~a1 a1~a2 ai 1~ai aK−1~aK
次 數
f1 f2 fi fK N
二、相對次數分配表(Relative Freguency)
每一組次數對總次數的比例稱為相對次數。 三、累積次數分配表(Cumulative Freguency) 以下累積次數:
第 i 組的以下累積次數為 f1 f2 …… f i 以上累積次數:
1-6 統計學
第 i 組的以上累積次數為 f i f i 1 …… f k 四、統計圖 繪製統計圖之目的: 在很短的時間內對於統計資料可有初略之概念。 可作比較。 統計圖之種類: 間斷圖: 線條圖(Line Chart):以不同平行線條之長短,表示統計資料
大小的統計圖,適用不連續變項的資料目前較少人使用。
長條圖(Bar Chart):以不同高度之矩形,表示統計資料大小的
統計圖。適用不連續變項。
圓形比例圖(Circle Graph):將一個圓分成幾個等份,每一個
等份代表每一個資料所占的比例。適用不連續變項。
第一章 敘述統計 1-7
連續圖: 直方圖(Histogram):以橫軸為各組組界,各組次數為高度,
將這些矩形並列即構成一直方圖。
相對次數直方圖(Relative Frequency Histogram):以相對次數
為縱軸座標稱為相對次數直方圖。
次數曲線圖(Frequency Polygon):又稱多邊形圖,以各組組中
點代替各組的成績,將其連接起來,即成次數曲線圖。
累加次數曲線圖(Cumulative Frequency Curve):又稱肩形圖(
Ogive)累加次數曲線圖可分為以下累加次數曲線圖及以上累加 次數曲線圖。將各組的上限(下限)代替各組的成績,將其連接
1-8 統計學
起來,即成累加次數曲線圖。
其他的圖形: 莖葉圖(Stem-and-leaf Plot):莖葉圖是一種同時具有原始資料
與次數分配的一種圖形。其編製方式是將原始資料分成莖及葉兩 個成分。其形式如下: 莖(Stem)
2 3 4 5 6
葉(Leaf)
0135 22245 12399 0239 8899
箱形圖(Box Plot;Box And Whisker Plots):首先要先計算出
資料的最小值 Min 與第一、二、三個四分位數 Q1、Q2、Q3 及最 大值 Max,再將此五個數值在橫軸上標示出來,再將 Q1 及 Q3 繪 製一個矩形稱之為箱子。
在編製箱形圖時,要先將極端值或離群值(Outlier)剔除;所謂離 群值是指在箱形圖中箱子部分前後 1.5 倍以外之數值,即在區間( Q1 1.5IQR , Q3 1.5IQR)以外之值。 範 例
何謂量的資料?請舉二例說明。 何謂質的資料?請舉二例說明。
第一章 敘述統計 1-9
資料的衡量尺度有那些?各有何資料特性? 下列數據為醫院於兩天內病人等待看病時間之資料:(以分鐘為單位) 2 9
6 9
10 12
13 22
4 6
5 7
5 7
18 14
11 18
9 4
列出其次數分配表並繪出其相對次數曲線圖與相對累積次數曲線圖及 莖葉圖(Stem-leaf Plot)。
【原住民三】
:可以量化的資料稱為量的資料,大部分為連續變項。例如:身高、 體重。 不可以量化的資料稱為質的資料,大部分為不連續變項。例如:性 別、職業。 名義變項(Nominal Variable):又稱類別變項,通常為不連續 變項,主要目的為分辨類別。例如:性別、身分證字號、血型、 星座、眾數……等。 次序變項(Ordinal Variable):又稱順序變項,通常為不連續變 項,主要目的為比較大小。例如:名次、相關係數、PR 值、中 位數……等。 等距變項( Interval Variable) : 又稱區間變項,通常為連續變項 ,主要目的為可以求出距離。例如:溫度、成績、音量、平均數 ……等。 比率變項(Ratio Variable):又稱等比變項,通常為連續變項, 主要目的為可以求出倍數的關係。例如:身高、體重……等。 組數 K 1 3.322 log N 1 3.322log 20 5.322 取K6 組距 C
Max − Min 22 − 2 3.33 6 K
取C4 次數分配表: 組別
1 2 3 4
組限 次數 相對次數 相對累積次數 以下累積次數 0x4 1 0.05 0.05 1 4x8 8 0.4 0.45 9 8 x 12 5 0.25 0.70 14 12 x 16 3 0.15 0.85 17
1-10 統計學 16 x 20 20 x 24
5 6 合 計
2 1 20
0.1 0.05
0.95 1.00
19 20 20
相對次數曲線圖:
相對累積次數曲線圖:
莖葉圖: 莖(十位) 0 1 2
葉(個位) 2 0 2
4 1
4 2
5 3
5 4
6 8
6 8
7
7
9
9
9
第一章 敘述統計 1-11
1-3 集中量數(Measure of Central Tendency) 集中量數為資料集中的趨勢。 一、算術平均數(Arithmetic Mean)
算數平均數代表所有的觀察資料在數線上的一個平衡的位置,即所有 觀察資料總和再除以總個數。以、M、 x 表示。 公式: 未分組資料: n
xi ∑ x1 + x 2 + + x n i =1 x n n 已分組資料: k
x
∑ mif i i =1
n
m i:第 i 組的組中點 ,其中 fi:第 i 組的次數
性質: n
∑x i − x 0 i =1 n
n
∑x i − x2 ∑x i − A2 ,其中 A 為任意實數。 i =1
i =1
n
n
: ∑x i − A2 ∑〔x i − x(x − A)〕2 i =1
i =1
n
n
n
i =1 n
i =1
∑x i − x2 2 ∑x i − x (x − A) ∑x − A2 i =1 n
n
∑x i − x2 2(x − A)∑x i − x ∑x − A2 i =1 n
n
i =1
i =1
i =1
i =1
n
∑x i − x2 ∑x − A2 〔 ∑x i − x 0〕 i =1
n
n
i =1
i =1
∑x i − x2 〔 ∑x − A2 0〕 n
n
i =1
i =1
∑x i − x2 ∑x i − A2 若 yi axi b y a x b 算數平均數容易受極端值影響。