Statistics 教育統計─目 錄 CH1 概 論 ......................................................
1-1
1-1 統計學分類 .................................................................... 1-3 1-2 次數分配與圖示法 ........................................................ 1-12
CH2 常態分配特性 ...........................................
2-1
2-1 集中量數 ........................................................................ 2-3 2-2 算術平均數 .................................................................... 2-4 2-3 中位數 ............................................................................ 2-7 2-4 眾數 ............................................................................. 2-9 2-5 幾何平均數 .................................................................... 2-11 2-6 調和平均數 .................................................................... 2-12 2-7 變異量數 ........................................................................ 2-14 2-8 全距 ............................................................................. 2-15 2-9 四分位差 ........................................................................ 2-15 2-10 平均差 .......................................................................... 2-19 2-11 變異數與標準差 .......................................................... 2-20 2-12 相對變異量數 .............................................................. 2-26 2-13 偏態與峰態 .................................................................. 2-28
CH3 相對地位量數 ...........................................
3-1
3-1 百分位數與百分等級 .................................................... 3-3 3-2 標準分數 ........................................................................ 3-7
CH4 機率概論 ...................................................
4-1
4-1 集合 ............................................................................. 4-3
Contents〈1〉
4-2 機率 ............................................................................. 4-4 4-3 期望值 ............................................................................ 4-8 4-4 機率分配 ........................................................................ 4-10
CH5 簡單相關與迴歸 ........................................
5-1
5-1 相關係數 ........................................................................ 5-3 5-2 積差相關 ......................................................................... 5-7 5-3 簡單迴歸分析 ................................................................. 5-16 5-4 迴歸方程式 ..................................................................... 5-20 5-5 離均差平方和 ................................................................. 5-21 5-6 決定係數 ......................................................................... 5-23 5-7 估計標準誤 ..................................................................... 5-25
CH6 抽樣理論與抽樣分配.................................
6-1
6-1 抽樣方法 ........................................................................ 6-3 6-2 抽樣分配 ........................................................................ 6-16 6-3 常用抽樣分配 ................................................................ 6-24
CH7 區間估計與假設考驗.................................
7-1
7-1 區間估計 ........................................................................ 7-3 7-2 假設考驗基本概述 ........................................................ 7-9 7-3 區間估計與假設考驗類型架構圖................................. 7-20 7-4 變異數區間估計與假設考驗......................................... 7-43 7-5 百分比區間估計與假設考驗......................................... 7-45 7-6 積差相關係數的假設考驗............................................. 7-52 7-7 樣本大小 n 推估 ............................................................ 7-56
CH8 卡方考驗 ...................................................
8-1
8-1 卡方分配 ........................................................................ 8-3 8-2 適合度考驗 .................................................................... 8-5
Contents〈2〉
8-3 百分比同質性考驗 ........................................................ 8-8 8-4 獨立性檢定(關聯性考驗)......................................... 8-12 8-5 改變的顯著性檢定 ........................................................ 8-16 8-6 2 考驗應用限制 ........................................................... 8-19
CH9 變異數分析 ...............................................
9-1
9-1 單因子變異數分析 ........................................................ 9-4 9-2 獨立樣本單因子變異數分析......................................... 9-9 9-3 單因子相依樣本變異數分析......................................... 9-16 9-4 變異數分析基本假設 .................................................... 9-19 9-5 多重比較 ........................................................................ 9-21 9-6 雙因子變異分析 ............................................................ 9-33 9-7 趨向分析與共變項分析 ................................................ 9-47
CH10 其他相關統計法 ......................................
10-1
10-1 相關與列聯相關 ...................................................... 10-4 10-2 二系列相關、點二系列相關與四分相關................... 10-8 10-3 等級相關 ...................................................................... 10-11 10-4 相關比 .......................................................................... 10-16 10-5 淨相關、部分相關 ...................................................... 10-17
CH11 高等統計 .................................................
11-1
11-1 複迴歸分析 .................................................................. 11-3 11-2 多變項相關分析 .......................................................... 11-10
附錄一 解釋名詞 ...............................................
12-1
附錄二 統計機率分配表 ....................................
13-1
表 A 常態分配表 .............................................................. 13-2 表 B 常態分配表 .............................................................. 13-5
Contents〈3〉
表 C 常態分配表 .............................................................. 13-6 表 D 積差相關係數(r)顯著性臨界值 ............................. 13-7 表 E 亂數表 .......................................................................... 13-8 表 F t 分配表(左表) ........................................................ 13-9 表 G t 分配表(右表) ........................................................ 13-10 表 H 2 分配表 ..................................................................... 13-11 表 I F 分配表 .................................................................... 13-12 表 J F 分配表 .................................................................... 13-13 表 K F 分配表 ................................................................... 13-14 表 L q 分配的臨界值 ........................................................... 13-15 表 M Fmax 的臨界值(哈特萊變異數同質性考驗)........... 13-16 表 N Dunnett 多重比較的 tD 分配 ........................................ 13-17 表 O Pearson r 與 Fisher Z(Zr)直線轉換 ........................ 13-18
Contents〈4〉
第一章 概 論 1-3
教育統計─歷屆試題分析 傳 統 教 育 敘述統計與推論統計、四大變項(測量量尺)、莖葉圖與盒鬚 統 計 考 題 圖、次數分配圖種類意義、間斷變項與連續變項 最 新 教 育 圖示法易犯的錯誤與注意事項、母數統計學與無母數統計學( 統 計 考 題 種類)、中介變項與干擾變項、雷達圖、資料分析適用變項
教育統計學(Statistics for Education)是一門應用統計學,主要在探 討如何利用它來解決實際教育與心理工作所面臨的問題。統計學定義為蒐 集、整理、分析、解釋統計資料,並依樣本資料去推論母體特性,使能在 不確定情況下作出適切決策。 統計分析目前在社會科學應用日益廣泛與重要。例如:臺灣高等教育 供需為何?教育與學習效果的研究與衡量?瞭解學生人格特質與發展?教 育品質是否有所改善?……等等都可以利用統計方法來解決。
1-1 統計學分類 一、統計學分類 教育統計學依其內容約可區分敘述統計學(Descriptive Statistics)、推 論統計學(Inferential Statistics)與實驗設計(Experimental Design)三 大類。就時間發展次序而言,敘述統計學與推論統計學發展較早,而實 驗設計則為近代產物。 敘述統計學(Descriptive Statistics): 只探討母體與樣本的個別特性,對研究資料之處理主要在蒐集、整理 劃記、描述與表現結果,即將一群資料加以整理、摘要、組織與簡化 ,使讀者容易明瞭其中意義與傳遞訊息。內容包括集中趨勢、變異趨 勢、圖形表示、相對地位量數等。 :只求算出樣本平均數。若全校 1000 名女學生,欲推算全校女學 生的體重,抽樣 100 名學生得到樣本平均體重 X 44。 推論統計學(Inferential Statistics): 又稱歸納統計學(Inductive Statistics),係探討母體與樣本之間的關
1-4 教育統計
係,根據樣本的資料推論未知母體性質(非樣本性質)。當研究者欲 瞭解母體某些特性,但母體群過於龐大,無法將母群體全部蒐集,最 好辦法為經由隨機( Random)方式,自群體抽取若干具有代表性(
Representative)個體為樣本,再依機率原理,經由假設、估計、考驗 步驟,使用樣本統計量從事估計與考驗母體母數的方法。內容包括機 率分配、抽樣方法、估計、考驗、2 分配、相關與迴歸。 :依上例由 X 44 推算全校女同學平均體重()。 實驗設計(Design of Experiments): 製造一種情況用以驗證假設是否存在,如自變項與依變項的因果關係 ;研究者透過實驗操弄自變項,然後觀察依變項造成影響。實驗研究 前,研究者必須有詳細完整計畫,包括操弄自變項內容、觀察依變項 內容、干擾變項、抽取樣本大小、測量誤差範圍、採用統計方法、考 量成本時間……等均需事先決定。 :研究者想瞭解不同教學方法(電腦輔助教學法、啟發教學法、編 序教學法)對國民小學學生學習成績的影響。 二、教育統計學架構
抽樣 樣本
母體 推論
資料的性質與蒐集(第一章) 集中量數 單峰分配四大量數 變異量數 敘述統計學 峰態 (第二章) 偏態 相對地位量數(第三章)
第一章 概 論 1-5
資料的性質與蒐集(第一章) 機率理論 抽樣與抽樣分配(第六章) 迴歸分析與相關分析(第五章) 其他相關分析(第十章) 推論統計學 區間估計與假設考驗(第七章) 卡方檢定(第八章) 變異數分析(第九章) 實驗設計 共變項分析(第九章)
※母數統計學與無母數統計學之比較: 推論統計學中因母群體特性與條件不同,又分成母數統計學(
Parametric Statistics)與無母數統計學(Non Parametric Statistics)二 類,二者間差異比較如下: 母
數
統
計
學無
母體分配呈常態分配 大樣本資料 母群變異數同質性 適用等距變項與比率變項的研究 資料 統計考驗方法:t、Z、F 發展時間較早 常使用統計附表 統計考驗力(1 )較高
母
數
統
計
學
母體分配不呈常態分配 小樣本資料 母群變異數異質性 適用名義變項與次序變項的研究 資料 統計考驗方法:2 發展時間方法較晚 不常使用統計附表 統計考驗力(1 )較低
三、概念、構念與變項 研究在探求「事實的真相」,在研究過程必須具有思考基本元素和單位 (Units)而概念、構念和變項即為思考元素,分述如下: 概念(Concept): 概念( Concept)用來表示某事物、對象、狀況的共同特徵或想法, 當大家約定成俗以文字表達時,即為概念。一般用來表達概念方式分
1-6 教育統計
為:客觀實體可觀察事物,如「桌子」、「電腦」、「教學媒體」 ……等;抽象不可觀察的事物,非具體存在,如「個性」、「動機 」……等,也即為「假設性構念」(Hypothetical Construct)。 構念(Construct): 本質上構念與概念相同,但構念是基於研究者學術研究需要,所假設 性創造的抽象概念,其目的在建立理論基礎。構念多由一組簡單的概 念組合而成,而且無法直接測量。假設性構念產生為研究者依據現有 理論為基礎,發揮學術洞察與創意成果,亦為研究者建構理論基準, 有其存在的價值。假設性構念可由三方面間接推論:原因推論; 結果推論;表現推論。 變項(Variable): 變項是一個概念或特性,如指人或事物的特徵,這些特徵在質或量可 以變動的概念或屬性,因此具有不同數值,即為變項;而變數則為研 究者賦予數值符號。常見變項分類包括四大變項、自變項與依變項。 四、測量尺度種類 研究者在研究過程中,蒐集到資料數據中,應以何種特性或量測準則? 因不同測量尺度其資料計算與進行統計推論方式均不同,因此對於「變 項」的基本概念與區辨方式,是初學者進入「教育統計學」領域必備概 念。而最常見測量尺度區分方式是以 1951 年 S. S. Stevens 將測量尺度 區分為四大類: 類別變項(名目變項、名義變項)(Nominal Variable): 係為標示事物與事物間不同特質或類別而指定的數字,無法比較二者 間大小和形式,亦即二變項間具有互斥性(Mutually Exclusive)與完 整性(Exhaustive Categories),僅眾數有意義。如:身分證號碼、血 型、性別、郵遞區號。 次序變項(順序變項)(Ordinal Variable): 不僅能標示事物與事物間不同特質或類別而指定的數字,亦能指出大 小次序(等級順序)、多寡、優劣、高低,但無法衡量其距離差異大 小值,僅中位數有意義。如:考試名次、作文成績甲等乙等、百分等 級、教育程度、社經地位、大學教授層級。
第一章 概 論 1-7
等距變項(區間變項)(Interval Variable): 不僅能標示事物與事物間不同特質或類別而指定的數字,亦能指出大 小次序(等級順序)、多寡、優劣、高低,尚可以數值方式表示二事 物差別之大小的變項。平均數、標準差都有意義,尚有溫度、明暗度 、音量、智商、成績分數。等距變項具有一基本特性「相等單位」, 但無絕對零點、無倍數關係。 比率變項(Ratio Variable): 不僅能標示事物與事物間不同特質或類別而指定的數字,亦能指出大 小次序(等級順序)、多寡、優劣、高低,尚可以數值方式表示二事 物差別之大小的變項,還可以表示相對比例大小。比率變項最重要條 件是具有絕對零點(Absolute Zero;為具備任何測量變項屬性,絕對 零點的 0 即表「空」或「無」)與有倍數關係,具備四則運算中加、 減、乘、除運算。如:身高、年齡、體重、薪資皆為此一變項。為變 項中最高階量尺。 表 變項種類彙總表 名義(目)變項 順 測量尺度 類 別 尺 度 序
特
簡
序 列
變 尺
項區 度等
間 距
變 尺
項比 率 變 項 度比例(尺度)
Nominal Scale Ordinal Scale Interval Scale Ratio Scale 標示目的物而 分辨類別 分辨類別 分辨類別 指定的數字 只能指出等級 只能指出等級 只能指出等級 分辨類別 順序 順序 順序 性 比較大小、高 比較大小、高 比較大小、高 低、長短、優劣 低、長短、優劣 低、長短、優劣 算出差距 算出差距 算出比率(例) 性別、宗教、血 選美、考試名次 溫 度 、 IQ 、 測 身高、體重、長 型、國籍、籍貫 、等第、中位數 驗成績、音量、 度、年齡、面積 、准考證號碼、 、百分等級、積 明暗度、智商、 、體積、薪水、 例 寢室號碼、月份 差相關、四分位 平均數、標準差 暴風半徑、老鼠 、校別、身分證 差、難度、教授 、標準分數、全 跑迷津、時間、 字號、價值觀、 層級、李克特五 距、T 分數、標 速度 眾數 等量表 準九
1-8 教育統計 不能四則運算 ()
不能四則運算 ()
能做
能做四則運算 () 無 有 絕對零點 提供訊息 少多 轉 化 連續變項可轉化為間斷變項,但間斷變項不能轉化為連續變項 數理特性
五、其他變項分類 連續變項與間斷變項: 連續變項(計量變項)(Continuous Variable):觀察或測量的統 計資料中,任何二數量間均可無窮細分,可以有小數或分數連續不 間斷的數據,且每個數值均有意義,連續變項是一個數列中一段距 離而非一個點,可使用「介於什麼之間」表示。連續變項測量數值 皆代表強度意義,又稱為量化變項(Quantitative Variable)。如身 高、時間、體重、分數……等。 間斷變項(離散變項)(Discrete Variable):某一特定範圍內一些 分數點相互分開,且各點之間有一段明確距離,同時此種變項大多 使用整數表示;其數值間不可無限細分,無法找到更小單位數值, 其值由點計而得,而非一段距離,不可以有小數或分數,又稱為質 化變項(Qualtitative Variable)。如:性別、骰子點數、家庭孩子 數、二十張椅子是一精確數。 自變項與依變項: 自變項(Independent Variable)與依變項(Dependent Variable): 自變項屬於刺激變項,為研究者所操弄的因素,藉由操弄此因素觀 察它對另一變項所產生影響,按照字面翻譯,自變項又稱為「獨立 變項」;而依變項則為反應變項,隨自變項影響而改變。從預測作 用角度,自變項預測依變項,自變項則屬於「預測變項」;依變項 則屬於「效標變項」、「結果變項」,以發生時間為基準,發生在 前變項可為因,視為自變項;發生在後為果,視為依變項,而此種 關係如「投入─產出」,則自變項稱為「投入變項」,依變項稱為 「產出變項」。 :Y f(X) X:自變項 Y:依變項
第一章 概 論 1-9
X:教學法(演講法、編序教學法、啟發式教學法) Y:學習成績 控制變項(Controlled Variable): 瞭解干擾變項或無關變項的存在,而將其加以控制,那些干擾變 項就成了控制變項。 控制變項的控制與自變項的控制是不同的,前者的控制目的是使 所控制變項對依變項不影響,而後者的控制則希望自變項對依變 項有影響,即控制變項的控制旨在排除干擾變項;控制自變項目 的,則在於探知依變項之變化,係單純因自變項而引起。 六、母體與樣本統計量數 母體(Population): 母體係指欲研究問題中,相關的觀察測量值之總集合體稱之;係由具 有共同特性之個體或元素(Element)所組成之群體,是研究者想要 觀察的對象全體集合。母體又分為標的母群體與可接近母群體。 樣本(Sample): 是由母體中抽出部分個體所組成的小群體,依抽樣方法可分為隨機樣 本與非隨機樣本,能夠代表母體特性的樣本稱代表性樣本。而抽取樣 本過程叫抽樣,所採用方法叫抽樣方法。 母數或參數(Parameter): 由母體中所求算出的表徵數,用來描述母體資料的特性,大都以希臘 字母代表,如平均數、變異數 2、相關係數……。因為母體較 為龐大,大都無法知道母體母數特性,必須透過隨機抽樣由樣本統計 量推論母體母數特性。 統計量(Statistics): 由樣本所求算出之表徵數,用來描述樣本資料特性的測量數,一般以 英文符號表示,如變異數 S2、相關係數 r、平均數 X ……。 表
徵
數母
算術平均數
數統
計
變異數
X 、M Sˆ2 、S2
比率(例)
P
pˆ
2
量
1-10 教育統計 迴歸係數 相關係數
b r
主要資料(一手資料)(Firsthand Data): 事件發生時,實際觀察者或參與者提出報告,由研究者個人直接調查 獲得資料。 次級資料(二手資料)(Secondary Data): 經由他人蒐集整理分析的統計資料,而非研究者個人調查獲得。如來 自國內外政府機關、公民營學術機構、企業組織、一般書刊雜誌均為 次級資料的來源。 七、實驗研究法特徵 隨機化(Randomization): 由於研究情境相當複雜,且不同組別受試者具有許多特質差異,欲完 全控制這些因素,研究者常採用隨機化原則排除無法直接適當控制因 素。隨機化為消除傳統偏見及減弱無關變項影響力最有效因素,最常 用隨機化步驟有二個:一是隨機抽樣、二為隨機分派。 隨機抽樣(Random Sampling):為使樣本具有代表性,每一樣本 均有相等機會被抽取為研究對象,且樣本間出現彼此互不影響,亦 即實驗結果有推論到母體可能,因此實驗設計中要盡量做到隨機抽 樣,確保實驗結果具有外在效度。 隨機分派(Random Assignment):每個被抽取受試者均有相同機 會接受任何一種實驗處理,且樣本間出現彼此互不影響,當實驗研 究二組受試者完全相同下,觀察依變項在實驗後變化可以歸因於研 究者對自變項操弄,因此實驗設計中盡量做到隨機分派,確保實驗 結果具有內在效度。 控制變項: 依據「大小控原理」(Max-min-con Principle),實驗研究必須經由 適當實驗設計,盡量增大實驗變異量強度,使有實驗處理與無實驗處
第一章 概 論 1-11
理的差異明顯,且須控制無關變異量與混淆變項,並減小實驗結果誤 差變異量,才能使實驗效果更客觀正確。 使實驗變異量(研究問題相關變項之變異量)最大:實驗者必須使 幾個實驗處理間有很大差異,以提昇研究統計考驗力。 減低誤差變異量(個別差異變異量)最小:任何實驗研究均會有誤 差存在,只是程度上不同,這些誤差會造成實驗效果顯著性,實驗 者必須妥善控制實驗情境與提高測量工具信度,設法減低誤差變異 量到最小限度。誤差變異量主要來自個別差異變異量與測量誤差。 排除無關變異量(Extraneous Variance):研究者必須設法控制實 驗變項以外的無關變項或混淆變項,使它們對實驗效果影響降至最 低程度,以免混淆實驗結果,造成解釋困難。 八、研究效度 內在效度意義(Internal Validity): 郭生玉(民 88)指出「內在效度」為實驗者所操縱實驗變項對依變 項所造成影響真正程度,亦即實驗處理是否確實造成有意義差異。而 內在效度高低,則視研究者是否控制無關變項程度,控制愈好,則實 驗差異愈能解釋是由實驗處理造成,即內在效度高,亦為一致性高。 如何提高「內在效度」: 學者 Campbell 與 Stanley 於西元 1963 年認為八項因素是影響內在效 度無關變項,研究者必須加以控制,使研究結果做正確解釋,八項因 素包括同時事件(臨時事件)、成熟、測驗、測量工具、統計迴歸、 選樣偏差、受試者流失、因素交互作用;提高方法包括隨機分派、設 計前測、增設一組控制組。 外在效度意義: 外在效度( External Validity )指實驗結果的概括性( Generalizatility )和代表性(Representativeness),亦即研究結果是否可以推論到其 他研究母體或研究情境,研究結果愈具普遍的應用性,其外在效度愈 高 。學者 Bracht 與 Glass 提 出二種 外 在效度: 母 群體效度 (
Population Validity);生態效度(Ecological Validity)。 如何提高「外在效度」:
1-12 教育統計
影響外在效度因素包括測驗反作用與交互作用效果、霍桑效應、選樣 偏差與實驗變項交互作用效果、多重實驗處理的干擾;提高方法包括 隨機抽樣、使用延宕測驗、盡量不安排前測實驗設計。
1-2 次數分配與圖示法 當研究者蒐集大量數據,很難從未經整理資料中看出其意義與特性, 這些資料數據稱原始資料(Raw Data),從原始資料計算出的分數即為原 始分數(Raw Score)。為了將這些資料加以分類整理,讓讀者能更容易 瞭解資料內容趨勢,統計學者發明了統計表與統計圖二類方式。 一、次數分配表 次數分配(Frequency Distribution): 將蒐集的資料經過整理,如依數量大小分成若干組,用來顯示資料中 分布情況,經常以次數圖或次數表來表示。自變項為數量大小,而依 變項則為各數量發生次數。 編製次數分配表假設: 均勻分配:假設資料在各組中是均勻分配。 集中分配:假設資料在各組中是集中在組中點。 編製次數分配表分類原則: 周延(Inclusion):周延目的在使原始資料無一遺漏,即資料數據 必可歸納於某一類中。 互斥(Exclusion):互斥目的在使原始資料無一重複,即資料數據 不可同時在二類中出現。 次數分配表功能:(王保進,民 95) 檢測與描述蒐集資料集中量數的趨勢。 檢測與描述蒐集資料變異量數的趨勢。 檢測資料分配狀況是否為常態分配。 檢查資料是否出現極端值(Outlier)。 編製次數分配表步驟: