第一篇 教育統計 第一章 基礎考題 1−3 1-1 敘述統計 1−3 1 變項種類 1−3 2 次數分配圖表 1−4 3 資料分析(統計分析) 1−5 4 常態分配特性 1−9 5 常 模 1−13 1-2 推論統計 1−15 6 相 關 1−15 7 迴 歸 1−16 8 機率分配與抽樣分配 1−18 9 區間估計 1−20 10 假設考驗 1−23 11 卡方考驗 1−26 12 變異數分析 1−28 1-3 試題集錦 1−33
第二章 進階考題 1−142 2-1 多變項統計 1−142 2-2 試題集錦 1−148
1
1−1
第二篇 教育測驗
2−1
第一章 基礎考題 2−3 1-1 彙總集錦 2−3 1 教育測驗─緒論 2−3 2 教育測驗─信度 2−6 3 效度意義與種類 2−9 4 教育評量─多元評量 2−11 5 測驗命題原則 2−13 6 人格測驗 2−17 7 試題反應理論與電腦適性測驗 2−20 1-2 試題集錦 2−23
第二章 進階考題─彙總集錦 2−64
第三篇 模擬試題
3−1
第四篇 歷屆試題
4−1
《附錄》統計機率分配表
5−1
2
《第壹篇》第一章 基礎考題─敘述統計
1
1-3
變項種類
一、四大變項 最常見測量尺度區分方式是以 1951 年 S. S. Stevens 將測量尺度區分為四 大類: 變項種類彙總表 名義(目)變項 順 序 變 項 區 間 變 項 比 率 變 項 測量尺度 類 別 尺 度 序 列 尺 度 等 距 尺 度 比例(尺 度) (Nominal Scale) (Ordinal Scale) (Interval Scale) (Ratio Scale)
特
性
簡
例
數理特性 絕對零點 提供訊息 轉
化
標示目的物而 分辨類別 分辨類別 分辨類別 指定的數字 只能指出等級 只能指出等級 只能指出等級 順序 順序 順序 分辨類別 比較大小、高 比較大小、高 比較大小、高 低、長短、優劣 低、長短、優劣 低、長短、優劣 算出差距 算出差距 算出比率(例) 性別、宗教、血 考試名次、等第 溫度、IQ、測驗 身高、體重、長 型、國籍、籍貫 、中位數、百分 成績、音量、明 度、年齡、面積 、准考證號碼、 等級、積差相關 暗度、智商、平 、體積、薪水、 寢室號碼、月份 、四分位差、難 均數、標準差、 暴風半徑、老鼠 、校別、身分證 度、教授層級、 標準分數、T 分 跑迷津、時間、 字號、價值觀、 李克特式五等量 數、標準九 速度 眾數、全距 表、教育程度 不能四則運算 不能四則運算 能做 能做四則運算 () () () 無 有 少多 連續變項可轉化為間斷變項,但間斷變項不能轉化為連續變項
二、連續變項與間斷變項 連續變項(Continuous Variable):觀察或測量的統計資料中,任何二數 量間均可無窮細分,可以有小數或分數連續不間斷的數據,且每個數值均
1-4
有意義,連續變項是一個數列中一段距離而非一個點,可使用「介於什麼 之間」表示。如:身高、時間、體重、分數……等。連續變項測量數值皆 代表強度意義,又稱為量化變項(Quantitative Variable)。 間斷變項(Discrete Variable):某一特定範圍內一些分數點相互分開, 且各點之間有一段明確距離,同時此種變項大多使用整數表示;其數值間 不可無限細分,無法找到更小單位數值,其值由點計而得,而非一段距離 ,不可以有小數或分數。如:性別、骰子點數、家庭孩子數、20 張椅子 是一精確數。 三、自變項(Independent Variable)與依變項(Dependent Variable) 自變項屬於刺激變項,為研究者所操弄的因素,藉由操弄此因素,觀察它 對另一變項所產生影響,按照字面翻譯,自變項又稱為「獨立變項」;而 依變項則為反應變項,隨自變項影響而改變。從預測作用角度,自變項預 測依變項,自變項則屬於「預測變項」;依變項則屬於「效標變項」、「 結果變項」,以發生時間為基準,發生在前變項可為因,視為自變項;發 生在後為果,視為依變項,而此種關係如「投入─產出」,則自變項稱為 「投入變項」,依變項稱為「產出變項」。
2
次數分配圖表
一、次數分配圖 質的資料:線圖、長條圖、圓形比例圖。 統計資料 量的資料:直方圖、次數多邊形圖、累加次數曲線圖、莖葉 圖、盒鬚圖、點圖。 二、莖葉圖與盒鬚圖 莖葉圖: 普林斯頓大學統計學者 Tukey 在 1977 年發展用以描述觀察簡便方法, 一般次數分配圖將原始資料轉換成圖形過程中,資料部分訊息已經流失 ,即無法瞭解原始資料內容,為了克服此種缺失,讓圖形兼具數字和圖 形的優點,保留原始資料。 最適合二位數資料呈現,莖葉圖編製過程以 10(或 10 的倍數)為組距 ,係將每一觀察值切割成莖與葉二部分,中間以垂直線區隔,數字中十 位元數部分當作「莖」,而數字中個位數定義為「葉」,若將莖葉圖橫 著看與直方圖功能類似。可討論數值中是否出現極端值,但如原始數據 繁多,則難以計算。
《第壹篇》第一章 基礎考題─敘述統計
1-5
盒鬚圖: 意義:普林斯頓大學統計學者 Tukey 提出,又稱盒形圖(Box-whisker Plot)或稱五個量數彙總圖,其繪製方法非常簡單,該圖形中箱子包含 次數分配最中間 50%次數,箱子兩端分別為第一與第三四分位數(即 Q1 與 Q3),箱子兩側則以最大值與最小值表示。 盒形圖(Box-whisker Plot)處理與分析研究變項時有何功能: 可以用來顯示資料中四分位差、中位數、全距。 分配範圍,如長方盒長度越長與外延垂直線越長,代表資料越分散。 檢查資料中是否出現極端值、偏離值,當極端值與偏離值點數越多, 代表偏離情形越嚴重。分數離開長方盒上(下)緣達長方盒的 3 倍以 上,則以極端值處理;分數離開長方盒上(下)緣達長方盒的 1.5 倍 以上,則以偏離值處理。 瞭解分配型態,當中位數上下兩側延伸線越不相等,表示偏態越明顯。
3
資料分析(統計分析)
一、母數統計學統計分析(資料分析)方法 差異(影響): 統 計 分 析 自變項
依
變
項適
用 2
Z-test
獨立樣本 t-test
相依樣本 t-test
單因子獨立樣 本變異數分析
條
1個 1個 母體 已知 (間斷變項) (連續變項) (組別 K 2)
件舉
例
說
明
例如:使用魏氏智力 測驗分別測量甲乙班 學生,二班智力平均 數的差異是否顯著 2 1個 要考驗二組平均數 1個 母體 未知 (間斷變項) (連續變項) 的差異是否顯著 考驗男生與女生的 (組別 K 2 :獨立樣本) 國語成績平均數是 否有顯著差異 1個 研究人員想瞭解校園 1個 母體2 未知 (間斷變項) (連續變項) 中同學在學期初、學 (組別 K 2 期末對數學課喜好態 :相依樣本) 度改變的情形是否有 顯著差異 1個 1個 研究二變項之間 不同社經地位(含 (間斷變項) (連續變項) 是否有因果關係 低、中、高三組) (組別 K 3 學生,其國語成績 是否有顯著差異 以上)
1-6
1個 (間斷變項) 單因子相依樣 (組別 K 3 本變異數分析 以上) 1個 (連續變項) 多個 (間斷變項或 多元迴歸分析 連續變項) 簡單迴歸分析
1個 (間斷變項)
共變數分析
2個 子 (間斷變項)
雙 因 變異數分析
1 個或多個 (間斷變項) (MANOVA) 多變量分析
區 別 分 析
路 徑 分 析
多個 (連續變項)
多個 (連續變項)
考驗三組以上的平 均數是否有顯著差異 1個 研究二變項之間 高明老師針對班內五 (連續變項) 是否有因果關係 位同學在四份數學測 驗成績實驗如下表, 試問四種數學成績之 難易程度是否有差別 1個 預測與解釋功能 在校學業成績預測國 (連續變項) (預測力 r2) 中基測成績 1個 預測與解釋功能 在校學業成績、每天 (連續變項) (預測力 R2) 唸書時間、是否有男 女朋友、父母社經地 位預測國中基測成績 1個 有前測 實驗組及控制組於 (連續變項) 共變項干擾( 排前測分數後,在 威廉斯創造力測驗 連續變項) 的後測分數是否有 所不同 教學方法對學業成 績影響是否受智力 (共變項)干擾 1個 交互作用 3 5 ANOVA 做 (連續變項) 資料分析 智力與性別對學業 成就的影響 多個 同時考驗 k 組間 接受三種不同教學 (連續變項) 在二個以上依變 法,其學生國、英 項 上 的 形 心 ( 、數成績不同 Centroid ) 是 否 不同性別接受三種 有差異 不同教學法,其學 生學科成績和學習 動機不同 1個 分組的正確率 高中畢業的六科成績 (間斷變項) 來預測其大學學測( (人為或真正 公立、私立、未考取) 分類) 1個 多重變項間因果 (連續變項) 結構模式
《第壹篇》第一章 基礎考題─敘述統計
1-7
關係: 統計分析 自 或 依 變 項 自 或 依 變 項 適
1個 (連續變項)
1個 (連續變項)
1個 (間斷變項) 二 系 列 (人為二分)
1個 (連續變項)
1個
1個 (連續變項)
積差相關
相
關
點 二 系 (間斷變項) 列 相 關
(真正二分) 1個 曲線相關 (間斷變項)
用
條
件舉
例
說
明
創造力越高的學童 是否越有幽默感 學童的自我概念和 學業成績間是否有 相關 探討鑑別度大小 大一通過或不通過 二分變項與學業性 向測驗分數相關 高分組或低分組與 學業測驗分數相關 男生或女生與學業性 向測驗分數相關
1個 (連續變項)
曲線相關平方即 不同年級對焦慮分數 效果值 對的相關比(曲線相 關) 一組變項(多個 一組變項(多個 二個以上自變項 典型相關 ─連續變項) ─連續變項) 與二個以上依變 項間的線性組合
二、無母數統計學統計分析(資料分析)方法 差異(影響): 統計分析自
變
1個 (間斷變項)
項依
變
項適
用
條
件舉
例
說
明
1個 調查研究法中討論 分析受訪的男女 (間斷變項) 人數與次數 性教師對於提早 入學的態度(贊 成或反對)是否 有顯著差異 卡方考驗 2 若民調機構想分 ( ) 析不同性別的選 民,所支持的巿 長候選人是否有 差異 1 個(k 2) 1 個 決定二個獨立樣本 閱讀障礙與正常兒 中 數 考 驗 (間斷變項) (間斷變項) 中數(次序變項) 童所認識字彙(中 差異的顯著性 數以上或以下) 1 個(k 2) 1 個 考驗二組觀察值累 男女生在動作技能
1-8 柯史二樣本 (間斷變項) 考 驗 (獨立樣本)
曼惠特尼 U 考 驗 克瓦二氏 (KruskalWallis)單 因子等級變 異數分析
(間斷變項) 積觀察次數分配是 測驗(累積次數─ (次序變項) 否相同 次序變項)是否有 差異 1 個(k 2) 1 個 考驗二個獨立樣本 左右手學生在寫字 (間斷變項) (間斷變項) 分數是否顯著差異 速度(等級變項) (獨立樣本) (次序變項) 有無差異 1 個(k 3↑) 1 個 考驗 K 個獨立樣 三種教學法在學業 (間斷變項) (間斷變項) 本是否來自同一母 成績(等級)學習 (獨立樣本) (次序變項) 群或平均數相等的 有無顯著差異 K 個母群
1 個(k 2) (間斷變項) 符 號 考 驗 (相依樣本)
寇 Q
克 考
蘭 驗
弗里曼( Friedman) 雙因子等級 變異數分析
1個 考驗二個相依樣本 二組(集中與練習 (間斷變項) 分數(包括重複法 )在學習迷津(二 (正負號) 與配對法)是否顯 組用正負號比較) 著差異 方面是否有顯著差 異 1 個(k 3↑) 1 個 適用於 K 個相依 十位受試者觀察其 (間斷變項) (間斷變項) 樣本資料 在接受國中基測前 (相依樣本) 中後三個階段緊張 與不緊張(0)反應 情形 1 個(k 3↑) 1 個 約相當單因子相依 四種增強法下(重 (間斷變項) (間斷變項) 樣本變異數分析在 複施測),兒童學 (相依樣本) 母數統計學地位 習速度(次序變項 )是否有顯著差異
關係: 統 計 分 析自或依變項自或依變項舉 例 說 明 1個 學生成績及格與否和學生二種不同 相關(2 1 個 2 列 聯 表 ) (間斷變項) (間斷變項) 入學方式(申請與基測)的關係
1個 1個 最適用於檢定二個各包括 3 個類 (間斷變項) (間斷變項) 別名義變項間之相關 列聯相關(3 父母社經地位(高、中、低)與 3↑列聯表) 休閒種類(網球、游泳、跑步) 的關係 1個 父母社經地位(高、中、低)與休 克 瑞 瑪 相 關 1個 (3 2、4 (間斷變項) (間斷變項) 閒種類(網球、游泳)的關係 5 列 聯 表 )
1個 班上三十五位同學跑 400 公尺的 等級相關 ( 評 1 個 分者 2 人) ( (次序變項) (次序變項) 名次和跳高的名次資料,探討學
《第壹篇》第一章 基礎考題─敘述統計 評分者 信 度 ) 肯德爾和 諧 係 數(評分者 3 人以上) ( 評 分者信度) Kappa 係數
4
1-9
生的速度和彈性的關係 國中基測寫作測驗評分 1個 1個 有五位研究生,同時觀看幼兒在娃 (次序變項) (次序變項) 娃家互動的錄影帶,並登錄他們社 會行為,為了瞭解五位評分者間的 信度 1個 1個 如在 K 個精神科醫師評量診斷 N (類別變項) (類別變項) 個病人並分類至 m 個心理疾病
常態分配特性
一、集中量數 算術平均數: 計算公式: 未分組資料: n
n
∑ Xi
∑ xi 樣本資料 x
i =1
n
;母體資料
i =1
N
分組資料: n
N
∑ x ifi 樣本資料 x
i =1
n
∑ Xifi ;母體資料
i =1
N
特性: n
∑( x i − x ) 0 i =1
群體為常態分配時,群體中每一個數值與群體中算術平均數差之總和 n
等於 0[ ∑( x i − x ) 稱為離均差和(Sum of Deviations)]。 i =1
n
n
i =1
i =1
∑( x i − x )2 ∑( x i − a )2 n
( x i − x )2 為次數分配中測量誤差最小值,此一離均差平方和最小 ∑ i =1
特性,便是日後迴歸分析的「最小平方法」的依據。 平均值易受極端值影響、反應靈敏、計算簡單;比中位數與眾數穩定
,適合作數學處理與量化分析依據。
1-10
Y xa ,新平均數 Y xa 中位數: 公式: 未分組資料:n 為奇數,則 Md
n +1 n +1 項;n 為偶數,則 Md 2 2
項前後二個數和之平均數。 N h 分組資料:Md L ( FL)‧ f 2 特性:中位數為資料最中間數值,不易受極端值影響,感應較不靈敏。
因此當一組資料中出現極端值或偏態時,使用中位數表示集中量數,比 算術平均數更恰當。中位數只適用次序變項,適合無母數統計學─中數 考驗。 眾數: 皮氏經驗法(Pearson’s Method):統計學家皮爾生根據多年實務研究
資料中發現算術平均數( X )、中位數(Md)、眾數(Mo)三個集中 量數間關係,其中中位數恆在平均數與眾數之間。 X Mo 3( X Md),Mo X 3( X Md)
特性: 眾數不受極端值影響,感應不靈敏。 眾數不但可描述連續變數,也可用於描述類別變項的分配情形。
常態分配 難度 P .5( 13) 試題難易適中 鑑別度高 樣本變異程度大 信度高、效度高 SK g1 0
單峰右偏分配 難度 P 值較小(大) 試題偏難(大部分同學得低分) 鑑別度低 樣本變異程度小
《第壹篇》第一章 基礎考題─敘述統計 1-11
信度低、效度低 SK g1 0 地板效應 P75 P50 P50 P25
單峰左偏分配 難度 P 值較大(小) 試題偏易(大部分同學得高分) 鑑別度低 樣本變異程度小 信度低、效度低 SK g1 0 天花板效應 P75 P50 P50 P25 截尾平均數(Trimmed Mean):算術平均數易受極端值影響,先將二邊
極端分數刪除後,再計算其中間數值的平均數。常用截尾平均數只取介於
Q1 與 Q3 間資料(包括 Q1 與 Q3)求算平均數,而刪除 Q1 以下或 Q3 以上 觀測值。 :當團體分數中有極端分數(Outliers)存在時,可以使用「截尾平均 數」。 溫塞平均數(Winsorized Mean ):溫塞平均數類似截尾平均數,其目的
在消除極端值影響,第一個四分位數 Q1 代替 Q1 以下的觀測值,以第三個 四分位數 Q3 代替 Q3 以上的觀察值後,求全體之平均數。 二、變異量數 全距:全距(Range)是群體全部數值的變動範圍,意義明顯,為計算變
異量數中最簡單方式、粗略和籠統指標。全距為群體中最大值減去最小值 。全距適用名義變數,易受極端值影響。有單位的絕對變異量數。 四分差: 意義:為了克服全距易受極端值影響,利用四分位差(Quartile Deviation
)將一群數值資料分成四等分,即 Q1、Q2、Q3,等三個分割點,其中
Q1 為第一個四分位數占全體人數前 25%。四分差指群體中,中間 50% 的人占全距之半,又稱為機誤(PE)。有單位的絕對變異量數。 四分差特性: 不受極端值影響。
1-12
只重視中間 50%部分,故反應不靈敏。 以中位數為集中量數時,應用四分差為變異量數,因為二者皆使用次
序變數。 平均差: 意義:平均差(Average Deviation;AD,MAD)係指一群體中各數值
減去算術平均數的絕對值之算術平均數,簡稱 AD 或 MAD。此種算法 避免離均差平方和為 0[即 ∑( x − x ) 0]的困擾,容易受極端值影響 。當 AD 值愈大表分數愈分散變異程度愈大;AD 值很小時,即表示分 數分散變異小。有單位的絕對變異量數。 計算公式: 未分組:AD
∑| X − X |
已分組:AD
∑f | m − X |
n n
變異數與標準差: 意義:變異數(Variance)係一群數值與其算術平均數之差異平方和的
平均數,稱為變異數,又稱變方或均方變異數,開根號即為標準差。二 者為用途最廣的變異量數。當群體中標準差愈小,即表群體中大部分數 值集中於平均數附近,則平均數代表性強;相反地,若標準差大則表大 部分數值比較分散,平均數代表性較弱。有單位的絕對變異量數。 計算公式: 未分組資料: 母體:2x
∑(X −)2 ∑ X 2 2(用於敘述統計) N
N
∑( x − x )
2
樣本: S2x
n
∑ x2 x2 n
分組資料: 母體:2
∑ f(m −)2 N k
樣本:S2
f i( x i − x )2 ∑ i 1 =
n
多組變異數:當群體為多組時,而為求單一變項的多組合併變異數,其
計算公式如下: