กลยุทธ์การสอนและประเมินผลที่บรรลุมาตรฐานผลการเรียนรู้ตามกรอบมาตรฐานฯ 2

Page 1

การวัดและประเมินผล การวัดและประเมินผลเป็นสิ่งสาคัญ เนื่องจากเป็นมิติหนึ่งของกระบวนการเรียนการสอน ประกอบด้วย วัตถุประสงค์ (Objective) การเรียนการสอน (Learning) และการวัดและประเมินผล (Evaluation) หรือรู้จักกันตามตัวย่อ คือ OLE ซึ่งการวัดและการประเมินผลเป็นการแสดงถึงความสาเร็จของการเรียนการสอน ซึ่งเป็นไปตามวัตถุประสงค์ที่กาหนดไว้ ในการ วัดและประเมินผล สิ่งที่ควรคานึงถึง คือ โครงสร้างของสาระวิชาเป็นหลักร่วมไปกับหลักในการวัดและประเมินผล โดยปกติ ใน สาระวิชาต่าง ๆ ควรมีการวัดและประเมินผลทั้งทางด้านเนื้อหา ทักษะ และทัศนคติของผู้เรียนต่อสาระวิชาหรือการเรียนการ สอน ส่วนในด้านหลักการของการวัดและประเมินผล ควรคานึงถึงหลัก วิธีการ และกระบวนการในการวัดและประเมินผล การ สร้างแบบทดสอบ ตลอดจนเกณฑ์การวัดและประเมินผล ซึ่งในบทความนี้จะกล่าวถึงสิ่งต่าง ๆ เหล่านี้ เพื่อเป็นแนวทางสาหรับ ผู้สอนนาไปใช้ในการจัดทาและดาเนินการวัดและประเมินผลการเรียนการสอนให้มีความสมบูรณ์ และสามารถนาผลการประเมิน ไปใช้ในการปรับปรุง พัฒนาการเรียนการสอนให้มีประสิทธิภาพต่อไป วัตถุประสงค์ (O)

การเรียนการสอน (L)

กระบวนการเรียนการสอน

การประเมินผล (E)

1. ความหมายของการวัดและประเมินผล

“การวัดผล” และ “ประเมินผล” มักใช้คู่กันในบางครั้งก็ใช้แทนกัน อย่างไรก็ตามเมื่อกล่าวถึง

การวัดผล (Measurement) ความหมายที่แท้จริง คือ การวัดผลการเรียนของผู้เรียน โดยการใช้เครื่องมือ เพื่อให้ได้ผลการประเมินเป็น เชิงปริมาณหรือค่าตัวเลข (Lefrancois, 2000) ส่วน การประเมินผล (Evaluation) หมายถึง การประเมินค่า จากการ ตัดสินความดีหรือความไม่ดีของการแสดงออก (Lefrancois, 2000) ศัพท์อีกคาหนึ่งที่หมายถึงการประเมินเช่นกัน คือ Assessment หมายถึง การประมวลข้อมูลสารสนเทศทั้งเชิงปริมาณและคุณภาพอย่างเป็นระบบ เพื่อนาเสนอผลของคุณลักษณะ ของสิ่งที่ประเมิน เพื่อแสดงให้เห็น จุดเด่น จุดด้อย และสิ่งที่ควรพัฒนาปรับปรุงแก้ไข ซึ่งหมายรวมถึงการวัดผลและการ ประเมินผล แสดงออก (Lefrancois, 2000) การประเมินผลอาจเป็นผลเชิงปริมาณ ซึ่งได้มาจากการวัด รวมกับการประเมินผลค่าหรืออาจเป็นผลเชิ งคุณภาพ ซึ่ง ข้อมูลที่ได้มามิได้มาจากการวัด รวมกับการประเมินค่า ในกรณีนี้การประเมินผลอาจไม่ต้องอิงการวัดผลซึ่งเป็นเรื่องของปริมาณ จึงเห็นได้ว่าการประเมินผลมีสองลักษณะ คือ 1. การประเมินผล คือ ข้อมูลเชิงปริมาณของผู้เรียน (การวัดผล) รวมกับการประเมินค่า 2. การประเมินผล คือ ข้อมูลเชิงคุณภาพของผู้เรียน (มิได้เป็นการวัดผล) รวมกับการประเมินค่า การประเมินผลโดยทั่วไป ควรเป็นการประเมินผลที่ประกอบด้วยการประเมินผลดังกล่าวทั้งสองลักษณะ เพื่อให้ได้ผล ครบถ้วนทั้งในด้านเนื้อหา ทักษะ ทัศนคติ และความเชื่อ การประเมินผลประเภทแรกมักใช้ใ นการวัดเนื้อหาทางด้านทฤษฎีและ ทักษะได้ ส่วนการประเมินผลประเภทหลังมักใช้ในการวัดทัศนคติ

2. ประเภทของการประเมินผล ประเภทหรือลักษณะของการประเมินผลที่ใช้ทางการศึกษา สามารถแบ่งได้เป็น 3 ประเภท คือ

ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

1

การวัดและ


1. การประเมินผลก่อนเรียน (Initial Assessment หรือ Pre-assessment) เป็นการประเมินผลก่อนเริ่ม กระบวนการเรียนการสอน หรือ ระหว่างกระบวนการเรียนการสอน เพื่อที่ใช้เป็นข้อมูลเบื้องต้นก่อนที่ผู้เรียนจะเรียนรู้ บทเรียน หรือสาระที่กาหนดไว้ บางครั้งเป็นการประเมินผลเชิงวินิจฉัย (Diagnostic Assessment) 2. การประเมินผลระหว่างเรียน (Formative Assessment) เป็นการประเมินผลระหว่างการเรียนการสอนหรือ ระหว่างการดาเนินโครงการ การประเมินผลระหว่างเรียน หมายถึง การประเมินเพื่อศึกษา เป็นการใช้ผลเพื่อช่วยปรับปรุงการ เรียนการสอน ในการประเมินผลระหว่างเรียนสามารถกระทาได้โดยผู้สอน คณะกรรมการ หรือกลุ่มผู้เรียน เพื่ อให้ได้ข้อมูล เกี่ยวกับพฤติกรรมและผลการเรียนในการนามาใช้ปรับปรุงการเรียนของผู้เรียน มิได้มุ่งนาไปใช้ในการให้เกรด รูปในการ ประเมินผลระหว่างเรียนอาจจะเป็นการวินิจฉัย หรือการใช้แบบทดสอบ 3. การประเมินผลหลังเรียน (Summative Assessment) เป็นการประเมินผลหลังการเรียนการสอนหรือหลังการ ดำเนินโครงการ โดยการประเมินหลังเรียนเป็นการนาผลไปใช้ในการให้เกรด รูปแบบการประเมินผลหลังเรียนอาจจะเป็นการ สอบ หรือการแสดงผลงานหลังเสร็จสิ้นการดาเนินโครงการ

3. หลักของการวัดและประเมินผล หลักของการวัดและประเมินผลที่สาคัญมีอยู่ด้วยกันหลายประการ (ณรุทธ์ สุทธจิตต์, 2544) คือ 1. คุณสมบัติของการวัดและประเมินผล คุณสมบัติสาคัญ ได้แก่ ความเที่ยงตรง และความเชื่อถือได้ของการวัดและ การประเมินผล ถ้าการวัดและประเมินผลมีองค์ประกอบทั้งสองเป็นพื้นฐาน ผลที่ได้ย่อมมีประโยชน์ และเป็นเครื่องชี้บอก ความสามารถและความสาเร็จในการเรียนของผู้เรียน รวมไปถึงความสาเร็จของการสอนของผู้สอนได้อย่างแท้จริง 1.1 ความเที่ยงตรง (Validity) เกี่ยวข้องกับการวัดผลในลักษณะของการวัดให้ได้ในสิ่งที่ตั้งใจไว้ กล่าวคือ การเลือกสรรเนื้อหาที่เรียนไปออกมาจานวนหนึ่งเพื่อใช้เป็นตัวแทนของเนื้อหาทั้งหมด และนามาสร้างเป็นแบบทดสอบในลักษณะ ต่าง ๆ เพื่อใช้วัดผลสัมฤทธิ์ของผู้เรียน ซึ่งรวมถึงพฤติกรรมต่าง ๆ ที่ผู้สอนต้องการให้ผู้เรียนเรียนรู้ การประเมินผลที่ได้ในสิ่งที่ ต้องการวัด หรือความตรงในลักษณะนี้เรียกว่า ความเที่ยงตรงตามเนื้อหา (Content Validity) 1.2 ความเชือ่ ถือได้ (Reliability) เป็นคุณสมบัติสาคัญอีกประการหนึ่งของการวัดผลซึ่งเป็นคุณสมบัติของการ วัดผลในด้านความคงที่ที่วัดได้ กล่าวคือ ไม่ว่าจะใช้การวัดผลนั้นเมื่อใด ผลที่ได้ควรจะคงที่ไม่แปรเปลี่ยนไป ซึ่งลักษณะนี้ทาให้ การประเมินผลมีความน่าเชื่อถือ ผลที่ได้จึงมีประโยชน์ โดยตรง และนาไปใช้ได้อย่างเกิดผล ความเชื่อถือได้เป็นหลักเกี่ยวข้อง กับสถิติโดยตรง ซึ่งอาจจะนาเสนอในรูปของสัมประสิทธิ์ความเชื่อถือได้ (Reliability Coefficient) หรือความผิดพลาด มาตรฐานของการวัด (Standard Error of Measurement) การวัดผลที่ได้อาจจะมีความเชื่อถือ ได้ดี แต่ไม่มีความเที่ยงตรง นั่นคือ การวัดผลนั้นมีความเชื่อถือได้สูง แต่การ วัดผลนั้นมิได้สร้างขึ้นโดยอิงเนื้อหาที่เป็นตัวแทนที่ดี จึงวัดได้ในสิ่งที่มิได้มุ่งหวังในการวัด ซึ่งย่อมไม่เกิดประโยชน์ การทาให้การประเมินผลมีความเที่ยงตรง ควรมีการจัดเนื้อหาที่ต้องการวัดออกเป็นอัตราส่วนตามที่ผู้สอนต้องการ เพื่อให้เห็นชัดว่าแต่ละเนื้อหา มีการวัดผลในด้านต่าง ๆ อย่างครอบคลุม และสร้างแบบทดสอบในการวัดผลโดยอ้างอิงตาราง แสดงอัตราส่วนนี้ โดยปกติ เนื้อหาในแต่ละบทแต่ละตอน ควรมีการวัดผลระดับการเรียนรู้ในด้าน ความรู้ ความเข้าใจ แนวคิด การนาไปใช้ การวิเคราะห์ การสังเคราะห์ และการประเมินค่ า ส่วนความมากน้อยของเนื้ อหาแต่ละตอนขึ้นอยู่กับการให้ ความสาคัญกับเนื้อหาในแต่ละตอนของผู้สอน โดยปกติเนื้อหาที่ใช้เวลาสอนมาก ควรมีจานวนข้อในการทดสอบมากกว่าเนื้อหาที่ ใช้เวลาสอนน้อยกว่า ในเรื่องความเชื่ อถือได้ เป็นเรื่องของการวิเคราะห์ข้อสอบเพื่อแสดงค่าทางสถิติ สาหรับข้อสอบที่ใช้เป็นครั้งแรก อาจจะยังมิได้หาความเชื่อถือได้ จากนั้นจึงนามาหาค่าความเชื่อถือได้ ข้อสอบข้อใดมีความเชื่อถือได้สูงควรเก็บไว้ใช้ต่อไป ข้อ ใดมีค่าความเชื่อถือได้ต่า ควรมีการปรับปรุงหรือไม่ควรนามาใช้อีกต่อไป ต่อไปนี้เป็นตัวอย่างตารางการวิเคราะห์เนื้อหาของข้อสอบ ซึ่งเนื้อหาที่กล่าวถึง คือ เนื้อหาตามที่หลักสูตรกาหนด ไว้ และผู้สอนนามาขยายเป็นแผนการสอน และหลักในการวัดผล คือ การกาหนดการวัดเนื้อหาของรายวิชาตามโครงสร้างของ ลาดับขั้นในการรับรู้และแสดงออกของการเรียนรู้ ซึ่งเป็นโครงการสร้างทางจิตวิทยาการศึกษา (ณรุทธ์ สุทธจิตต์, 2544) ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

2

การวัดและ


ตารางที่ 1 แสดงอัตราส่วนเนือ้ หา ระดับการเรียรู้

ความรู้

ความเข้าใจ และแนวคิด

การนาไปใช้

การวิเคราะห์

การสังเคราะห์

4 4 4 4 16

4 6 6 4 20

4 8 8 4 24

4 6 6 4 20

4 6 6 4 20

เนือ้ หา 1. หลักสูตรดนตรี 2. แผนการสอนดนตรี 3. เทคนิควิธสี อนดนตรี 4. การวัดและประเมินผล รวม

รวม 20 30 30 20 100

จากตาราง เห็นได้ว่า อัตราส่วนเนื้อหาในหัวข้อที่ 2 และ 3 ผู้สอนให้น้าหนักมากกว่าหัวข้อที่ 1 และ 4 ส่วนลักษณะ การวัดผลจะเน้ น ด้านความรู้ความเข้าใจและแนวคิ ด การนาไปใช้ การวิเคราะห์ และการสังเคราะห์ มีความแตกต่างกัน อัตราส่วนเนื้อหาสามารถเปลี่ยนแปลงได้ตามความเหมาะสมที่ผู้สอนเห็นสมควร โดยคานึงถึงความเที่ยงตรงของการวัดเป็น เกณฑ์ว่า เนื้อหาใดควรเน้นในลักษณะใดและระดับการเรียนรู้สามารถวัดได้ถึงการประเมินค่าหรืออาจจะวัดเพียงการวิเคราะห์ ทั้งนี้แล้วแต่ความต้องการตามวัตถุประสงค์ของการเรียนรู้ ที่กล่าวมาทั้งหมดนี้ มุ่งไปในด้านการผลทางด้านปริมาณ ในด้านคุณภาพซึ่งเป็นการประเมินค่าโดยใช้การตัดสิน จาก เกณฑ์ที่ผู้สอนมีอยู่ในใจ เป็นเรื่องของความรู้ สึกว่าดีหรือไม่ดี โดยมิได้วัดออกมาเป็นตัวเลข หรือจานวนข้อ เหมือนการใช้ ข้อสอบ ซึ่งคิดออกมาได้เป็นคะแนน อย่างไรก็ตาม การวัดผลโดยเฉพาะด้านทักษะ ผู้สอนอาจจะกาหนดเกณฑ์เป็นระดับต่าง ๆ เช่น ดีมาก ดี พอใช้ ต้องปรับปรุง และให้ค่าเป็นตัวเลข เช่น ดีมาก ได้คะแนน 9-10, ดี ได้คะแนน 7-8, พอใช้ ได้คะแนน 5-6, และต้องปรับปรุง ได้คะแนน 0-4 ในกรณีนี้ การประเมินค่าสามารถแทนได้ด้วยค่าตัวเลข ซึ่งเป็นจานวนที่นาไปรวมกับ การวัดผลด้านอื่น ๆ เช่น ด้านเนื้อหาซึ่งใช้แบบทดสอบวัดเป็นคะแนนได้ ผลรวมดังกล่าวเป็นตัวเลขจานวนหนึ่งในเชิงปริมาณ และอาจนาไปรวมกับค่าการวัดทางด้านทัศนคติในการเรียน ซึ่งใช้ลักษณะการประเมินค่าเช่นเดียวกับที่ยกตัวอย่างในเรื่องทักษะ ทาให้ได้ผลการวัดออกมาเป็นตัวเลข 3 ส่วน คือ เนื้อหา ทักษะ และทัศนคติ เมื่อนาตัวเลขทั้ง 3 ส่วนมารวมกัน จึงได้เป็น จานวนรวม ซึ่งเป็นตัวเลขจานวนหนึ่ง จากนั้น ผู้สอนควรมีเกณฑ์ตัดสินว่าจานวนเท่าใดควรประเมินค่าออกมาเป็นเกรด A, B, C, D หรือเป็นระดับ ดีมาก ดี พอใช้ ต้องปรับปรุง เพื่อใช้เป็นผลในการพิจารณาการเรียนของผู้เรียนแต่ละคน ตลอดจนใช้เป็น ข้อมูลในการปรับปรุงการเรียนการสอนต่อไป 2. ความครบถ้วน หลักในการวัดและประเมินผลที่สาคัญอีกประการหนึ่ง คือ การวัดและการประเมินผลให้ได้ครบถ้วน ของสาระวิชา กล่าวคือ ควรใช้วิธีการวัดผลหลาย ๆ รูปแบบ เพื่อได้ข้อมูลเกี่ยวกับตัวผู้เรียนในเรื่องเกี่ยวกับวิชาความรู้ที่เรียน ไปให้มากที่สุด ทั้งนี้ เพื่อช่วยให้ผลการประเมินมี ความเที่ยงตรง การเรียนการสอนดนตรีเกี่ยวข้องกับเนื้อหา ซึ่งจัดได้ว่าเป็น ทฤษฎี สามารถวัดผลโดยใช้ข้อทดสอบต่าง ๆ ได้ นอกจากนี้ทักษะ ซึ่งมีหลายด้าน เป็นการปฏิบัติที่ต้องมีการวัดผลโดยผู้เรียน ปฏิบัติกิจกรรมเป็นรายบุคคล ซึ่ง มิใช่เป็นลักษณะของการใช้ ข้อทดสอบในการวัด แต่เป็นการวั ดในเชิงการแสดง และส่วน สุดท้าย คือ ด้านทัศนคติ ซึ่งการวัดผล มักใช้การสังเกต หรือการสัมภาษณ์ โดยกระทาอย่างต่อเนื่องตลอดระยะเวลาการเรียน ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

3

การวัดและ


การสอน การวัดผลในลักษณะต่าง ๆ นี้ทาให้ได้ผลรวมที่เป็นตัวแทนของผู้เรียน ซึ่งใช้เป็นข้อมูลในการตัดสิ นระดับการเรียนรู้ ความรูค้ วามสามารถหรือผลสัมฤทธิ์ของผู้เรียนแต่ละคน ตามเกณฑ์ท่ีผู้สอนกาหนดไว้ 3. วิธีการวัดและการประเมินผล โดยทั่วไปการวัดและการประเมินผลควรกระทาใน 2 ลักษณะ คือ การวัดและการ ประเมินผลเป็นระยะ ๆ ในระหว่างเรียนหรือการวัดและประเมินผลเชิงกระบวนการ (Formative Evaluation) และการวัด และประเมินผลรวม หลังจากการเรียนเสร็จสิ้นลงหรือการประเมินผลเชิงผลงาน (Summative Evaluation) ซึ่งการวัดและ ประเมินผลทั้งสองลักษณะนี้ช่วยให้ผู้สอนได้ผลการประเมินที่ครบถ้วนสมบูรณ์ในทุกด้าน ตัวอย่างของการประเมินผลในระหว่าง เรียน ได้แก่ การเรียนจบแต่ละชั่วโมงหรือแต่ละหัวข้อย่อย มีการใช้ข้อสอบสั้น ๆ หรือสอบกลางภาคเรียน ซึ่งเป็นการสอบที่มี เนื้อหาทั้งหมดของการเรียนวิชานั้น ๆ หรือตอนใหญ่ ๆ ของวิชานั้น 4. รูปแบบการวัดและประเมินผล ในการวัดผลและประเมินผล รูปแบบของการวัดผลและประเมินผลเป็นปัจจัยหนึ่งที่ ควรคานึงถึงอยู่ทุกครั้งที่ดาเนินกิจกรรมการวัดแลประเมินผล เนื่องจากเป็นปัจจัยที่ทาให้ได้ผลของการประเมินตรงตามความ เป็นจริง รูปแบบการวัดผลที่ใช้โดยทั่วไป แบ่งได้เป็น 2 ลักษณะ คือ การประเมินผลโดยการสอบ (Examination) และการ ประเมินตามสภาพจริง (Authentic Assessment) การประเมินผลโดยการสอบ กระทาได้หลายวิธี เช่น การสอบโดยใช้ ข้อสอบ การสอบปากเปล่า การทารายงาน การประเมินผลตามสภาพจริง ได้แก่ การประเมิน ตามสภาพจริงของการเรียน ไม่มี การสอบ กระทาได้หลายวิธี เช่น การสัมภาษณ์ การเข้าชั้นเรียน การทาแฟ้มสะสมงาน การศึกษาค้นคว้า การปฏิบัติงาน รูปแบบเหล่าเป็นกิจกรรมที่ใช้วัดและประเมินผลได้เสมอ ซึ่งผู้สอนควรเป็นผู้กาหนดรูปแบบการวัดและประเมินผลให้เหมาะกับ การเรียนรู้ หรือการเรียนการสอนในแต่ละรายวิชา อย่างไรก็ตาม การใช้รูปแบบการวัดและประเมินผลที่หลากหลายเป็นสิ่งที่ควร กระทา เพื่อให้ได้ผลการเรียนรู้ครบถ้วนตรงตามความเป็นจริงมากที่สุด 5. ความสะดวก หลักในการประเมินผลประการสุดท้าย คือ ความสะดวกและเหมาะสมของการวัดและประเมินผล (Practicality) ในการวัดผล ผู้สอนควรคานึงถึง รูปแบบและวิธีการวัดผลด้วย เพื่อให้ได้ข้อมูลมาใช้ในการประเมินผลได้อย่าง ครบถ้วน และไม่ลาบากต่อการปฏิบัติ ยกตัวอย่างเช่น การใช้แบบทดสอบแบบอธิบายความ ซึ่งมีความง่ายในการเตรียม แต่ อาจจะมีความยากสาหรับผู้เรียนที่จะอธิบายความในลักษณะเนื้อหาบางอย่าง และเป็นการยากและเสียเวลาในการตรวจสาหรับ ผู้สอน ถ้าหากมีผู้เรียนเป็นจานวนมาก แบบทดสอบที่ใช้ ควรเป็นรูปแบบอื่น อีกตัวอย่างหนึ่ง ได้แก่ การสังเกต ผู้สอนอาจจะ พบกับความยากลาบากและเสียเวลาในการสังเกตพฤติกรรมบางอย่างของผู้เรียน เพื่อให้ได้ข้อมูลมาใช้ในในการประเมิน ทัศนคติ บางอย่าง ผู้สอนจึงควรกาหนดรูปแบบการสังเกตให้เหมาะสม เพื่อช่วยให้การรวบรวมข้อมูลง่ายขึ้น เช่น กาหนดช่วงสังเกตแบบ สุ่มเวลา หรืออาจจะใช้วิธีการสัมภาษณ์พูดคุยแทนการสังเกต ถ้าผู้สอนรู้สึกหรือพบว่าวิธีการนี้สะดวกและเหมาะสมกว่าการ สังเกตในบางสถานการณ์ เป็นต้น การกาหนดรูปแบบการวัดและการประเมินผลจึงอยู่ในดุลยพินิจของผู้สอนว่า ควรปฏิบัติใน ลักษณะใด เพื่อช่วยให้การประเมินผลไม่ยุ่งยากจนเกินไป มิฉะนั้น กระบวนการวัดและประเมินผลจะกลายเป็นกระบวนการที่ สร้างปัญหาให้กับการเรียนการสอน แทนที่จะเป็นกระบวนการที่ช่วยเพิ่มประสิทธิภาพให้กับการเรียนการสอนดนตรี

4. การวัดและประเมินผลความรู้ การวัดและประเมินผลความรู้ หรือสาระเนื้อหาของสาขาวิชา เป็นเรื่องในเชิงการรับรู้เชิงปัญญา การวัดและ ประเมินผลการรับรู้เชิงปัญญา จึงเป็นเรื่องของเนื้อหา ความเข้าใจ การประยุกต์ การวิเคราะห์ การสังเคราะห์ และการ ประเมินค่า ซึ่งการวัดและประเมินผลมักจะใช้การสอบเป็นหลัก เมื่อกล่าวถึงการสอบ ข้อทดสอบเป็นเรื่องสาคัญ ที่ผู้สอน ควรมีความรู้ความเข้าใจ

ข้อทดสอบ เมื่อกล่าวถึงการวัดและประเมินผล ข้อทดสอบเป็นสิ่งที่ใช้กันเสมอในการวัดและประเมินผล ผู้สอนจึงควรมีความรู้ ความเข้าใจในการสร้างข้อทดสอบ ซึ่งเป็นสิ่งที่ช่วยให้การวัดและประเมินผลมีประสิทธิภาพ

ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

4

การวัดและ


ข้อทดสอบ (Test) คือ แบบสอบที่ใช้ในการวัดผล โดยปกติอยู่ในรูปของสิ่งพิมพ์ซึ่งผู้เรียนต้องมีความรู้ในการอ่าน เพื่อทาความเข้าใจกับคาถาม หรือ คาตอบ และตอบคาถามที่มีอยู่โดยใช้ความรู้ดนตรีที่ตนมีอยู่ ข้อสอบมีมากมายหลายชนิด ซึ่งสามารถแยกออกได้เป็นสองชนิดใหญ่ ๆ คือ ข้อทดสอบแบบปรนัย และข้อทดสอบแบบอัตนัย 1. ข้อทดสอบแบบปรนัย (Objective Test) ข้อทดสอบแบบปรนัย ได้แก่ ข้อทดสอบที่มีคาตอบแน่นอนเป็นคาตอบ เดียว ซึ่งในข้อทดสอบอาจจะมีคาตอบไว้ให้เลือก หรือผู้เรียนต้องเขียนคาตอบเองแต่คาตอบของผู้เรียนแต่ละคนที่ตอบจะได้ คาตอบเดียวกัน 1.1 ประเภทของข้อทดสอบแบบปรนัย ข้อทดสอบแบบปรนัยที่ใช้กันอยู่และควรรู้จัก มี 5 ประเภท คือ ข้อ ทดสอบแบบเติมข้อความสั้น ๆ ข้อทดสอบแบบตอบคาถามสั้ น ๆ ข้อทดสอบแบบถูก-ผิด ข้อทดสอบแบบเลือกตอบทและ ข้อ ทดสอบแบบจับคู่ ต่อไปนี้คือตัวอย่างของข้อทดสอบแบบปรนัยทั้ง 5 ประเภท

1) ข้อทดสอบแบบเติมข้อความสั้นๆ

1. เพลงวอลซ์เป็นเพลงในอัตราจังหวะ (3/4) 2. ซิมโฟนีของเบโธเฟนที่มีวงขับร้องประสานเสียงขับร้องร่วมกับวงออร์เคสตรา คือ (ซิมโฟนีหมายเลข 9) 3. เพลงไทยที่บรรเลงติดต่อกัน ตั้งแต่อัตราจังหวะสามชั้น สองชั้น และชั้นเดียว เรียกว่า (เพลงเถา)

2) ข้อทดสอบแบบตอบคาถามสั้น ๆ 1. อัตราจังหวะของเพลงวอลซ์คืออะไร? (อัตราจังหวะ 3/4) 2. ซิมโฟนี่ของเบโธเฟนที่มีวงขับร้องประสานเสียงขับร้องร่วมกับวงออร์เคสตร้า คือ ซิมโฟนี่หมายเลขเท่าไร? (ซิมโฟนี่หมายเลข 9) 3. เพลงไทยที่บรรเลงติดต่อกัน ตั้งแต่อัตราจังหวะสามชั้น สองชั้น และชั้นเดียว เรียกว่าอะไร (เพลงเถา)

3) ข้อสอบแบบถูก-ผิด ถูก ถูก

ผิด ผิด

ถูก

ผิด

4) ข้อทดสอบแบบเลือกตอบ

1. เพลงวอลซ์คือเพลงในอัตราจังหวะ 4/4 2. ซิมโฟนีหมายเลข 9 ของเบโธเฟน คือ เพลงที่มีการ ขับร้อง ประสานเสียงประกอบกับวงออร์เคสตรา 3. เพลงเถา คือ เพลงไทยเพลงเดียวกันที่บรรเลงติดต่อกันตั้งแต่ อัตราจังหวะสามชั้น สองชั้น และชั้นเดียว

1. เพลงวอลซ์คือเพลงในอัตราจังหวะอะไร 1. 2/4 3. 4/4 2. 3/4 4. 6/8 2. ซิมโฟนีของเบโธเฟนที่มีการขับร้องประสานเสียงประกอบกับวงออร์เคสตรา คือ ซิมโฟนีหมายเลขใด 1. หมายเลข 3 3. หมายเลข 6 2. หมายเลข 5 4. หมายเลข 9 3. เพลงไทยที่บรรเลงติดต่อกันตั้งแต่อัตราจังหวะสามชั้น สองชั้น และชั้นเดียว เรียกว่า เพลงประเภทใด 1. เพลงเถา 3. เพลงโหมโรง 2. เพลงตับ 4. เพลงหน้าพาทย์

5) ข้อทดสอบแบบจับคู่ (ง) 1. อัตราจังหวะของเพลงวอลซ์ ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

ก. ซิมโฟนี หมายเลข 5 5

การวัดและ


(ข) 2. ซิมโฟนีของเบโธเฟนที่มีการขับร้องประสานเสียง (ฉ) 3. เพลงที่อัตราจังหวะสามชั้น สองชั้นและชั้นเดียว

ข. ซิมโฟนี หมายเลข 9 ค. 2/4 ง. 3/4 จ. เพลงโหมโรง ฉ. เพลงเถา ข้อทดสอบแบบปรนัยทั้ง 5 ประเภทที่กล่าวมานี้ ข้อทดสอบแบบเลือกตอบ จัดว่าเป็นข้อทดสอบที่นิยมใช้มากที่สุด เนื่องจากเป็นข้อทดสอบที่สามารถถามความรู้ความเข้าใจได้หลายแง่มุม และผู้เรียนมีโอกาสที่จ ะเดาถูก ได้น้อ ยกว่า ข้อ ทดสอบบางประเภท เช่น ข้อ ทดสอบแบบ ถูก -ผิด หรือ ข้อ ทดสอบแบบจับ คู่ นอกจากนี้ข้อ ทดสอบแบบเลือ กตอบยัง ง่า ยต่อ การนาไปใช้และการตรวจด้วย อย่า งไรก็ตาม ข้อ จากัดของข้อ ทดสอบแบบเลือ กตอบ ได้แก่ การที่ไ ม่ส ามารถ ใช้วัดความสามารถทางด้านการจาเนื้อ หาที่เ ป็น คาตอบของผู้เ รีย นและการเรีย บเรีย งความคิด หรือ การเสนอความคิด ที่ เป็ น ของผู้ เ รียนเองได้ ในทุกกรณี เนื่ อ งจากมี คาตอบให้เลือกเรียบร้อยแล้ว ส่วนข้อทดสอบแบบ ถูก-ผิด โอกาสในการที่ ผู้ตอบจะเดาได้ถูกมีสู งมาก ซึ่งเป็นข้อจากัดประการสาคัญของข้อทดสอบประเภทนี้ เนื่องจากมีการเลือ กเพียงสองอย่า ง คือ ถูก หรือ ผิด สาหรับ ข้อ ทดสอบแบบตอบคาถามสั้น ๆ และแบบเติม ข้อ ความสั้น ๆ นั้น มีลัก ษณะคล้า ยคลึง กัน มาก เพียงแต่ โจทย์ของข้อทดสอบเป็น คาถามหรือ เป็น ประโยคที่ ไม่ส มบูรณ์ตามประเภทของข้อ ทดสอบ ข้อ ดีของข้อ ทดสอบ ทั้ง สองแบบนี้ คือ สามารถใช้วัด ความจาในเนื้อ หาของผู้เ รีย นได้ เนื่อ งจากไม่มีคาตอบให้เ ลือ กแบบ ข้อ ทดสอบแบบ ตัวเลือก และสามารถใช้วัดเนื้อหาเกี่ยวกับศัพท์เฉพาะ ความเข้าใจบางอย่างได้เป็นอย่างดี การตรวจข้อสอบทั้งสองแบบ นี้ไม่ยากจนเกินไป เนื่องจากคาตอบเป็น ข้อ ความสั้น ๆ หรือ ศัพท์ต่า ง ๆ เท่า นั้น แต่ถ้า เทียบกับการตรวจข้อทดสอบแบบ เลือกตอบ ข้อทดสอบแบบเลือกตอบย่อมตรวจง่ายกว่า และสามารถใช้คอมพิวเตอร์ตรวจได้ การเลือ กใช้ข้อ ทดสอบแบบปรนัย แต่ละประเภทขึ้น อยู่กับความเหมาะสมที่ผู้ส อนจะพิจารณา ซึ่ง ควรคานึงถึ ง ลักษณะเนื้อ หาที่ต้อ งการวัด รวมทั้งความเหมาะสมในการใช้และตรวจด้วย เพราะการใช้ แบบทดสอบเป็นเพียงขั้นตอน หนึ่งของการประเมินผลเท่านั้น หลังจากการทดสอบแล้วผู้สอนต้องตรวจรวบรวมคะแนน และประเมินค่า รวมทั้งการนาเสนอ ผลการประเมิน ซึ่งล้วนแต่ต้องใช้เวลาทั้งสิ้น ผู้สอนจึงควรคานึงสิ่งเหล่านี้ด้วย 1.2 การสร้า งข้อ ทดสอบแบบปรนัย ในการสร้างข้อทดสอบแบบปรนัยแต่ละประเภทนั้น มี ข้อ ควรคานึงถึง แตกต่างกันออกไปตามชนิดของข้อทดสอบ แต่มีหลักบางประการที่ควรคานึงถึงในการสร้างข้อทดสอบแต่ละประเภท คือ 1. รูปแบบของโจทย์ ควรมีลักษณะเดียวกันตลอดทุกข้อ เช่น เป็นรูปคาถามทั้งหมด หรือเป็นรูปประโยค ธรรมดาทั้งหมด 2. ควรใช้ภาษาที่เข้าใจง่าย ไม่คลุมเครือ ไม่ควรใช้ข้อความในเชิงปฏิเสธซ้อนปฏิเสธ 3. ควรใช้ภาษาที่สละสลวย รัดกุม 4. สาหรับข้อทดสอบประเภทเลือกตอบ และจับคู่ ควรสร้างตัวเลือกหรือตัวจับคู่ให้ผู้ เรียนมีโอกาสเดาได้ จากตัวเลือกหรือตัวจับคู่ให้น้อยที่สุด สาหรับการสร้างข้อทดสอบแบบปรนัย ควรเป็นไปตามอัตราส่วนเนื้อหาที่กาหนดขึ้นในตารางอัตราส่วนเนื้อหาดนตรีที่ กล่าวมาข้างต้นนั้น การสร้างโจทย์ขึ้นอยู่กับความต้องการของผู้สอนว่าต้องการวัดระดับความรู้ในขั้นใด โดยปกติมักจะใช้วัด ระดับความรู้ถึงขั้นการวิเคราะห์ ซึ่งเนื้อหาเดียวกันสามารถสร้างเป็นโจทย์ที่วัดความรู้ ความเข้าใจ และแนวความคิด การ ประยุกต์ และการวิเคราะห์ได้ตามลักษณะของสถานการณ์ที่โจทย์กล่าวถึง ในส่วนต่อไปนี้ จะกล่าวถึงการแต่งโจทย์เพื่อถาม ความรู้ ความเข้า ใจและแนวคิด การประยุกต์และการวิเคราะห์ของเนื้อหาดนตรี ส่วนข้อสอบวัดการสังเคราะห์ ควรเป็น ข้อสอบแบบอัตนัยมากกว่า เนื่องจากเป็นการวัดการสร้างสรรค์ของผู้เรียน 1.3 ตัวอย่างข้อสอบแบบปรนัย ตัวอย่างข้อสอบปรนัยต่อไปนี้ นาเสนอตามระดับการเรียนรู้ 1. ความรู้ ได้แก่ เนื้อหาของสาระวิช า ซึ่งครอบคลุมในเรื่องความรู้ที่เป็นจริง ศัพท์ สัญลักษณ์ วิธีการ และ หลักการ ที่เกี่ยวข้องกับสาระวิชาเฉพาะในแต่ละสาขาวิชา ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

6

การวัดและ


1.1) ความรู้ที่เป็นจริง 1. เพลงไทยส่วนใหญ่ในสมัยอยุธยาเป็นเพลงในอัตราจังหวะใด 1. อัตราจังหวะชั้นเดียว 2. อัตราจังหวะสามชั้น 2. อัตราจังหวะสองชั้น 4. อัตราจังหวะครึ่งชั้น 1.2) ศัพท์ 1. จังหวะที่ใช้เครื่องหนังบรรเลงกากับในเพลงไทยมีชื่อเรียกว่าอะไร 1. หน้าทับ 3. ทาง 2. ลูกฆ้อง 4 กรอ 1.3) สัญลักษณ์ 1. เป็นสัญลักษณ์แทนอะไร 1. ค่อยลงเป็นลาดับ 3. ดังขึ้นเป็นลาดับ 2. ช้าลงเป็นลาดับ 4. เร็วขึ้นเป็นลาดับ 1.4) วิธีการ 1. วิธีการสาคัญที่ Debussy ใช้ในการแต่งเพลงอย่างหนึ่งคืออะไร 1. บันไดเสียงแบบโหมด 2. บันไดเสียงเพนตาคอร์ด 2. บันไดเสียงเต็ม 4. บันไดเสียงเพนตาโทนิก 1.5) หลักการ หลักการสาคัญของการประสานเสียงในเพลงยุคบาโรคคืออะไร 1. homophony 3. Monophony 2. heterophony 4. Polyphony 2. ความเข้าใจและแนวคิด ได้แก่ สาระวิชาที่อยู่ในระดับลึกซึ้งกว่าความรู้ เป็นการประมวลความรู้ เพื่อสร้างความ เข้าใจและแนวคิด ที่มีลักษณะเฉพาะแต่ละสาขาวิชา 1. ดนตรีตะวันตกจัดแบ่งเป็นยุคต่าง ๆ เนื่องจากอะไร 1. โครงสร้างของดนตรีที่เปลี่ยนไป 2. เวลาที่ผ่านไป 3. ทานองเพลงที่เปลี่ยนไป 4. ความต้องการของผู้ฟัง 2. ลักษณะเฉพาะของดนตรีไทยที่ต่างไปจากดนตรีตะวันตกคืออะไร 1. มีการเดี่ยวเครื่องดนตรี 2. มีเครื่องสาย 3. มีการแปรทานองหลัก 4. มีการประสานเสียง 3. การนาไปใช้ ได้แก่ การนาความรู้ ความเข้าใจหรือแนวคิดไปใช้ในสถานการณ์ต่าง ๆ เป็นการวัดความสามารถ อีกระดับหนึ่ง ที่ลึกซึ้งกว่าความรูค้ วามเข้าใจ 1. เมื่อฟังเพลงหนึ่งที่มีเสียงเปียโนเล่นเพียงเครื่องเดียวตลอดทั้งเพลง โดยมีทั้งหมด 3 ท่อน เพลงนี้ควร เป็นเพลงประเภทใด 1. Piano Concerto 3. Piano Music 2. Piano Trio 4. Piano Sonata ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

7

การวัดและ


4. การวิเคราะห์ ได้แก่ ความสามารถในการพิจารณาปัญหา หรือสภาพการณ์ โดยการนาความรู้ ความเข้าใจ และ การประยุกต์ใช้ เ ป็ น ส่วนประกอบ เพื่อ แก้ปั ญหา หรือ พัฒนาสภาพการณ์นั้ น ๆ การวิเคราะห์มีค วามลึกซึ้ง แสดงออกถึง ความสามารถในเชิงการคิดที่ลุ่มลึก ต้องใช้ทั้งวิจารณญาณและความรู้ความเข้าใจประกอบกัน 1. เมื่อฟังเพลงหนึ่งที่มีทานองหวาน สร้างขึ้นด้วยโน้ต 5 เสียง เพลงนี้ควรเป็นเพลงสาเนียงภาษาใด ก. เขมร ข. แขก ค. จีน ง. ลาว 5. การสังเคราะห์ ได้แก่ ความสามารถในการรวบรวมข้อมูล สาระความรู้ ความเข้าใจ การประยุกต์ การวิเคราะห์ เพื่อนาผลที่ได้มาสร้างสรรค์สิ่งใหม่ที่มีประโยชน์ต่อสาขาวิชาที่ตนศึกษา การสังเคราะห์ เป็นความสามารถในการบูรณการ ความรู้ ความเข้าใจเพื่อสร้างสิ่งใหม่ขึ้น จึงเป็นความสามารถหรือศักยภาพขั้นสูงซึ่งเป็นผลของการเรียนรู้ในระยะเวลาหนึ่ง ข้อสอบวัดการสังเคราะห์ที่เหมาะสมควรเป็นแบบอัตนัย 6. การประเมินค่า ได้แก่ ความสามารถขั้นสูง เกิดจากการบูรณาการความรู้ ความเข้าใจ การประยุกต์ การวิเคราะห์ การสังเคราะห์ เพื่อตัดสินคุณค่าโดยใช้ความรู้สึกของผู้เรียน ซึ่งอยู่บนรากฐานของเหตุผลในเชิงวิชาการ ข้อสอบวัดการประเมิน ค่าที่เหมาะสมควรเป็นแบบอัตนัย การสร้างข้อสอบในลักษณะของความรู้ ความจา ง่ายกว่าการสร้างข้อสอบในลักษณะที่ถามถึงความเข้าใจและแนวคิด การนาไปใช้ การวิเคราะห์ การสังเคราะห์ และการประเมินค่า กล่าวคือ การสร้างโจทย์หรือคาถามเกี่ยวกับความรู้ด้า นเนื้อ หา นั้น ผู้ส อนสามารถเลือ กถามความรู้ตามเนื้อ หาที่ปรากฏอยู่ใ นตาราที่ผู้สอนใช้สอน ส่วนการสร้างโจทย์หรือคาถามเกี่ยวกับ ความเข้าใจและแนวคิด การวิเคราะห์ การสังเคราะห์ และการประเมินค่านั้น ผู้สอนต้องสรุปเนื้อหาที่ต้องการสร้างโจทย์หรือคาถาม ให้เป็นรูปของแนวคิดซึ่งอาจจะเป็น การรวบรวมแนวคิด จากเนื้อ หาในหลาย ๆ ตอน และสร้า งเป็น โจทย์ห รือ คาถามใน ลักษณะของการให้ ผู้เรียนประยุกต์คิดวิเคราะห์ สังเคราะห์ และประเมินค่า มิใช่เป็นการถามความรู้ในลักษณะใช้ความจาในการตอบ จึงเห็นได้ว่า ข้อสอบลักษณะที่เป็นความเข้าใจและแนวคิด ตลอดจนถึงการประเมินค่า เป็นข้อสอบที่ยากในการตอบมากว่า ข้อสอบประเภทถามความรู้ โดยทั่วไป การสร้างข้อ สอบควรให้มีทั้งการถามเกี่ยวกับเรื่องความรู้ความเข้าใจและเรื่องอื่น ๆ เพราะการเรียนการสอนที่เหมาะสม ควรเปิดโอกาสให้ผู้เรียนได้คิดในระดับการเรียนรู้ต่าง ๆ นอกเหนือไปจาการจดจาความรู้ เพียงอย่างเดียว การวัดและประเมินผลจึงควรเกี่ยวข้องกับระดับการเรียนรู้เริ่มตั้งแต่ ความรู้ความจา ความเข้าใจ การประยุกต์ การวิเคราะห์ การสร้างสรรค์ และการประเมินค่า ซึ่งสัดส่วนของข้อสอบตามระดับการเรียนรู้ ที่ใช้เป็นเกณฑ์ในการสร้างข้อสอบ ขึ้นอยู่กับข้อกาหนดของหลักสูตรและผู้สอนเห็นสมควร 2. ข้อทดสอบแบบอัตนัย (Subjective Tests) ข้อทดสอบแบบอัตนัย ได้แก่ ข้อทดสอบเชิงอธิบายความ คาตอบ ของผู้เรียนแต่ละคนที่ได้จากข้อทดสอบแบบนี้อาจแตกต่างกันในหลักการหรือรายละเอียด ซึ่งต่างไปจากข้อทดสอบแบบปรนัย ซึง่ มีคาตอบแน่นอน ผู้เรียนสามารถคิดแนวการตอบข้อทดสอบแบบอัตนัยได้อย่างอิสระ ทาให้ข้อทดสอบแบบนี้วัดความคิด การ วิเคราะห์ความสามารถของผู้เรียนได้เต็มที่ และดีกว่าการใช้แบบทดสอบแบบปรนัย อย่างไรก็ตาม การตรวจและเกณฑ์การกาหนด คะแนนของข้อทดสอบแบบนี้ค่อนข้างยุ่งยาก นอกจากนี้ ข้อทดสอบแบบอัตนัยยังไม่สามารถวัดความรู้ความเข้าใจในจุดย่อย ๆ ได้ดีเท่ากับการใช้ข้อทดสอบแบบปรนัย เนื่องจากผู้เรียนมีอิสระในการตอบ ซึ่งคาตอบที่ได้อาจมิได้กล่าวถึงจุดย่อย ๆ ของเนื้อหา แต่กล่าวถึงลักษณะรวม ๆ ของเนื้อหาตามความเข้าใจของผู้เรียน การใช้ข้อทดสอบแบบอัตนัยจึงควรใช้ในกรณีที่การประเมินผลไม่สามารถ ใช้ข้อทดสอบแบบปรนัยวัดได้ ซึ่งมักจะใช้ในการวัด การวิเคราะห์ การสังเคราะห์ และการประเมินค่า ซึ่งเป็นระดับการเรียนรู้ข้นั สูง 2.1 ข้อดีและข้อจากัดของข้อทดสอบแบบอัตนัย ข้อดีของข้อทดสอบแบบอัตนัยที่ควรกล่าวถึงมีดังนี้ 1. สามารถใช้วัดผลการเรียนที่สลับซับซ้อน ซึ่งข้อสอบประเภทอื่นวัดไม่ได้ 2. เปิดโอกาสให้ผู้เรียนได้ใช้ความรู้ ความคิด การประยุกต์ การวิเคราะห์ การสังเคราะห์และการ ประเมินค่าในการตอบข้อทดสอบอย่างเต็มที่ โดยเฉพาะอย่างยิ่งในเรื่องของการสังเคราะห์ และการประเมินค่า ซึ่งมักจะไม่ใช้ข้อสอบ แบบปรนัย ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

8

การวัดและ


3. ง่ายในการจัด เตรียม เพราะเพียงคาถามสั้น ๆ สามารถกิน ความได้มาก เนื้อ หาที่ผู้ส อนสอน มาตลอดภาคการศึกษา อาจจะใช้คาถามเพียงข้อเดียว หรือ 2-3 ข้อ สามารถครอบคลุมเนื้อหาทั้งหมดได้ 4. เนื่องจากการตอบข้อทดสอบแบบนี้ต้องใช้ความสามารถทางด้านภาษาไทย ข้อทดสอบแบบนี้จึงเป็น เครื่องชี้บ่ง และช่วยในการปรับปรุงภาษาเขียนของผู้เรียนได้ทางหนึ่ง ข้อจากัดของข้อทดสอบแบบอัตนัยที่ควรกล่าวถึง คือ 1. ความเชื่อถือได้มีค่าต่า เนื่องจากข้อทดสอบแบบอัตนัยสามารถตอบได้หลายแบบตามความคิดของ ผู้เขียน จึงเป็นการยากในการที่จะให้คะแนน จากการวิจัย พบว่า การให้คะแนนของผู้ตรวจแต่ละคนกับคาตอบของข้อทดสอบที่ผู้ เดียวทาไม่เท่ากัน และแม้แต่ผู้ตรวจคนเดียวในบางครั้ง ให้คะแนนคาตอบชุดเดียวกันต่างกัน เมื่อมีการทดลองให้ตรวจคาตอบ เดียวกัน ทั้งนี้เป็นเพราะผู้ตรวจมีเกณฑ์การให้คะแนนต่างกัน ซึ่งอาจแก้ได้บ้าง โดยการกาหนดเกณฑ์การให้คะแนนไว้ล่วงหน้า อย่างชัดเจน ทั้งเนื้อหาในการตอบ และสัดส่วนคะแนนของแต่ละส่วน เมื่อจะตรวจข้อทดสอบแบบนี้ ต้องให้คะแนนตามเกณฑ์ ที่ตั้งไว้อย่างเคร่งครัด 2. การตรวจเสียเวลามาก เนื่องจากคาตอบของข้อทดสอบแบบอัตนั ย เป็น ความเรียง ซึ่ง ย่อม มีความยาวขนาดหนึ่ง และแนวการตอบของผู้เรียนแต่ละคนอาจจะมีระบบต่างกัน ทาให้การตรวจให้คะแนนต้ อ งใช้ เ วลาในการ พิ จ ารณามากเพื่ อ ความยุ ติ ธ รรม ซึ่ ง ข้ อ ทดสอบแบบอั ต นั ย เพี ย ง 2-3 ข้ อ สาหรั บ นักเรียนมัธยม 30 คน อาจจะต้องใช้ เวลาตรวจให้คะแนนนานพอสมควรทีเดียว เรื่องนี้อาจช่วยได้บ้างโดยการกาหนดความยาวในการตอบ เช่น การตอบไม่ควรเกิน 5 หน้ากระดาษ เป็นต้น 3. ข้อจากัดที่ส าคัญอี กประการหนึ่ ง คื อ ข้อทดสอบแบบอัตนั ยมักใช้ วัดเนื้ อหาได้จากัด ไม่ทั่วถึง กล่าวคือ ข้อทดสอบแบบนี้อาจวัดเนื้อหาบางจุดได้ลึกซึ้ง ในขณะที่ไม่สามารถวัดเนื้อหาจุดอื่น ๆ ได้โดยเฉพาะเนื้อหาที่เป็น ความรู้ ความจาที่เป็นแนวคิดย่อย ๆ แต่ละเรื่อง ซึ่งสามารถใช้ข้อทดสอบแบบปรนัยวัดได้อย่าง มีประสิทธิภาพ การใช้ข้อ ทดสอบแบบอัตนัยจึงควรเลือกใช้ให้เหมาะกับเนื้อหาที่ผู้สอนต้องการวัดผลการเรียนของผู้เรียน 2.2 การสร้างและการตรวจข้อทดสอบแบบอัตนัย เพื่อทาให้ข้อทดสอบแบบอัตนัยมีความเที่ยงตรงและเชื่อถือได้ มากที่สุด กระบวนการสร้างแบบทดสอบและการตรวจให้คะแนนควรสัมพันธ์กัน ในการสร้างแบบทดสอบ ควรใช้คาถามหรือ โจทย์ที่ทาให้ผู้เรียนเข้าใจและตอบในสิ่งที่ตั้งใจจะถาม อย่าเปิดโอกาสให้เลือกตอบได้หลาย ๆ แบบหรือมีคาถามให้เลือก ใช้เวลา จากัดในการตอบข้อทดสอบแต่ละข้อ สาหรับการตรวจให้คะแนนควรมีแบบเฉลยเกณฑ์การให้คะแนนย่อย ๆ และตรวจให้คะแนน คาตอบของข้อทดสอบแต่ละข้อ โดยไม่ควรดูชื่อผู้ทาแบบทดสอบในขณะตรวจข้อทดสอบ 2.3 ตัวอย่างข้อทดสอบแบบอัตนัย ตัวอย่างข้อสอบแบบอัตนัยต่อไปนี้ นาเสนอและมีการวิเคราะห์ เพื่อแสดงให้ เห็นระดับการเรียนรู้ของข้อทดสอบ และข้อดีและข้อบกพร่อง 1. จงเขียนบรรยายถึงสิ่งที่เรียนผ่านมาทั้งหมดเกี่ยวกับวิชาดนตรีศึกษา วิเคราะห์: ข้อทดสอบนี้ข้อเดียว วัดผลเนื้อหาที่เรียนมาทั้งหมด เห็นได้ว่า ผู้ตอบข้อสอบตอบได้ในหลายแง่มุม มี ขอบเขตกว้างขวางมาก การตรวจให้คะแนนข้อสอบข้อนี้ค่อนข้างยาก เพราะต้องวางเกณฑ์ไว้หลายด้าน ให้ครอบคลุม และได้ แต่ความรู้ ไม่สามารถวัดความเข้าใจได้มากนัก 2. ลักษณะของเพลงในยุคบาโรคเป็นอย่างไรอธิบายมาพอสังเขป วิเคราะห์: โจทย์ข้อนี้จากัดการตอบลงมากกว่าตัวอย่างแรก การถามทาให้ได้คาตอบในแง่ของความรู้มากกว่าการ วิเคราะห์ 3. เมื่อฟังเพลงหนึ่งแล้วจะทราบอย่างไรว่า เพลงนั้นเป็นเพลงในยุคบาโรคหรือคลาสสิก จงแสดงความคิดเห็นพร้อม เหตุผล วิเคราะห์: โจทย์ข้อนี้ถามเกี่ยวกับการวิเคราะห์เปรียบเทียบ ซึ่งผู้ตอบข้อสอบ ต้องแยกแยะลักษณะของเพลงทั้ง สองยุค และต้องนาเสนอเหตุผลว่า เพลงนั้นเป็นเพลงในยุคบาโรคหรือโรแมนติก ซึ่งเป็นคาถามที่เปิดโอกาสให้ผู้ตอบข้อสอบ ประยุกต์ความรู้ที่เรียนมาได้มากกว่าตัวอย่างที่ 1 และ 2 ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

9

การวัดและ


4. ดนตรีไทยและดนตรีตะวันตกมีหลายอย่างที่เหมือนกัน และต่างกัน จงเปรียบเทียบลักษณะต่าง ๆ ของดนตรีไทย และดนตรีตะวันตกในลักษณะของการผสมวง และประเภทของเครื่องดนตรี วิเคราะห์: โจทย์ข้อนี้มีการจากัดคาตอบให้แคบลง คือ ให้วิเคราะห์ความเหมือนและความแตกต่างของการผสมวง และประเภทของเครื่องดนตรี โจทย์ลักษณะนี้เป็นโจทย์ถามความเข้าใจ และมีการจากัด ขอบเขตของการตอบ การกาหนด เกณฑ์การให้คะแนนมีความรัดกุมกว่าตัวอย่างที่ผ่านมา ทาให้การให้คะแนนมีความเที่ยงตรงและเชื่อถือได้มากขึ้น 5. ประพันธ์บทเพลงที่มีลักษณะคล้ายบทเพลงในยุคบาโรก ในบันไดเสียง A major โดยมีการเปลี่ยนบันไดเสียง โดยใช้รูปแบบ Ternary มีความยาวประมาณ 48 ห้องเพลง วิเคราะห์: โจทย์ข้อนี้เน้นที่การสังเคราะห์ คือ การให้ผู้ตอบข้อสอบประพันธ์เพลงขึ้นเอง ซึ่งต้องใช้ความรู้ที่มีอยู่ มาสร้างสิ่งใหม่ แต่ มีการจากัดขอบเขต เพื่อให้ผู้ตอบข้อสอบมีกรอบในการคิด คือ เป็นแนวเพลงในยุคบาโรค มีการกาหนด บันไดเสียง รูปแบบ และมีความยาวของบทเพลงอย่างชัดเจน 6. ท่านชอบเพลงในยุคใด จงอธิบายพร้อมเหตุผลที่เกี่ยวข้องกับแนวคิดพื้นฐานของการสร้างสรรค์เพลงแต่ละยุค วิเคราะห์: โจทย์ข้อนี้ถามเกี่ยวกับการประเมินค่าของผู้ตอบข้อสอบโดยตรง หลังจากที่ได้เรียนรู้เพลงทุกยุคมาแล้ว ผู้ตอบข้อสอบจาเป็นต้องประมวลความรู้และตัดสินคุณค่าของเพลงแต่ละยุค บนรากฐานของเหตุผลเพื่อแสดงจุดยืนของตนเอง ข้อสอบกาหนดกรอบไว้ให้ใช้แนวคิดพื้นฐานของการสร้างสรรค์เพลงแต่ละยุค เพื่อช่วยให้ผู้ตอบข้อสอบตอบได้ง่ายขึ้น ข้อทดสอบแบบอัตนัยมีข้อดีดังที่กล่าวมาแล้วข้างต้น แต่ก็มีข้อจากัดในเรื่องการตรวจให้คะแนน ดังนั้น การใช้ข้อทดสอบ แบบอัตนัยจึงควรใช้วัดในสิ่งที่ผู้สอนคิดว่าข้อทดสอบแบบปรนัยวัดไม่ได้ ซึ่งช่วยให้กระบวนการประเมินผลสะดวกและสมบูรณ์ เท่าที่กล่าวมาทั้งหมดในเรื่องการวัดและประเมินผลเนื้อหาดนตรี เป็นเรื่องของการวัดและประเมินผลโดยใช้การสอบ โดยมีข้อทดสอบเป็น เครื่องมือ เนื่อ งจากเป็น วิธีที่เ หมาะสมกว่า วิธีอื่น ๆ อย่า งไร ก็ต าม การวัดผลโดยวิธีอื่น เช่น การ สัมภาษณ์หรือสอบปากเปล่าเกี่ยวกับเนื้อหา หลักการหรือทฤษฎี เป็นวิธีหนึ่งที่วัดผลได้อย่างดี แต่ค่อนข้างเสียเวลา เพราะในช่วง เวลาหนึ่ง สามารถวัดผลได้เพียงคนเดียว นอกจากนี้ การวัดผลโดยการให้ทางานเป็นโครงการ หรือการทาข้อทดสอบแบบให้เป็น การบ้านเป็นวิธีการวัดและประเมินผลที่ใช้ได้ดเี ช่นกัน 3. การวิเคราะห์ข้อสอบ (Item Analysis) หมายถึง (McAlpine, 2002) วิธีการตรวจสอบคุณภาพของการสอบ โดยการพิจารณาข้อสอบเป็นรายข้อ ผลการวิเคราะห์ข้อสอบเป็นประโยชน์ในการชี้แสดงการสอบเป็นไปตามวัตถุประสงค์ที่ได้ตั้ง ไว้ ในระดับอุดมศึกษา การสอบเกี่ยวเนื่องการสร้างเครื่องมือในการวัดผลเพื่อใช้วัดความรู้ความสามารถของผู้เรียนหรือผู้เข้า สอบ ซึ่งผลที่ได้สามารถนาไปใช้ในการพัฒนาการเรียนรู้ให้มีประสิทธิภาพมากขึ้น การวิเคราะห์ข้อสอบ เป็นการสร้างความ เชื่อมั่นของเครื่องมือที่ใช้ในการวัดผล เพื่อให้ผลที่ได้จากการวัดตรงตามวัตถุประสงค์ 3.1 ทฤษฎีการวิเคราะห์ข้อสอบ ทฤษฎีที่เกี่ยวข้องกับการวิเคราะห์ข้อสอบ ได้แก่ ทฤษฎีการสอบคลาสสิก ทฤษฎีการตอบสนองข้อสอบ และการวัดผลของรัส์ช ทฤษฎีการตอบสนองข้อสอบ และการวัดผลของราส์ช เป็นทฤษฎีการ วิเคราะห์ข้อสอบที่พัฒนามาจาก Lantent Trait Theory 1. ทฤษฎีการทดสอบคลาสสิก (Classical Test Theory, CTT) เป็นทฤษฎีที่ใช้กันอย่างกว้างขวางที่สุด รากฐาน ของทฤษฎีมาจากความรู้ทางจิตวิทยาซึ่งพัฒนาขึ้นในช่วงเปลี่ยนศตวรรษที่ 20 การประยุกต์ทฤษฎีนี้ใช้กันเสมอในวงการ ทดสอบทางการศึกษา ทฤษฎีนี้เน้นการวิเคราะห์ข้อสอบเป็นรายข้อ โดยวิเคราะห์ค่าความยาก (Item difficulty) ค่าอานาจ จาแนก (Discrimination power) และประสิทธิภาพของตัวลวง (Distractor Effectiveness) ส่วนการวิเคราะห์ข้อสอบทั้ง ฉบับจะวิเคราะห์ค่าความตรง หรือความเที่ยงตรง (Validity) ค่าความเที่ยงหรือความเชื่อมั่น (Reliability) ของ แบบทดสอบ 2. ทฤษฎีการตอบสนองข้อสอบ (Item Response Theory, IRT) ทฤษฎีนี้พัฒนาขึ้นในช่วงทศวรรษที่ 1940 ในส ก๊อตแลนด์ และมีการพัฒนาต่อมาในช่วงทศวรรษที่ 1960 และช่วงต้นของทศวรรษที่ 1970 ในประเทศสหรัฐอเมริกา ซึ่งมีการ ใช้กันอย่างกว้างขวาง ทฤษฎีนี้ ใช้วิเคราะห์ข้อสอบเป็นรายข้อจะวิเคราะห์ค่าความยาก ค่าอานาจจาแนก ค่าความน่าจะเป็น ของการเดาถูก ค่าฟังก์ชั่นสารสนเทศของข้อสอบ (Item information function) ส่วนการวิเคราะห์ข้อสอบทั้งฉบับจะ วิเคราะห์ค่าฟังก์ชั่นสารสนเทศของแบบทดสอบ (Test information function) และความคลาดเคลื่อนมาตรฐานของการ ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

10

การวัดและ


ประมาณค่าความสามารถ ซึ่งถ้าความคลาดเคลื่อนมาตรฐานของการประมาณค่ามีค่าต่า แสดงว่าการประมาณค่าความสามารถ ของผู้เรียนมีความแม่นยาสูง 3. ทฤษฎีการวัดผลของรัส์ช (Rasch Measurement, Rasch) ทฤษฎีนี้พัฒนาโดย รัส์ชในช่วงท้ายของทศวรรษที่ 1960 ในประเทศเดนมาร์ก ใช้เฉพาะในการทดสอบทางการศึกษา และมีการใช้ในการทดสอบทางจิตวิทยาอยู่บ้าง ทฤษฎีนี้เป็น ที่นิยมเช่นกันในประเทศสหรัฐอเมริกาและสหราชอาณาจักรในช่วงทศวรรษที่ 1970 แต่ในปัจจุบันไม่เป็นที่นิยมใช้มากนัก ยกเว้นในประเทศออสเตรเลียยังคงใช้การวิเคราะห์ข้อสอบโดยทฤษฎีนี้อยู่ ในการเรียนการสอบระดับอุดมศึกษาโดยทั่วไป ข้อสอบที่ใช้ในการวัดผลระหว่างเรียน หรือใช้ในการวัดผลปลายภาค การศึกษา เป็นข้อสอบที่ผู้สอนสร้างขึ้น เอง โดยมิได้พัฒนาเป็นแบบทดสอบมาตรฐาน การวิเคราะห์ข้อสอบ จึงควร วิเคราะห์ตามแนวทฤษฎีการทดสอบแบบคลาสสิก เนื่องจากผลของการวิเคราะห์ทาให้ทราบ ความยากง่ายของข้อสอบ อานาจ จาแนก และประสิทธิภาพของตัวลวงด้วย ซึ่งเป็นประโยชน์ในการพัฒนาข้อสอบให้ได้มาตรฐาน โดยการพัฒนาโจทย์หรือข้อ คาถาม และคาตอบถูกและตัวลวง ส่วนการวิเคราะห์ข้อสอบตามแนวทฤษฎีการตอบสนองข้อสอบและทฤษฎีการวัดผลของรัส์ช เหมาะในการใช้วิเคราะห์แบบทดสอบที่ได้พัฒนาแล้ว ดังนั้นในการกล่าวถึงการวิเคราะห์ข้อสอบต่อไปนี้ จะกล่าวเฉพาะการ วิเคราะห์ข้อสอบตามแนวทฤษฎีการทดสอบแบบคลาสสิก 3.2 วิธีการวิเคราะห์ข้อสอบ ตามทฤษฎีการทดสอบแบบคลาสสิก (วรรณดี แสงประทีปทอง, 2556) เชื่อว่า คะแนนที่ได้จากการทดสอบแต่ละครั้ง (X) ประกอบด้วยคะแนนความสามารถที่แท้จริง (T) ของผู้สอบ และความคลาดเคลื่อน ในการวัด (E) ซึ่งสามารถเขียนเป็นสมการทางคณิตศาสตร์ได้ดังนี้ X = T+E เนื่องจากในการทดสอบแต่ละครั้ง จะเกิดความคลาดเคลื่อนขึ้นได้ไม่มากก็น้อย แต่เป้าหมายของการวัดต้องการให้ คะแนนที่วัดหรือทดสอบได้มีค่าใกล้เคียงคะแนนความสามารถที่แท้จริงของผู้สอบมากที่สุด ดังนั้นจึงต้องพยายามหาวิธีการต่างๆ เพื่อทาให้การวัดเกิดความคลาดเคลื่อนน้อยที่สุดเท่าที่จะทาได้ เมื่อกล่าวถึงการวิเคราะห์ข้ อสอบ สิ่งที่เป็นข้อมูลหลักในการวิเคราะห์ข้อสอบ คือ ตัวข้อสอบ ซึ่งในการวิเคราะห์ ข้อสอบที่จะกล่าวต่อไปนี้ เป็นการวิเคราะห์ ข้อสอบปรนัย (Objective Test) แบบเลือกตอบ (Multiple Choice Test) วิธีการวิเคราะห์ข้อสอบ ใช้ผลการสอบของผู้เข้าสอบเป็นเกณฑ์ในการพิจารณา การวิเคราะห์ข้อสอบทาให้ทราบถึงคุณภาพของ ข้อสอบแต่ละข้อ 3 ประการ คือ ค่าความยากง่าย อานาจจาแนก และประสิทธิภาพตัวลวง 1. ค่าความยากง่าย (Item difficulty, P) หมายถึง สัดส่วนระหว่างผู้เข้าสอบที่ตอบข้อสอบหรือคาถามแต่ละข้อได้ ถูกต้อง กับจานวนผู้เข้าสอบทั้งหมดที่ตอบ ค่านี้จึงเป็นตัวบ่งชี้ให้ทราบถึง ร้อยละของผู้เข้าสอบที่สามารถตอบข้อสอบได้ถูกต้อง การหาความยากง่ายของข้อสอบ คานวณได้จากสูตรต่อไปนี้ จานวนนักเรียนที่ตอบถูก P = จานวนนักเรียนทั้งหมด ตัวอย่าง - ถ้านักเรียน 90 คน ตอบคาถามข้อ 1 ถูก 45 คน ค่า P = 40 / 80 = 0.50 - ถ้านักเรียน 90 คน ตอบคาถามข้อ 2 ถูก 90 คน ค่า P = 80 / 80 = 1.00 - ถ้านักเรียน 90 คน ตอบคาถามข้อ 3 ถูก 0 คน ค่า P = 0 / 80 = 0.00 เห็นได้ว่า P มีค่าได้ตั้งแต่ 0.00 ถึง 1.00 ถ้า P มีค่าน้อย แสดงว่าข้อสอบข้อนั้นยาก เพราะจานวนผู้เข้า สอบตอบถูกมีน้อย และถ้า P มีค่ามาก แสดงว่าข้อสอบข้อนนั้นง่าย เพราะจานวนผู้เข้าสอบตอบถูกมีมาก ข้อสอบที่ เหมาะสมในการนาไปใช้งาน ควรมีค่า P ตั้งแต่ 0.20 ถึง 0.80 2. อานาจจาแนก (Discrimination Power, r) หมายถึง ประสิทธิภาพของข้อสอบในการแยกความสามารถเก่ง อ่อนของผู้เข้าสอบ การหาค่า r ใช้ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างความเก่งอ่อน และการตอบถูกผิดของผู้เข้าสอบเป็นหลัก การหาค่าอานาจจาแนกคานวณได้จากสูตร ต่อไปนี้ จานวนผู้เข้าสอบที่ตอบถูกในกลุ่มสูง – จานวนผู้เข้าสอบที่ตอบถูกในกลุ่มต่า r

=

ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

11

การวัดและ


จานวนผู้เข้าสอบในกลุ่มสูงหรือกลุ่มต่า ค่า r จะมีค่าตั้งแต่ -1.00 ถึง 1.00 ซึ่งมีความหมายดังนี้ r = 1.00 แสดงว่า ข้อนั้นผู้เข้าสอบในกลุ่มสูงตอบถูกทุกคน และผู้เข้าสอบในกลุ่มต่าตอบผิดทุกคน r > 0 (ไม่ถึง 1.00) แสดงว่า ข้อนั้นผู้เข้าสอบที่ตอบถูกในกลุ่มสูงมีมากกว่าผู้เข้าสอบที่ตอบถูกในกลุ่มต่า r = 0 แสดงว่า ข้อนั้นจาแนกผู้เข้าสอบไม่ได้เลย คือจานวนผู้เข้าสอบที่ตอบถูกในกลุ่มสูงและกลุ่มต่ามีเท่ากัน r = -1 แสดงว่า ข้อนั้นผู้เข้าสอบในกลุ่มสูงทุกคนตอบผิด และผู้เข้าสอบในกลุ่มต่าทุกคนตอบถูก ถือว่ามีอานาจจาแนก ในทางกลับกันกับสภาพความเป็นจริง r < 0 (ไม่ถึง -1.00) แสดงว่า ข้อนั้นผู้เข้าสอบที่ตอบถูกในกลุ่มสูงมีน้อยกว่า ผู้เข้าสอบที่ตอบถูกในกลุ่มต่า ถือว่า จาแนกในทางกลับกันเช่นเดียวกัน ค่าอานาจจาแนกที่บอกบ่งถึงความน่าเชื่อถือได้ของข้อสอบ ควรมีค่าตั้ งแต่ 0.4 ขึ้นไป (Massey, 1995) ค่าอานาจ จาแนกที่ต่ากว่า 0.2 เป็นค่าอานาจจาแนกต่า 3. ประสิทธิภาพตัวลวง (Distractor Effectiveness) ตัวลวง หมายถึง ตัวเลือกที่ผิด ตัวลวงที่มีประสิทธิภาพควร จะเป็นตัวลวงที่มีผู้เข้าสอบเลือกอย่างน้อยร้อยละ 5 และเป็นตัวลวงที่มีผู้เข้าสอบในกลุ่มสูงเลือกน้อยกว่าผู้เข้าสอบในกลุ่มต่า ตัวลวงในข้อใดไม่มีผู้เข้าสอบเลือกเลย หรือเลือกน้อยกว่าร้อยละ 5 หรือผู้เข้าสอบในกลุ่มสูงเลือกมากกว่าผู้เข้าสอบในกลุ่มต่า ควรได้รับการปรับปรุงแก้ไข สาหรับตัวเลือกถูกนั้นผู้เข้าสอบในกลุ่มสูงต้องเลือกมากกว่าผู้เข้าสอบในกลุ่มต่า 4. การวิเคราะห์ขอ้ สอบทัง้ ฉบับ การวิเคราะห์ข้อสอบทั้งฉบับ เป็นการตรวจสอบคุณภาพของเครื่องมือวัด คุณสมบัติที่สาคัญมากของเครื่องมือวัดใด ๆ มี 2 ประการ คือ ความเที่ยงตรง และความเชื่อถือได้ 1. ความเที่ยงตรง (Validity) หมายถึง ความสามารถของเครื่องมือวัด ที่สามารถวัดได้ในสิ่งที่ต้องการวัด เป็น ความสอดคล้องระหว่างผลการวัด กับสิ่งที่ต้องการวัด ความตรงที่ใช้ในการทดสอบจาแนกเป็น 3 ชนิด ได้แก่ ความตรงตาม เนื้อหา ความตรงตามโครงสร้าง และความตรงตามเกณฑ์ที่เกี่ยวข้อง แบบทดสอบวัดผลสัมฤทธิ์ เกี่ยวข้องกับความตรงตาม เนื้อหามากกว่าความเที่ยงตรงชนิดอื่น ๆ 1. ความตรงตามเนื้อหา หมายถึง ความสอดคล้องของเนื้อหาสาระของข้อสอบ กับเนื้อหาวิชาที่สอน หรือข้อสอบ สอดคล้องและครอบคลุมเนื้อหา และวัตถุประสงค์ของวิชาที่สอน การตรวจสอบความตรงตามเนื้อหา ทาได้โดยการวิเคราะห์ เนื้อหาของแบบทดสอบทั้งฉบับโดยอาศัย ผู้เชี่ยวชาญเป็นผู้พิจารณาว่าเนื้อหาสาระของแบบทดสอบ สอดคล้องกับแบบเรียน รายละเอียดของวิชา และหลักสูตรหรือไม่ ซึ่งในทางปฏิบัติจะใช้ตารางวิเคราะห์หลักสูตรเป็นตัวเทียบ 2. ความตรงตามโครงสร้าง หมายถึง ความสามารถของแบบทดสอบที่จะวัดคุณลักษณะหรือ พฤติกรรม ตามโครงสร้างทฤษฎีได้ การตรวจสอบความตรงตามโครงสร้าง มีหลายวิธี เช่น 2.1 การเทียบกลุ่มอ้างอิง (Known Group) วิธีการนี้จะนาแบบทดสอบ ที่สร้างขึ้นไปใช้กับกลุ่มที่ทราบ คุณลักษณะทางจิตวิทยาตามที่ต้องการวัดโดยใช้ 2 กลุ่ม ที่มีลักษณะตรงข้ามกัน แล้วทดสอบความแตกต่างของค่าที่วัดได้จาก กลุ่มทั้งสอง ถ้าความแตกต่างมีนัยสาคัญเชิงสถิติ แสดงว่าแบบทดสอบนั้นมีความตรงตามโครงสร้าง 2.2 การวิเคราะห์ตัวประกอบ (Factor Analysis) โดยอาศัยวิธีการทางสถิติสาหรับตรวจหาคุณสมบัติทาง จิตวิทยา ด้วยการวิเคราะห์ความสัมพันธ์ระหว่างข้อสอบแต่ละข้อว่า ข้อสอบทั้งหมดนั้นวัด องค์ประกอบอะไรบ้าง ถ้าตรงตาม ทฤษฎีหรือสมมุติฐานที่ตั้งไว้ แสดงว่าแบบทดสอบมีความตรงตามโครงสร้าง 2.3 การหาความสัมพันธ์กับเกณฑ์ที่มีโครงสร้างเหมือนกัน วิธีนี้ทาโดยหาสัมประสิทธิ์สหสัมพันธ์ ระหว่าง คะแนนจากแบบทดสอบที่เราสร้างขึ้นกับแบบทดสอบอื่นที่วัดในโครงสร้าง หรือทฤษฎีเดียวกัน ซึ่งพิสูจน์ไว้แล้วว่ามีความตรง ตามโครงสร้าง ถ้าแบบทดสอบที่สร้างขึ้นใหม่ มีสหสัมพันธ์กับแบบทดสอบที่เป็นเกณฑ์สูง แสดงว่าแบบทดสอบที่สร้างขึ้นมีความ ตรงตามโครงสร้าง 3. ความตรงตามเกณฑ์ที่เกี่ยวข้อง เป็นการพิจารณาความสัมพันธ์ระหว่างแบบทดสอบที่สร้างขึ้นกับเกณฑ์ภายนอก บางอย่าง ซึ่งเป็นสภาพความเป็นจริงที่ได้จากการปฏิบัติงานความตรงตามเกณฑ์ที่เกี่ยวข้อง แบ่งออกเป็น 2 ประเภทดังนี้ ณรุทธ์ สุทธจิตต์ 2557 12 การวัดและ ประเมิผล


3.1 ความตรงตามสภาพ (Concurrent Validity) เป็นความสามารถของแบบทดสอบที่วัดได้ตรงกับ สภาพความเป็นจริงของบุคคลในขณะนั้น เช่น แบบทดสอบวัดผลสัมฤทธิ์วิชาภาษาไทย นาไปให้ผู้เรียนคนหนึ่งสอบ ปรากฏว่า ได้คะแนนสูง ซึ่งในสภาพความเป็นจริงผู้เรียนมีความสามารถทางภาษาไทยสูงจริง แสดงว่าแบบทดสอบวัดได้ตรงตามสภาพที่ เป็นอยู่ 3.2 ความตรงตามการพยากรณ์ (Predictive Validity) เป็นความสามารถของแบบทดสอบที่วัดผลได้ตรง กับสภาพความเป็นจริงที่เกิดขึ้นในอนาคต เช่น แบบทดสอบคัดเลือกบุคคลเข้าศึกษาต่อ เมื่อนาไปใช้สอบคัดเลือกบุคคลเข้า ศึกษา ปรากฏว่าผู้ที่สอบคัดเลือกได้คะแนนดี เมื่อเข้าศึกษามีผลการเรียนอยู่ในเกณฑ์ดี แสดงว่าแบบทดสอบมีความตรงตาม การพยากรณ์ 2. ความเชื่อถื่อได้ (Reliability) หมายถึง ความคงที่ของคะแนนที่วัดได้แต่ละครั้ง วิธีการหาค่าความเที่ยงของ แบบทดสอบทาได้หลายวิธี คือ วิธีสอบซ้า วิธีแบบทดสอบคู่ขนาน และวิธีหาความสอดคล้องภายใน แบ่งเป็น วิธีแบ่งครึ่ง แบบทดสอบ วิธีหาจากสูตรคูเดอร์และริชาร์ดสัน และวิธีหาจากสูตรสัมประสิทธิ์แอลฟา 2.1. วิธีสอบซ้า การหาความเชื่อถือได้โดยวิธีสอบซ้า เป็นการหาความสัมพันธ์ของคะแนนจากการทาแบบทดสอบ ฉบับเดียวกันสองครั้ง โดยทิ้งช่วงห่างให้เหมาะสม (ประมาณ 2 สัปดาห์) การหาความเชื่อถือได้โดยวิธีนี้เป็นการตรวจสอบ ความคงที่ของการแสดงออกของผู้สอบสองครั้งว่า จะมีความคงที่หรือไม่ วิธีการนี้มีจุดอ่อนที่ความแปรเปลี่ยนภายในตัวผู้สอบใน ระหว่างทิ้งช่วงการสอบ ดังนั้น การหาความเชื่อถือได้โดยวิธีนี้ควรนาไปใช้กับแบบทดสอบวัดคุณลักษณะที่ค่อนข้างจะคงที่ไม่ แปรเปลี่ยนโดยง่าย 2.2 วิธีใช้แบบทดสอบคู่ขนาน การหาความเชื่อถือได้โดยใช้วิธีแบบทดสอบคู่ขนาน เป็นการหาความสัมพันธ์ของ คะแนนจากการนาแบบทดสอบ 2 ฉบับที่เทียบเท่ากันไปสอบกับบุคคลกลุ่มเดียวกัน วิธีการนี้มีจุดอ่อนที่ความเป็นคู่ขนานกันของ แบบทดสอบ 2 ฉบับซึ่งสร้างได้ยาก 2.3 วิธหี าความสอดคล้องภายใน มีอยู่ด้วยกัน 3 วิธี 2.3.1 วิธีแบ่งครึ่งแบบทดสอบ การหาความเที่ยงโดยวิธีนี้ เป็นการหาความสัมพันธ์ของคะแนนจากการใช้ แบบทดสอบฉบับเดียว และสอบเพียงครั้งเดียว โดยนาผลการสอบมาแบ่งเป็นข้อมู ล 2 ชุด โดยอาจแบ่งเป็นข้อคู่ - ข้อคี่ แบ่งเป็นครึ่งฉบับแรก ครึ่งฉบับหลัง จากการหาค่าสัมประสิทธิ์สหสัมพันธ์จะได้ สัมประสิทธิ์ความเชื่อมั่นของแบบทดสอบครึ่ง ฉบับ แล้วจึงนาไปปรับขยายเป็นสัมประสิทธิ์สหสัมพันธ์ของแบบทดสอบทั้งฉบับ 2.3.2 วิธีหาจากสูตรของคูเดอร์และริชาร์ดสัน การหาความเที่ยงโดยวิธีนี้ เป็นการหาความสัมพันธ์ของคะแนนจาก การใช้แบบทดสอบฉบับเดียวและสอบเพียงครั้งเดียวโดยนาผลการสอบมาคานวณค่าสัมประสิทธิ์ ใช้สูตรของคูเดอร์และริชาร์ด สัน สูตรที่ใช้มี 2 สูตร คือ สูตร KR - 20 กับสูตร KR – 21 2.3.3 วิธีหาจากสูตรสัมประสิทธิ์ แอลฟาการหาค่าความเที่ยงโดยใช้สูตรของครอนบัค (Cronbach) นี้ปรับมา จากสูตร KR - 20 ใช้หาความเที่ยงของเครื่องมือวัดที่ให้คะแนนแตกต่างกันไปในแต่ละข้อได้ โดยไม่จาเป็นต้องเป็นระบบการ ให้คะแนน แบบ 1 กับ 0 เกณฑ์ในการเลือกข้อสอบ การเลือกข้อสอบที่มีคุณภาพนั้น พิจารณาจากสิ่งต่อไปนี้ 1. ดัชนีความยากง่าย (P) ควรมีค่าตั้งแต่ 0.20 ถึง 0.80 แบ่งเป็นรายละเอียดดังนี้ ดัชนีความยากง่าย (P) คุณภาพของข้อสอบ 0.00 – 0.10 ยากมาก 0.20 – 0.40 ค่อนข้างยาก 0.41 – 0.60 พอเหมาะ 0.61 – 0.80 ค่อนข้างยาก 0.81 – 1.00 ง่ายมาก ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

13

การวัดและ


2. ดัชนีอานาจจาแนก (R) ควรมีค่าตั้งแต่ 0.20 ขึ้นไป ซึ่งแบ่งเป็นรายละเอียดดังนี้ ดัชนีอานาจจาแนก (R) ความหมาย 1.00 จาแนกได้ดีเลิศ 0.80 – 0.99 จาแนกได้ดีมาก 0.60 – 0.79 จาแนกได้ดี 0.40 – 0.59 จาแนกได้ปานกลาง 0.20 – 0.39 จาแนกได้เล็กน้อย ต่ากว่า 0.19 จาแนกไม่ได้เลย การคานวณหาค่าดัชนีบ่งชี้คุณภาพของข้อสอบได้โดยวิธีต่าง ๆ ดังนี้ (จิรศักดิ์ สุทัศนะจินดา, ประภาพร ตั้ง ธนธานิช และ สุพรรณี ปูนอน, 2548) 1. คาตอบถูก (Answer) ความยากง่ายของข้อสอบ (P) เกณฑ์

RH + RL NH + NL

P= หรือ P=

0.20  P  0.80

PH (R) + PL (R) 2

หรือ

ทั้งนี้

อานาจจาแนกของข้อสอบ

เกณฑ์

r=

RH – RL NH or NL

+ 0.20  r

r=

PH(R) – PL(R) RH RL NH NL PH ( R )

ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

= = = = =

จานวนคนที่ตอบถูกในกลุ่มสูง จานวนคนที่ตอบถูกในกลุ่มต่า จานวนคนทั้งหมดในกลุ่มสูง จานวนคนทั้งหมดในกลุ่มต่า RH และ PL ( R ) = RL NL NH 14

การวัดและ


1.1.2 ตัวลวง (Distractor) สัดส่วนของผูเ้ ลือกตัวลวง Pw =

เกณฑ์

W H + WL Pw  0.05

NH + NL

หรือ Pw =

PH (w) + PL(w) 2

อานาจจาแนกของตัวลวง rw =

W L + WH NL or NH

rw =

PL(w) - PH (w )

เกณฑ์

rw  0.05

หรือ

เมื่อ WH WL NH NL PL(w)

= = = = =

จานวนคนในกลุ่มสูงที่เลือกตัวลวงนั้น จานวนคนในกลุ่มต่าที่เลือกตัวลวงนั้น จานวนคนทั้งหมดในกลุ่มสูง จานวนคนทั้งหมดในกลุ่มต่า WL และ PH(w) = WH WL

NL NH ในปัจจุบัน มีโปรแกรมคอมพิวเตอร์สาเร็จรูปช่วยวิเคราะห์ข้อสอบ ตามทฤษฎีการสอบแบบคลาสสิก และทฤษฎีการ ตอบข้อสอบ เช่น โปรแกรม EXCEL, BILOG, ITEM, IRT, และNHSIRI ซึ่งให้ความสะดวกต่อผู้ใช้เป็นอย่างมาก

5. การวัดและประเมินผลทักษะ การประเมินผลทักษะเกี่ยวข้องโดยตรงกับการปฏิบัติ เมื่อกล่าวถึงการวัดและประเมินผลทักษะ มักมุ่งเน้นไปสู่การปฏิบัติเดี่ยว เพื่อการวัดและประเมินผลความสามารถในการปฏิบัติรายบุคคล กระบวนการวัดและประเมินผล จึงต้องกระทาเป็นรายบุคคลย่อมต้องใช้ เวลาช่วงหนึ่งของการเรียนการสอน ดังนั้น ในการวางโครงการสอน ผู้สอนควรคานึงถึงระยะเวลาที่ใช้ในการประเมินผลทักษะไว้ ด้วย การวัดและประเมินผลทักษะ ควรมีการประเมินผลทักษะต่าง ๆ ครบทุกประเภทตามสาระวิชา การวัดผลและประเมินผลทักษะควรแบ่งคะแนนของการวัดผลออกเป็นสองส่วน คือ เรื่องเกี่ยวกับความสามารถในการ ปฏิบัติทักษะ (เชิงปริมาณ) และคุณภาพของการปฏิบัติ (เชิงคุณภาพ) ทั้งนี้เนื่องจาก ทักษะเป็นเรื่องของการปฏิบัติได้ และการ ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

15

การวัดและ


ปฏิบัติอย่างมีคุณภาพ ในการวัดผลทักษะจึงควรวัดทักษะทั้งเชิงปริมาณและเชิงคุณภาพ เชิงปริมาณ ได้แก่ ทักษะที่ผู้เรียนควร ปฏิบัติได้หลังจากเรียนรู้ไปแล้ว ส่วนเชิงคุณภาพ ได้แก่ ความมีคุณภาพ ความงดงาม ต่อไปนี้เป็นตารางแสดงการแบ่งน้าหนักคะแนนของการวัดผลทักษะดนตรีต่าง ๆ (ณรุทธ์ สุทธจิตต์, 2544) ตารางที่ 2 การกาหนดน้าหนักคะแนนการวัดผลทักษะดนตรี ทักษะ จังหวะ การฟัง (2) การร้อง (2) การเล่น (3) การอ่าน (3) การเคลื่อนไหว (3) การสร้างสรรค์ (การปฏิบัติ) (2) ตัวเลขในวงเล็บ คือ จานวนคะแนนเต็ม

เชิงปริมาณ ทานอง (2) (2) (3) (3) (3) (2)

เนือ้ ร้อง (2) (2)

(3)

ลีลา (2) (2) (2) (2) (2) (2)

เชิงคุณภาพ ความไพเราะ (2) (2) (2) (2) (2) (2)

จากตารางเห็นได้ว่า การวัดทักษะดนตรีในแต่ละประเภทย่อมมีเกณฑ์การวัดผลต่างกันออกไป กล่าวคือ การร้อง สามารถวัดจังหวะ ทานอง และเนื้อร้อง ในขณะที่การเล่นและการอ่าน ไม่มีเนื้อร้องเป็นเพียงเล่นหรืออ่านโน้ตดนตรี ส่วนการ เคลื่อนไหวไม่มีเนื้อร้อง และความไพเราะเปลี่ยนเป็นพิจารณาความสวยงามแทน และในเรื่องการสร้างสรรค์ คือ การประพันธ์เพลง ในทันที ซึ่งอาจประพันธ์ทั้งเพลงหรือบางส่วน การพิจารณาจึงสามารถดูค วามเหมาะสม โดยการใช้จังหวะ ทานอง และรูปแบบ การประพันธ์ รวมทั้ง ลีลา ความไพเราะที่ผู้ส อบแสดงการปฏิบัติใช้ฟัง นอกจากนี้ ในแต่ละระดับชั้น การวัดผลและประเมินผล แตกต่างกันด้วยการวัดผลทักษะนั้น ๆ เช่น การวัดผลการสร้างสรรค์ในระดับประถมศึกษา ควรแตกต่ างจากการวัดผลในระดับ มัธยมศึกษา เป็นต้น เกณฑ์การวัดผลจึงอยู่ในดุลพินิจของผู้สอนว่าต้องการวัดทักษะในเรื่องใด ซึ่งเกณฑ์ในการวัดผลควรจะ เป็นไปตามจุดมุ่งหมายการเรียนการสอน และอยู่ในขอบเขตของเนื้อเรื่องที่สอนตามหลักสูตรกาหนด นอกจากนี้ในการวัดและประเมินผลทักษะ ควรมีการกาหนดเกณฑ์การวัดและประเมินผลในเชิงปริมาณและคุณภาพอย่าง ชั ดเจน และมี การกาหนดเกณฑ์ การให้คะแนนไว้ ด้วย จากตารางตัวอย่ าง เกณฑ์การให้คะแนนในเรื่องการร้ องควรกล่ าวถึ ง รายละเอียดของเกณฑ์คะแนนเต็ม เพื่อผู้สอนสามารถให้คะแนนลดหลั่นไปได้ตามความสามารถในการร้องของผู้สอบ ดังตัวอย่าง ในตารางต่อไปนี้ ตารางที่ 3 การกาหนดเกณฑ์การวัดและประเมินผลทักษะดนตรี การร้อง เชิงปริมาณ เชิงคุณภาพ 1. จังหวะ ร้องได้ถูกต้อง มีความเหมาะสมกลมกลืน 2. ทานอง ร้อ งโน้ ตทุกตัวได้ถูกต้องตามระดับเสียงและ มีความไพเราะ วรรคตอน 3. 4. 5. 5.

เนื้อร้อง ลีลา การสื่อความรู้สึก ความไพเราะ

ร้องได้ชัดเจน หายใจได้ถูกต้อง แปลความหมายของเพลงได้สมบูรณ์แบบ แปลความรู้สึกได้ตามที่กาหนด สื่อความหมายของเพลงได้

สื่อความหมายได้ตามความรูส้ ึกของเพลง แสดงความรู้สึกได้ตามเนื้อหาของเพลง สื่อความรู้สึกได้ในอย่างซาบซึ้ง ถ่ายทอดสุนทรียรสของดนตรีได้

เกณฑ์การให้คะแนน เชิงปริมาณ แสดงออกหรือสื่อความหมายได้ในระดับน้อยที่สุด จนถึงมากที่สุด คิดเป็นระดับคะแนนได้ดังนี้ ณรุทธ์ สุทธจิตต์ 2557 16 การวัดและ ประเมิผล


ตารางที่ 4 การกาหนดเกณฑ์การวัดและประเมินผลทักษะดนตรีเชิงปริมาณเป็นระดับคะแนน 4.5 - 5.0 แสดงออกในระดับมากที่สุด ปฏิบัติได้ร้อยละ 90 ขึ้นไป 3.5 - 4.4 แสดงออกในระดับมาก ปฏิบัติได้ร้อยละ 80 - 89 2.5 - 3.4 แสดงออกในระดับปานกลาง ปฏิบัติได้ร้อยละ 70 - 79 1.5 - 2.4 แสดงออกในระดับพอใช้ ปฏิบัติได้ร้อยละ 60 - 69 0.5 - 1.4 แสดงออกในระดับน้อย ปฏิบัติได้ร้อยละ 50 - 59 0.0 - 0.4 แสดงออกในระดับน้อยที่สุด ปฏิบัติได้ร้อยละ 49 ลงมา เชิงคุณภาพ สื่อหรือแสดงความรู้สึกได้อย่างมีคุณภาพ มีความโดดเด่น ไพเราะ มีระดับน้อยที่สุด จนถึงมากที่สุด คิดเป็น ระดับคะแนนได้ดังนี้ ตารางที่ 5 การกาหนดเกณฑ์การวัดและประเมินผลทักษะดนตรีเชิงคุณภาพเป็นระดับคะแนน 4.5 - 5.0 สื่อหรือแสดงความรู้สึกในระดับมากที่สุด ปฏิบัติได้ร้อยละ 90 ขึ้นไป 3.5 - 4.4 สื่อหรือแสดงความรู้สึกในระดับมาก ปฏิบัติได้ร้อยละ 80 - 89 2.5 - 3.4 สื่อหรือแสดงความรู้สึกในระดับปานกลาง ปฏิบัติได้ร้อยละ 70 - 79 1.5 - 2.4 สื่อหรือแสดงความรู้สึกในระดับพอใช้ ปฏิบัติได้ร้อยละ 60 - 69 0.6 - 1.4 สื่อหรือแสดงความรู้สึกในระดับน้อย ปฏิบัติได้ร้อยละ 50 - 59 1.0 - 0.4 สื่อหรือแสดงความรู้สึกในระดับน้อยที่สุด ปฏิบัติได้ร้อยละ 49 ลงมา

6. การวัดและประเมินผลทัศนคติ การวัดและประเมินผลทัศนคติจัดเป็นการวัดและประเมินผลอีกลักษณะหนึ่งที่แตกต่างไปจากสองลักษณะที่กล่าวมา ทั้งนี้ เนื้อหาในการวัดและประเมินผลมิใช่เป็นสิ่งที่สามารถสอนกันได้ดังเช่นเนื้อหาหรือทักษะดนตรี ทัศนคติซึ่งเกี่ยวข้องกับรสนิยม ความชอบ ความมีสุนทรียะ และความซาบซึ้งเป็นเรื่องที่เกิดขึ้นภายในจิตใจอารมณ์ ความรู้สึก ซึ่งผู้เรียนอาจจะแสดงให้เห็น เป็นพฤติกรรมอย่างเด่นชัด หรือไม่แสดงออกเป็นพฤติกรรม ดังนั้น ในการวัดและประเมินผลทัศนคติดนตรี จึงควรหาวิธีการใน การวัดทัศนคติของผู้เรียนให้ได้อย่างแท้จริงเท่าที่จะทาได้ ในบางครั้งข้อมูลที่ได้มาอาจจะถูกต้อง แต่ก็มีโอกาสผิดพลาดได้ เพราะ ทัศนคติเป็นเรื่องที่ไม่จาเป็นต้องแสดงออกอย่างเด่นชัดดังกล่าวแล้ว ตัวอย่างเช่น ผู้เรียนคนหนึ่งที่ไม่ค่อยแสดงความสนใจในการเรียน สักเท่าไร แต่เวลาสอบปฏิบัตสิ ามารถทาได้ดี สอบภาคทฤษฎีไม่มีปัญหา ผู้เรียนคนนี้อาจจะมีทัศนคติที่ดีต่อสาระวิชา หรือการเรียนการ สอน แต่เนื่องจากมีความรู้มากแล้ว จึงไม่แสดงความสนใจในการเรียนหรือการปฏิบัติกิจกรรม หรืออาจจะเป็นได้ว่า ผู้เรียนไม่มี ทัศนคติที่ดีต่อสาระวิชา หรือการเรียนการสอน แต่ไม่ต้องการสอบตก ดังนั้น จึงเป็นการยากที่จะแปลความหมายพฤติกรรม ของผู้เ รีย นออกมาเป็น ทัศนคติ ในการวัด ทัศนคติจึง ควรวัด โดยใช้วิธีก ารหลาย ๆ ลัก ษณะ การประเมินผลทัศนคติควร กระทาเป็นรูปของการเสนอข้อมูลมากกว่าการให้เป็นคะแนน อย่างไรก็ตามเกณฑ์เหล่านี้ขึ้นอยู่กับผู้สอนจะเห็นสมควรเป็นสาคัญ วิธีการที่ใช้ประเมินทัศนคติดนตรี ควรเป็นวิธีการสังเกต สัมภาษณ์ เพื่อเปิดโอกาสให้ผู้เรียนได้แสดงทัศนคติที่ตนมีต่อดนตรี ออกมาเป็นพฤติกรรมที่สังเกตเห็นได้ และควรเป็นการประเมินผลที่กระทาสม่าเสมอเป็นลักษณะของการประเมินผลเชิงกระบวนการ ทั้งนี้เพื่อให้ได้ข้อมูลที่เชื่อถือได้ สาหรับการประเมินทัศนคติ สามาระกาหนดในรูปของการเสนอข้อมูล โดยทาเป็นตารางหรือใช้การเขียนบรรยายเพื่อให้ แสดงทัศนคติของผู้เรียน เช่น การเสนอเป็นตารางบันทึกทัศนคติต่อการปฏิบัติ ทักษะ การปฏิบัติตนในการเรียน ความสนใจ การ เข้าร่วมกิจกรรมต่าง ๆ โดยมีที่ว่างไว้ให้ผู้สอนเขียนบรรยายลักษณะของผู้เรียนในเชิงทัศนคติไว้ด้วย (ณรุทธ์ สุทธจิตต์, 2544) ดังตัวอย่างต่อไปนี้ ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

17

การวัดและ


ตารางที่ 6 ตารางบันทึกการประเมินผลทัศนคติดนตรี 5 4 3

ทัศคติดนตรี 1. ความตั้งใจเรียน 2. การเข้าร่วมกิจกรรม 3. การฟัง 4. การร้อง 5. การเล่น 6. การเคลื่อนไหว 7. การอ่าน 9. การสร้างสรรค์ 10. ความสนใจดนตรี 5 1 แสดงระดับทัศนคติที่ดีต่อดนตีจากระดับสูงสุดถึงต่าสุด

2

1

ข้อบรรยายเชิงทัศนคติดนตรีของผู้เรียน __________________________________________________

จากตัวอย่าง เห็นได้ว่า การสังเกต สัมภาษณ์ และการใช้วิธีการอื่น ๆ เป็นวิธีการเก็บข้อมูล และนาเสนอเป็นระดับทัศนคติของ ผู้เรียนจากระดับสูงสุด (5) จนถึงระดับต่าสุด (1) ซึ่งผู้สอนเป็นผู้ใช้การตัดสินใจซึ่งอาจจะอิงกลุ่มของผู้เรียน หรืออิงเกณฑ์ที่ผู้สอน ตั้งไว้ว่า อย่างไรจึงจัดว่ามีทัศนคติที่ดีอยู่ในระดับ 5 หรือ ระดับ 3 เช่น ในระดับ 5 ผู้เรียนควรแสดงความกระตือรือร้นที่จะเข้า ร่วมกิจกรรม มีความสนุกสนาน ตั้งใจปฏิบัติกิจกรรมต่าง ๆ เสมอ ทาการบ้ า นโดยตลอด การกาหนดหลั ก เกณฑ์ เ หล่ า นี้ ช่ ว ยให้ ก ารประเมิ น ผลทัศนคติ มีความเชื่อถือได้ และความเที่ยงตรงมากขึ้น ถ้า มีก ารตีค่า ทัศนคติเ ป็น คะแนน ผู้ส อนสามารถใช้ผ ลประเมิน ทัศนคติจ ากตารางนี้ตีอ อกมาเป็น คะแนนได้ กล่าวคือ ค่า 5 ตีเป็นคะแนน 10 – 9 ค่า 4 ตีเป็นคะแนน 8–7 ค่า 3 ตีเป็นคะแนน 6–5 ค่า 2 ตีเป็นคะแนน 4–3 ค่า 1 ตีเป็นคะแนน 2–1 ซึ่งผู้สอนสามารถจะนาเสนอทัศนคติดนตรีเป็นคะแนนรวมกับคะแนนของการวัด และประเมินผลทางด้านเนื้อหาและ ทักษะดนตรีต่อไปได้ถ้าต้องการ

7. การประเมินตามสภาพจริง (Authentic Assessment) การประเมินตามสภาพจริง หมายถึง การประเมินความสามารถที่แท้จริงของผู้เรียน จากผลงาน หรือกิจกรรมต่าง ๆ ในสภาพจริง เป็ น กระบวนการประเมิ น เชิ งคุณภาพอย่างต่อ เนื่ อ ง ทั้งในด้าน ความรู้ ความคิ ด ทักษะ และทัศนคติ การ ประเมินผลตามสภาพจริงมุ่งเน้นการประเมินตามพัฒนาการของผู้เรียนแต่ละคนเป็นสาคัญ ซึ่งแนวคิดการประเมินตามสภาพจริง ณรุทธ์ สุทธจิตต์ 2557 18 การวัดและ ประเมิผล


เกิดขึ้นและแพร่หลายในต่างประเทศมานานแล้ว แต่เริ่มเข้ามาเผยแพร่ในประเทศไทยเมื่อปี พุทธศักราช 2535 และเป็นที่สนใจ มากขึ้นในปัจจุบัน วิธีการประเมินการเรียนรู้ของผู้เรียนตามสภาพจริงสามารถจาแนกได้ 4 วิธี ได้แก่ 1. การสังเกต (Observation) เป็นการเก็บรวบรวมข้อมูลเพื่อการประเมินผลเกี่ยวกับ คุณลักษณะ พฤติกรรม การ ปฏิบัติงานหรือทากิจกรรมต่าง ๆ โดยใช้การสังเกตแบบไม่เป็นทางการ ซึ่งจะทาให้ได้ข้อมูลที่ตรงตามสภาพที่แท้จริงของผู้เรียน และสามารถติดตามความก้า วหน้าได้อ ย่างถูกต้อง เช่น การเข้า ชั้นเรียน การอภิปรายในชั้น เรียน การศึกษาค้ นคว้านอก ห้อ งเรียนและนาเสนอผล การทางานกลุ่ม วิธีการเหล่า นี้ทาให้ทราบถึงความรู้ ความสามารถ ทั กษะ ทัศนคติ คุ ณธรรม จริยธรรมของผู้เรียนได้เป็นอย่างดี โดยใช้การสังเกตอย่างต่อเนื่อง 2. การสัมภาษณ์ (Interview) เป็นการเก็บข้อมูลเพื่อการประเมินผลได้อย่างอย่างลึกซึ้ง นิยมใช้ร่วมกับการสังเกต นอกจากนี้การสัมภาษณ์ยังช่ วยให้การเชื่ อมโยงกิจกรรมที่เกี่ยวข้องกั บการเรียนรู้และความเข้าใจของผู้เรียนง่า ยขึ้น ด้วย สถานการณ์ในการสัมภาษณ์ควรเป็นไปโดยไม่กดดัน ไม่เป็น การสอบสัมภาษณ์ เพื่อให้ผู้เรียนให้ข้อมูลที่เป็นความจริง 3. การปฏิบัติงาน (Performance) เป็นการเก็บข้อมูลเพื่อประเมินผลในสภาพการปฏิบัติงานจริงในด้านทักษะและ ความสามารถในการนาความรู้ไปประยุกต์ใช้ ตลอดจนการแก้ปัญหาต่าง ๆ ของผู้เรียน ทั้งในและนอกห้องเรียน เช่น การ ทางานกลุ่ม การทางานเดี่ยวในชั้นเรียน สถานการณ์จาลองที่ใกล้เคียงสภาพจริง การดาเนินโครงการในสถานการณ์จริง 4. แฟ้มสะสมงาน (Portfolio) แฟ้มสะสมผลงาน คือ สิ่ งที่ใช้บรรจุหลักฐาน หรือ ผลงานที่แสดงถึงผลสัมฤทธิ์ ทางการเรียน ความสามารถ เจตคติ ทักษะ การเก็บข้อมูลตามสภาพจริงจากแฟ้มสะสมผลงาน เป็นการประเมิน ผลโดย พิจารณาจากแฟ้มสะสมผลงาน ซึ่งสะท้อนผลสัมฤทธิ์ ทักษะ พัฒนาการ และความก้าวหน้าของผู้เรียน อันเป็นผลจากการ เรียนรูท้ ี่เกิดในสภาพจริง ในช่วงระยะเวลาหนึ่ง ทาให้เห็นพัฒนาการการเรียนรู้ของผู้เรียนได้เด่นชัด ในการประเมินตามสภาพจริงผู้สอนต้องให้ผู้เรียนเข้ามามีส่วนร่วมในการพัฒนาหรือกาหนดเกณฑ์การให้คะแนน (Scoring Rubric) สาหรับใช้ในการประเมินวิธีการต่าง ๆ (กมลวรรณ ตังธนกานนท์, 2549) การประเมินตามสภาพจริง เป็น กระบวนการที่สามารถนาไปประยุกต์ใช้กับการเรียนการสอนดนตรีได้อย่างเหมาะสม โดยเฉพาะการประเมินด้านทักษะดนตรี เนื่องจากผู้เรียนแต่ละคนมีพัฒนาการด้านทักษะดนตรีไม่เท่ากัน ดังนั้น การประเมินแบบอิงเกณฑ์ หรือ อิงกลุ่ม อาจไม่สามารถ ประเมินความรู้ ทักษะ และพัฒนาการของผู้เรียนแต่ละคนได้อย่างแท้จริง ดังนั้น ผู้สอนควรใช้การประเมินตามสภาพจริงควบคู่ กับการประเมินแบบปกติ ทาให้กระบวนการวัดและเมินผลการเรียนการสอนดนตรีมีประสิทธิภาพ และเกิดประโยชน์แก่ทั้งผู้เรียน และผู้สอนมากที่สุด

8. เกณฑ์การประเมินผล ที่กล่าวมาทั้งหมดเป็นเรื่องเกี่ยวกับการวัด และประเมิน ผล เพื่อให้ได้คะแนนมาประกอบการประเมินผลการเรียน การสอนดนตรี เกี่ยวกับเกณฑ์การประเมินผล ได้กล่าวไปบ้างในเรื่องของการประเมินผลทัศนคติดนตรี และในตอนต้นในหัวข้อ ความหมายและหลักของการวัดและการประเมิน ต่อไปนี้จะกล่าวถึงเกณฑ์การประเมินผลโดยเฉพาะ หลังจากได้คะแนนจากการวัดผลทางด้านต่าง ๆ มาแล้ว ได้แก่ ด้านเนื้อหา ทักษะและทัศนคติ จะมาถึงขั้นตอน ของการประเมินผลตีค่ าของคะแนนออกมาในลักษณะของการตัดสินค่าว่า คือ ระดับผลสัม ฤทธิ์ทางการเรียนผู้เรียนแต่ละคน โดยปกติการประเมินผลมักนาเสนอในรูปของเกรด A, B, C, D และ F ซึ่งเกณฑ์ของการตัดสินคะแนนมากน้อยเท่าไหร่ ควรจะได้เกรดอะไรนั้น ขึ้นอยู่กับเกณฑ์ในสองลักษณะ คือ การตัดสินประเมินผลอิงเกณฑ์ และการตัดสินประเมินผลอิงกลุ่ม 1. การตัดสินประเมินผลอิงเกณฑ์ คือ เกณฑ์การประเมินผลที่ผู้สอนได้วางหลักเกณฑ์หรือระดับคะแนนเท่าใดจะได้เกรดอะไร ไว้เรียบร้อยแล้ว โดยกาหนดหลักเกณฑ์ตายตัวไว้ เช่น ต้องได้คะแนน 80 ขึ้นไปถึงได้ A เป็นต้น การใช้เกณฑ์แบบนี้ในบางครั้ง อาจจะไม่มีผู้ใดได้ A เลย เพราะไม่มีผู้ใดทาคะแนนถึง 80 คะแนน 2. การตัดสินประเมินผลอิงกลุ่ม คือ เกณฑ์การประเมินผลที่ผู้สอนใช้กลุ่มผู้เรียนเป็นเกณฑ์ ซึ่งอาจใช้ค่าทางสถิติเข้า มาช่วยในการหาอันดับคะแนนที่จะแบ่งเป็นเกรด A, B, C, D และ F และอาจจะมีการปรับระดับคะแนนได้เล็กน้อย หลังจากดู คะแนนทั้งหมด การประเมินผลเช่นนี้ ในการประเมินผลทุกครั้งจะมีผู้ใด้คะแนน A แน่นอน เพราะช่วงคะแนนสูงสุดซึ่งประเมินค่ามา เป็นเกรดจะต้องเป็นเกรด A ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

19

การวัดและ


นอกจากนี้เ กณฑ์ก ารประเมิน ผลอาจจะใช้ส องเกณฑ์ค วบคู่กัน ไปได้ใ นบางโอกาส ตามที่ผู้สอนเห็นว่าสมควร และยุติธรรมกับการประเมินผลในครั้งนั้น ๆ ข้อสาคัญ คือ ผู้สอนควรวางเกณฑ์ การประเมินผลไปก่อนที่จะมีการประเมิน ผล ทั้งนี้เพื่อความยุติธรรมของผู้เรียนไม่ควรกาหนดเกณฑ์ หลังจากการทดสอบ ควรกล่าวไว้ ณ ที่นี้ ด้วยว่า การประเมินค่าจะเกิดขั้นในระหว่างการวัดผลได้เสมอ เช่น ในการให้คะแนนการร้องเพลง ผู้สอนย่อมมีเกณฑ์อยู่แล้วว่า จะให้คะแนนตามเกณฑ์ที่กาหนด สิ่งนี้จัดเป็นเกณฑ์การประเมินผลเช่นกัน ซึ่งมีอยู่ในกระบวนการวัด และประเมินผล ดังนั้น สิ่งที่ควรคานึงถึงในการประเมินผล คือ เกณฑ์การประเมินผลควรมีการกาหนดไว้แน่นอนก่อนการวัดผล หรือการให้คะแนน เพื่อให้การวัดและประเมินผลที่ยุติธรรมสาหรับผู้เรียนทุกคน

9. สรุป การวัดและการประเมินผล เป็น กระบวนการสาคัญของการเรียนการสอน ในการวัดและการประเมินผล ผู้สอนควร วางแผนให้เหมาะสมกับกิจกรรมการเรียนการสอน เพื่อให้ได้ผลตามวัตถุประสงค์ของการเรียนการสอน การวัดและประเมินผลที่ ดี คือ การวัดและการประเมินผลที่สามารถให้ข้อมูลหรือผลของการเรียนการสอนได้อย่างแม่นตรง เพื่อให้เกิดผลดังกล่าว ควรมี การใช้วิธีการวัดและประเมินผลที่หลากหลาย ทั้งการสอนในลักษณะต่าง ๆ การประเมินผลตามสภาพจริง ซึ่งการประเมินผลแต่ ละลักษณะเหมาะสมกับวัตถุประสงค์ และการเรียนการสอนในแต่ละมิติ ดังเช่น มาตรฐานผลการเรียนรู้ที่กาหนดใน มคอ. แต่ ละด้าน ควรมีการกาหนดการวัดและประเมินผลให้เหมาะสม เพื่อได้ผลที่ถูกต้อง ชัดเจน และเป็นจริง ผู้สอนจึงควรมีความรู้ ความเข้าใจในการกาหนดการวัดและประเมินผล สาหรับการเรียนการสอนแต่ละรายวิชาอย่างเหมาะสม ต่อไปนี้เป็นตัวอย่าง การกาหนดการวัดและการประเมินผลตามมาตรฐานผลการเรียนรู้ ตารางที่ 5 มาตรฐานผลการเรียนรู้และการวัดและการประเมินผล มาตรฐานผลการเรียนรู้ระดับปริญญาตรี การวัดและการประเมินผล ด้านคุณธรรม จริยธรรม (Ethics and Moral) การประเมินตามสภาพจริง (Authentic Assessment) - การสังเกต - การสัมภาษณ์ - การบันทึกการเรียนรู้ - แฟ้มสะสมผลงาน - การปฏิบัติงาน - การทาโครงงาน ด้านความรู้ (Knowledge) การสอบ (Examination) - ข้อสอบบบปรนัย - ข้อสอบแบบอัตนัย - ข้อสอบแบบการบ้าน การประเมินตามสภาพจริง (Authentic Assessment) - การบันทึกการเรียนรู้ - แฟ้มสะสมผลงาน ด้านทักษะทางปัญญา (Cognitive Skills) การประเมินตามสภาพจริง (Authentic Assessment) - การสังเกต - การสัมภาษณ์ - การบันทึกการเรียนรู้ - แฟ้มสะสมผลงาน - การปฏิบัติงาน - การทาโครงงาน ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

20

การวัดและ


ด้านทักษะความสัมพันธ์ระหว่างบุคคลและ ความรับผิดชอบ (Interpersonal Skill and Responsibility)

ด้านทักษะการคิดวิเคราะห์เชิงตัวเลข การสือ่ สารและการใช้เทคโนโลยีสารสนเทศ(Numerical Analysis, Communication and information Technology Skills)

การสอบ (Examination) - ข้อสอบบบปรนัย - ข้อสอบแบบอัตนัย - ข้อสอบแบบการบ้าน การประเมินตามสภาพจริง (Authentic Assessment) - การสังเกต - การสัมภาษณ์ - การบันทึกการเรียนรู้ - แฟ้มสะสมผลงาน - การปฏิบัติงาน - การทาโครงงาน การประเมินตามสภาพจริง (Authentic Assessment) - การสังเกต - การสัมภาษณ์ - การบันทึกการเรียนรู้ - แฟ้มสะสมผลงาน - การปฏิบัติงาน - การทาโครงงาน การสอบ (Examination) - ข้อสอบบบปรนัย - ข้อสอบแบบอัตนัย - ข้อสอบแบบการบ้าน

อ้างอิง

กมลวรรณ ตังธนกานนท์. 2549. “การประเมินตามสภาพจริง.” วารสารครุศาสตร์. ปีที่ 34 (3) (มกราคม-มีนาคม): หน้า 1-13. จิรศักดิ์ สุทัศนะจินดา, ประภาพร ตั้งธนธานิช และ สุพรรณี ปูนอน. 2548. การจัดทาข้อสอบวัดความรู้พื้นฐาน วิชาชีพสัตว

แพทย์และการวิเคราะห์ข้อสอบสาหรับนักศึกษาคณะสัตวแพทยศาสตร์ชั้นปีที่ 6 ที่จะสาเร็จการศึกษาใน เดือน มีนาคม 2548. รายงานวิจัย คณะสัตวแพทยศาสตร์ มหาวิทยาลัยขอนแก่น. ณรุทธ์ สุทธจิตต์. 2544. พฤติกรรมการสอนดนตรี. กรุงเทพมหานคร: สานักพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย. วรรณดี แสงประทีป. “การวิเคราะห์ข้อสอบ.” www.caacentre.ac.uk/dldocs/BP2final.pdf (14 มีนาคม 2556). Lefrancois, Guy R. 2000. Psychology of Teaching. Belmont, CA: Wadsworth/Thomson Learning. ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

21

การวัดและ


McAlpine, Mhairi. 2002. A Summary of Methods of Items Analysis. Glasgow: Robert Clark Centre for Technological Education, University of Glasgow Massey. A. J. 1995. Evaluation and Analysis of Examination Data: Some Guidelines for Reporting and Interpretation. Cambridge: UCLES Internal Report. Scriven, M. 1991. Evaluation thesaurus. 4th ed. Newbury Park, CA: Sage Publications.

ณรุทธ์ สุทธจิตต์ 2557 ประเมิผล

22

การวัดและ


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.