การวัดผลเเละการประเมิณผล
การวัดผล (Measurement / Assessment) และการประเมินผล (Evaluation) เป็นองค์ประกอบหนึ่ง ของไตรยางค์ การศึกษา (Educational Trilogy) ซึ่งประกอบด้วย 3 องค์ประกอบ คือ วัตถุประสงค์การศึกษา (Educational Objectives) การจัดประสบการณ์การเรียนรู้ (Learning Experiences) และ การวัดผลการประเมินผล (Evaluation) และรู้จักกันโดย ทั่วไปว่า OLE (O = Objectives; L = Learning experiences; E = Evaluation) ทั้ง 3 องค์ประกอบนี้ มีความเกี่ยวข้องสัมพันธ์กันดังแผนภูมิต่อไปนี้
หากผลการประเมินไม่เป็นไปตามคาดหมาย ผู้สอนคงต้องพิจารณาดูว่าปัจจัยใดใน OLE ที่ส่งผลให้ผู้เรียน ไม่สามารถเรียนรู้จนบรรลุ วัตถุประสงค ์ เป็นไปได้หรือไม่ว่า…การเขียนหรือการกำหนดวัตถุประสงค์ไม่ชัดเจน ส่งผลให้ เลือกวิธีการสอนที่ไม่เหมาะสม หรืออาจเกิดจาก วัตถุประสงค์ชัดเจนแต่เลือกวิธีการสอนที่ไม่สอดคล้องไม่เอื้อให้เกิดการ เรียนรู้ตามวัตถุประสงค์นั้น หรืออาจเกิดจากการเลือกเครื่องมือวัดผลที่ ไม่เหมาะสม ดังนั้นจะเห็นว่าทั้ง 3 องค์ประกอบ ในไตรยางค์การศึกษามีส่วนเกี่ยวข้องกันอย่างแยกไม่ออก แต่ในเอกสารนี้จะขอนำเสนอ รายละเอียดเฉพาะในส่วนของการวัดผล และการประเมินผลเท่านั้น โดยอยู่บนสมมติฐานว่าวัตถุประสงค ์การศึกษาและการจัดประสบการณ์ การเรียนรู้เหมาะสมดีแล้ว
ทุกครั้งที่จะทำการวัดผลและประเมินผล ซึ่งมักเรียกทั่ว ๆ ไปว่า "ทำการสอบ" เราในฐานะผู้สอนคงจะต้องตอบคำถามต่อไปนี้ เป็นอย่างน้อยเพื่อที่จะทำให้การจัดสอบนั้น ๆ เหมาะสมและยุติธรรมแก่ผู้ถูกสอบหรือผู้เรียน ในเรื่องการสอบ "ความยุติธรรม" เป็นสิ่งที่ผู้สอนพึงตระหนักอยู่เสมอ ก่อนอื่นขอทำความเข้าใจเกี่ยวกับ คำ (Term) ในเรื่องการวัดผล การประเมินผล 2 คำ ดังนี้คือ การวัดผล หรือ การวัด หรือ Measurement หรือ Assessment มีความหมายว่า การจัดหาข้อมูล หรือ จัดหาคะแนนจากหลากหลายวิธี ส่วนการประเมินผล คือ การนำผลที่วัดได้มาตัดสินว่ามีคุณค่าอย่างไร เช่น ในการสอบครั้งหนึ่ง นักศึกษา ก. สอบได้คะแนน 70 % ค่าคะแนน 70 % คือค่าคะแนนที่วัดได้ = Assessment จากนั้นผู้สอนจึงพิจารณาอีกครั้งว่าค่าคะแนน 70 % นี้อยู่ในเกณฑ์ดีมาก หรือ ดี หรือ พอใช้ เราเรียกการตัดสินคุณค่า ของสิ่งที่วัดได้ว่าการประเมินผล = Evaluation เพราะฉะนั้นความสัมพันธ์ระหว่าง Assessment และ Evaluation เป็นดังนี้
Measurement = Assessment = การวัดผล
Evaluation = Measurement (Assessment) + Judgment
อย่างไรก็ตาม คำ 2 คำนี้ในบางครั้งก็สามารถใช้แทนกันได้ แต่สิ่งที่ผู้สอนต้องคำนึงถึงคือ"การวัดผลที่ดี มีโอกาสนำไปสู่การประเมินผลที่ถูกต้อง"
ทุกครั้งที่จะทำการวัดผลและประเมินผล ซึ่งมักเรียกทั่ว ๆ ไปว่า "ทำการสอบ" เราในฐานะผู้สอนคงจะต้องตอบคำถามต่อไปนี้ เป็นอย่างน้อยเพื่อที่จะทำให้การจัดสอบนั้น ๆ เหมาะสมและยุติธรรมแก่ผู้ถูกสอบหรือผู้เรียน ในเรื่องการสอบ "ความยุติธรรม" เป็นสิ่งที่ผู้สอนพึงตระหนักอยู่เสมอ ก่อนอื่นขอทำความเข้าใจเกี่ยวกับ คำ (Term) ในเรื่องการวัดผล การประเมินผล 2 คำ ดังนี้คือ การวัดผล หรือ การวัด หรือ Measurement หรือ Assessment มีความหมายว่า การจัดหาข้อมูล หรือ จัดหาคะแนนจากหลากหลายวิธี ส่วนการประเมินผล คือ การนำผลที่วัดได้มาตัดสินว่ามีคุณค่าอย่างไร เช่น ในการสอบครั้งหนึ่ง นักศึกษา ก. สอบได้คะแนน 70 % ค่าคะแนน 70 % คือค่าคะแนนที่วัดได้ = Assessment จากนั้นผู้สอนจึงพิจารณาอีกครั้งว่าค่าคะแนน 70 % นี้อยู่ในเกณฑ์ดีมาก หรือ ดี หรือ พอใช้ เราเรียกการตัดสินคุณค่า ของสิ่งที่วัดได้ว่าการประเมินผล = Evaluation เพราะฉะนั้นความสัมพันธ์ระหว่าง Assessment และ Evaluation เป็นดังนี้
Measurement = Assessment = การวัดผล
Evaluation = Measurement (Assessment) + Judgment
อย่างไรก็ตาม คำ 2 คำนี้ในบางครั้งก็สามารถใช้แทนกันได้ แต่สิ่งที่ผู้สอนต้องคำนึงถึงคือ"การวัดผลที่ดี มีโอกาสนำไปสู่การประเมินผลที่ถูกต้อง"
ก่อนทำการสอบนักศึกษาทุกครั้ง ผู้สอนควรตอบคำถามอย่างน้อย 5 ข้อนี้ คือ
Why ? = ทำไมต้องสอบ ?
What ? = สอบอะไร ?
When ? = สอบเมื่อไหร่ ?
Who ? = สอบใคร ?
How ? = ใช้เครื่องมืออะไร ?
1. ทำไมต้องสอบ ? | |
เหตุผลที่ต้องทำการสอบผู้เรียน คือ | |
- ต้องการทราบว่าผู้เรียนได้เกิดการเรียนรู้ตามวัตถุประสงค์หรือไม่ - สามารถใช้ผลการสอบเป็นข้อมูลย้อนกลับ (feedback) แก่ผู้สอน เพื่อนำไปปรับปรุงกระบวนการการจัดการเรียนการสอน - สามารถใช้ผลการสอบเป็นข้อมูลย้อนกลับแก่ผู้เรียน เพื่อนำไปปรับปรุงวิธีการเรียนและเพื่อทราบความก้าวหน้าในการเรียนรู้ ของตนเอง รู้จุดอ่อน-จุดแข็ง - ใช้เป็นแรงจูงใจให้ผู้เรียนทำการศึกษา/เรียน (Motivate students to study) - ใช้จัดกลุ่มผู้เรียน (Placement evaluation) - ใช้ตัดสินผลการเรียนของผู้เรียน (ได้-ตก ; A / B / C /….) - ใช้เป็นกลไกหนึ่งในการประกันคุณภาพของผู้เรียนต่อสังคม | |
ผู้สอนคงต้องตอบตัวเองว่า การจัดสอบของเราในแต่ละครั้งหวังผลในข้อใดข้างต้น ซึ่งจะเป็นตัวกำหนดถึงเนื้อหา เวลา เครื่องมือ ที่จะใช้ในการสอบได้อย่างเหมาะสม |
2. สอบอะไร ?
สิ่งที่จะทำการสอบนักศึกษาคือวัตถุประสงค์ของรายวิชานั้น ๆ ซึ่งได้กล่าวไปบ้างแล้วในข้างต้นว่า วัตถุประสงค์ทางการศึกษา สามารถจำแนกเป็น 3 หมวดหมู่ (Domain) คือ
ความรู้ = Cognitive Domain = Knowledge
ทักษะ = Psychomotor Domain = Skill
ทัศนคติ = Affective Domain = Attitude
ผู้สอนคงต้องกำหนดให้ชัดเจนว่าต้องการวัด Domain ใด จึงจะสามารถเลือกใช้เครื่องมือวัดที่เหมาะสมได้ ส่งผลให้ผลการวัดน่าเชื่อถือและยุติธรรมต่อผู้เรียน ตัวอย่างเช่น ต้องการทดสอบว่าผู้เรียนว่ายน้ำเป็นหรือไม่ ซึ่งเป็น ความสามารถทางทักษะ หากใช้เครื่องมือวัดเป็นการสอบข้อเขียน (paper-pencil exam) ก็คงไม่สามารถสะท้อน ความเป็นจริงที่ว่าผู้ที่ตอบข้อสอบได้คะแนนดี สามารถว่ายน้ำได้จริงหรือไม่ ดังนั้นการวัดผลควรคำนึงถึงการเลือกใช้ เครื่องมือที่สอดคล้องกับสิ่งที่ต้องการวัดเพื่อให้การวัดผลการประเมินผลนั้นเป็นการวัดผลการประเมินผลตามสภาพ
ความเป็นจริง (Authentic Assessment)
3. สอบเมื่อไหร่ ?
สืบเนื่องจากเราสามารถนำผลการสอบมาใช้เป็นข้อมูลย้อนกลับแก่ผู้เรียนให้รู้ถึงความก้าวหน้าในการเรียนและ
ใช้ปรับปรุงวิธีการเรียน (feedback to improve) เราเรียกการสอบเพื่อวัตถุประสงค์นี้ว่า Formative Evaluation / Diagnostic Evaluation ส่วนการสอบที่หวังผลในการตัดสิน ได้-ตก หรือ การให้ค่าคะแนน (Grading) ซึ่งจัดเป็น final grade of record เราเรียกการสอบแบบหลังนี้ว่า Summative Evaluation / Certifying Evaluation เมื่อทราบถึง
วัตถุประสงค์ของการสอบ 2 ชนิดข้างต้นนี้ ก็สามารถช่วยให้ผู้สอนตัดสินใจว่าจะจัดสอบในช่วงใด รวมทั้งหากต้องการสอบ
เพื่อจัดกลุ่มผู้เรียน (Placement Evaluation) ผู้สอนก็คงต้องคำนึงถึงช่วงเวลาการจัดสอบเช่นกัน
หากคำนึงถึงช่วงเวลาที่ใช้จัดสอบ คงพอจะแบ่งเป็นช่วงเวลาหยาบ ๆ ดังนี้คือ
ก่อนเริ่มกระบวนการเรียนการสอนในรายวิชา (Beginning of course)
ในระหว่างที่รายวิชาดำเนินอยู่ (In course)
และ เมื่อสิ้นสุดรายวิชา (End of course)
ดังนั้น หากเราต้องการจัดสอบเพื่อ Formative Evaluation คงต้องจัดสอบในระหว่างรายวิชายังดำเนินอยู่ หากจัดสอบเมื่อสิ้นสุดรายวิชาแล้วคงไม่มีประโยชน์ เป็นต้น
4. สอบใคร ? กลุ่มผู้เรียนที่ถูกสอบ เป็นผู้เรียนชั้นใด กลุ่มใด ทั้งนี้เพื่อให้ผู้สอนได้คำนึงถึงความยากง่าย และความลึกซึ้งของวัตถุประสงค์ที่ทำการสอบว่าเหมาะสมหรือไม่อย่างไร ทั้งนี้เพื่อให้เกิดความยุติธรรมต่อผู้เรียน
5. ใช้เครื่องมืออะไร ? โดยทั่วไป เครื่องมือที่ใช้ในการสอบก็คือสิ่งที่เราเรียกโดยทั่วไปว่า ข้อสอบ (Test format) ซึ่งมีหลายชนิด ไม่ว่าจะเป็นชนิดใดก็ตาม เครื่องมือ/ข้อสอบ ที่ดี ต้องมีคุณสมบัติดังต่อไปนี้
1. มีความเที่ยงตรง (Validity) ซึ่งแบ่งออกเป็น 4 ชนิด คือ
- Constructive Validity ความเที่ยงตรงในการสร้างข้อสอบให้สามารถวัดพฤติกรรมการเรียนรู้
ของผู้เรียนได้ บางครั้งเรียกว่า ความเที่ยงตรงตามทฤษฎี
Construct Validity ของเครื่องมือชนิดต่างๆ
Triple jump
|
MEQ
|
Direct observation
|
MCQ
|
OSCE
| |
Knowledge |
+
|
++
|
+++
|
+
| |
Problem solving |
+++
|
++
|
+
|
+
|
+
|
Interpersonal skill |
+++
|
+
| |||
Technical skil |
++
| ||||
Attitudes |
+
|
+
|
+++
|
- Content Validity ความเที่ยงตรงตามเนื้อหา หมายถึงมีการสุ่มเนื้อหาที่ออกสอบได้เหมาะสม จนสามารถ เป็นตัวแทนของรายวิชานั้น ๆ (adequate sampling of content) เราสามารถใช้ตารางเนื้อหา (Table of specification) ช่วย ในการให้ได้มาซึ่งข้อสอบที่มี content validity โดยทั่วไปมีข้อแนะนำว่า ในชุดข้อสอบใด ๆ ควรประกอบด้วยเนื้อหาที่
ต้องรู้ = 60-85 %
ควรรู้ = 10-35 %
น่ารู้ = 5-10 %
- Concurrent Validity ความเที่ยงตรงตามสถานการณ์ เช่น ข้อสอบนี้วัดหลักการการใช้เครื่องมือ A ดังนั้นหากนักศึกษาที่ได้คะแนนสูง ควรใช้เครื่องมือ A เป็น และในทางกลับกัน นักศึกษาที่ได้คะแนนต่ำ ควรใช้เครื่องมือ A ไม่เป็น หรือ ไม่ถูกต้อง
- Predictive Validity ความเที่ยงตรงในการคาดเดา เช่น หากข้อสอบชุดนี้มี predictive validity ดี หมายความว่า นักศึกษาที่สอบได้คะแนนสูง คงไม่มีปัญหาในการเรียน และนักศึกษาที่ได้คะแนนต่ำ คงมีปัญหาในการเรียน เป็นต้น
2. มีความเป็นปรนัย (Objectivity) หมายถึง ผลของการสอบชุดข้อสอบนั้น ๆ สะท้อนถึงความสามารถของผู้เรียน อย่างแท้จริง ไม่ได้มีอิทธิพลของผู้สอนเข้ามาเกี่ยวข้อง อิทธิพลอันเนื่องมาจากผู้สอนเรียกว่า Subjectivity ข้อสอบที่ดีควรมี Objectivity สูง ๆ และมี Subjectivity ต่ำ ๆ
ความเป็นปรนัย ได้แก่
- ความเป็นปรนัยในการถาม หรือ ความชัดเจนในการถาม คือ อ่านแล้วเข้าใจตรงกัน ไม่ต้องการ การตีความ เพิ่มเติม
- ความเป็นปรนัยในการให้คะแนน หรือ ความชัดเจนในการให้คะแนน หมายถึง ตรวจแล้วให้คะแนนตรงกัน ไม่ว่าผู้ตรวจจะเป็นใคร เท่ากับเป็นการสะท้อนผลการกระทำของผู้เรียนเท่านั้น ตัวอย่างชนิดของข้อสอบที่มีความเป็น ปรนัยสูงในการให้คะแนน คือ ข้อสอบแบบเลือกตอบ (Multiple Choice Question : MCQ) ส่วนข้อสอบที่มี ความเป็น ปรนัยต่ำในการให้คะแนน ได้แก่ ข้อสอบแบบบรรยาย (Essay) เป็นต้น
ความเป็นปรนัย (Objectivity) และความเป็นอัตนัย (Subjectivity) เป็นคุณสมบัติของข้อสอบ ไม่ใช่รูปแบบ ข้อสอบแบบเลือกตอบ(MCQ) หากไม่ระมัดระวังในการออก ก็อาจกลายเป็นข้อสอบที่ไม่มีความเป็นปรนัยก็ได้ และ ในทางตรงกันข้าม ข้อสอบแบบบรรยาย(Essay) หากระมัดระวังในการออกโดยใช้คำพูดที่ชัดเจน จำเพาะเจาะจง ก็อาจเป็นข้อสอบที่มีความเป็นปรนัยได้เช่นกัน ความเป็น "ปรนัย/อัตนัย" อาจทำให้ผู้สอนมีความเข้าใจคลาดเคลื่อน เนื่องจากเราได้มีการกำหนดเรียกข้อสอบชนิดเลือกตอบ(MCQ) ว่าข้อสอบปรนัย และเรียกข้อสอบแบบ บรรยาย(Essay) ว่าข้อสอบอัตนัย โดยนำคำเหล่านั้นผูกเข้ากับรูปแบบ (test format) ทั้ง ๆ ที่ในความเป็นจริงเป็น คุณสมบัติ ของข้อสอบ
3. มีความเชื่อถือได้ (Reliability) หมายความว่า หากนำข้อสอบชุดเดิมมาทำการสอบ 2 ครั้ง แล้วให้ผลเหมือนเดิม ซึ่งเป็นการยากที่จะทำการทดสอบชุดข้อสอบใด ๆ 2 ครั้งโดยผู้สอบกลุ่มเดิมในช่วงเวลาห่างกันพอสมควร (1-2 สัปดาห์) โดยผู้สอบไม่รู้ล่วงหน้า ทั้งนี้ปัจจัยต่าง ๆเกี่ยวกับผู้สอบจะต้องเหมือนเดิมทุกอย่าง การทดสอบความเชื่อถือ/เชื่อมั่นของ ข้อสอบแบบนี้เรียกว่าการทำ Test-Retest ดังนั้น นักการศึกษาจึงได้คิดวิธีสะท้อนค่าความเชื่อถือของชุดข้อสอบ โดยใช้ค่าสถิติในการหาค่า Reliability โดยไม่ต้องให้ผู้สอบสอบ 2 ครั้ง เรียกค่าความเชื่อมั่นดังกล่าวว่า ค่าคงที่ภายใน (Internal consistency) ใช้สัญลักษณ์ว่า rtt
rtt = ค่าความเชื่อมั่นของข้อสอบ X = Mean S = Standard deviation K = จำนวนข้อสอบ ค่า rtt ที่เป็นที่ยอมรับคือ > 0.6 |
4. มีความยากง่ายพอเหมาะ (Difficulty index) โดยมีข้อแนะนำว่าในแต่ละชุดข้อสอบควรมีข้อสอบที่มี ค่าความยากง่ายปากกลาง = 50 % ; ยาก = 25% ; และ ง่าย = 25%
5. มีค่าอำนาจจำแนกดี (Discrimination power) หมายถึง สามารถจำแนกคนเก่ง - อ่อน ออกจากกันได้ ข้อสอบชนิดเลือกตอบแบบคำตอบเดียวถูก ( MCQ : One-Best Response) สามารถนำมาหาค่าทางสถิติ ที่แสดงถึงความยากง่ายและค่าอำนาจจำแนกได้ ในขณะที่ข้อสอบรูปแบบอื่นยังมีข้อจำกัดในการหาค่าทั้งสองดังกล่าว รายละเอียดเกี่ยวกับการหาค่ายากง่ายของข้อสอบและค่าอำนาจจำแนก ผู้สนใจสามารถศึกษาได้ในหัวข้อการวิเคราะห์
ข้อสอบ (Item analysis) ในหนังสือเกี่ยวกับการวัดผลการศึกษาโดยทั่วไป
6. สร้างง่าย ใช้ง่าย ใช้สดวก คุ้มค่า (Feasibility, Practicability, Usability)
ชนิดของข้อสอบ (Test format)
แบ่งเป็น 2 จำพวกใหญ่คือ Limited Choice Item (question) และ Open-ended Item (question)
Limited Choice Item ได้แก่ Multiple choice question, True/False question, Matching Column เป็นต้น
Open-ended Item ได้แก่ Sentence completion, Short answer question (SAQ), Modified essay question
(MEQ), และ Essay เป็นต้น
ข้อสอบสองจำพวกนี้มีข้อดี-ข้อเสียแตกต่างกันดังต่อไปนี้
Open-ended Item
|
Limited Choice Item
|
สามารถวัดความสามารถของผู้เรียนในระดับที่สูงกว่า ความจำ เช่น ความเข้าใจ, ทักษะการแก้ปัญหา เป็นต้น |
วัดความสามารถในระดับความจำเป็นส่วนใหญ
|
ครอบคลุมเนื้อหา (content coverage) ได้ค่อนข้างจำกัด |
ครอบคลุมเนื้อหาได้มากกว่า
|
มีส่วนเพิ่มทักษะการเขียนของผู้เรียน |
ไม่มีการฝึกทักษะการเขียน
|
ตรวจ - ให้คะแนนยาก (ความเป็นปรนัยในการให้คะแนนค่อนข้างต่ำ) |
ตรวจ-ให้คะแนนง่าย
|
สามารถได้ข้อมูลย้อนกลับที่ชัดเจน |
ข้อมูลย้อนกลับที่ได้คลุมเครือไม่ชัดเจน
|
ป้องกันการทุจริตในการสอบได้ดีกว่า |
ง่ายต่อการทุจริตในการสอบ
|
สรุป
การวัดผลการประเมินผล จัดเป็นองค์ประกอบสำคัญอย่างยิ่งในไตรยางค์การศึกษา จนกระทั่งมีการกล่าวอ้างว่า "Evaluations shape up study" ผู้เรียนจะเรียนตามสิ่งที่เขาคาดว่าจะถูกสอบ ดังนั้นหากผู้สอนระมัดระวังหรือ ให้ความสำคัญในการออกข้อสอบก็สามารถกำกับการเรียนรู้ของผู้เรียนไปในทิศทางที่ต้องการได้ด้วยนอกเหนือจาก
การจัดประสบการณ์การเรียนรู้ และดูจะมีประสิทธิภาพในการกำกับการเรียนรู้ของผู้เรียนมากกว่าด้วยซ้ำ สิ่งที่ผู้สอน
ควรจะต้องตระหนักเกี่ยวกับการประเมินผลคือ
1. ต้องชัดเจนว่าต้องการวัดอะไร เพื่ออะไร 2. ต้องเลือกเครื่องมือที่ใช้ในการวัดผลให้เหมาะสม สอดคล้องกับสิ่งที่ต้องการวัด 3. ควรใช้เครื่องมือที่หลากหลาย เพราะเครื่องมือแต่ละชนิดมีข้อจำกัดแตกต่างกัน 4. ตระหนักว่าการวัดผลไม่ใช่จุดสิ้นสุดของการเรียนการสอนควรนำผลไปปรับปรุงเปลี่ยนแปลงการเรียนการสอน
ในโอกาสต่อไปอย่างต่อเนื่องดังวงจรการวัดผล (Evaluation cycle) ต่อไปนี้
ผู้ที่สามารถบอกว่าข้อสอบดีหรือไม่ ได้แก่ ผู้รู้ในเนื้อหานั้นๆ (Content expert) และนักการศึกษาที่มี
ความรู้เรื่องการวัดผล (Test technician)ผู้สอนที่มิได้ศึกษาเกี่ยวกับการศึกษาโดยตรงหากทำความเข้าใจ/เรียนรู้
เกี่ยวกับเรื่องเหล่านี้ก็สามารถมีบทบาทเป็น Test technician ไปในตัวได้ด้วย ทั้งนี้เพื่อส่งผลให้ได้ข้อสอบที่ดี ได้ผลการวัดที่น่าเชื่อถือ และนำไปสู่การประเมินผลที่ถูกต้อง
ไม่มีความคิดเห็น:
แสดงความคิดเห็น