วันพฤหัสบดีที่ 28 กุมภาพันธ์ พ.ศ. 2556

การวัดผลเเละการประเมิณผล

การวัดผลเเละการประเมิณผล

การวัดผล (Measurement / Assessment) และการประเมินผล (Evaluation)   เป็นองค์ประกอบหนึ่ง ของไตรยางค์ การศึกษา (Educational Trilogy) ซึ่งประกอบด้วย 3 องค์ประกอบ คือ วัตถุประสงค์การศึกษา (Educational Objectives) การจัดประสบการณ์การเรียนรู้ (Learning Experiences) และ การวัดผลการประเมินผล (Evaluation) และรู้จักกันโดย ทั่วไปว่า OLE (O = Objectives; L = Learning experiences; E = Evaluation) ทั้ง 3 องค์ประกอบนี้ มีความเกี่ยวข้องสัมพันธ์กันดังแผนภูมิต่อไปนี้

             ในการจัดการเรียนการสอนโดยทั่วไป ผู้สอนจะต้องตั้งวัตถุประสงค์การศึกษาว่า สิ่งที่ต้องการสอนคืออะไร เรื่องราวดังกล่าว เป็นองค์ความรู้ (Knowledge / Cognitive Domain) หรือเป็นทักษะ (Skill / Psychomotor Domain) หรือเป็นทัศน คติ/ เจตคติ (Attitude / Affective Domain) เพราะวัตถุประสงค์ที่จะสอนมีส่วนสำคัญอย่างยิ่งในการกำหนดเลือกวิธีการสอน หรือ วิธีการจัดประสบการณ์การเรียนรู้แก่ผู้เรียน ตัวอย่างเช่น หากสิ่งที่ต้องการสอนเป็นเนื้อหาวิชา หรือ เป็นองค์ความร ู้ ผู้สอนอาจเลือกวิธีการสอนแบบบรรยาย แต่ถ้าต้องการสอนทักษะ ผู้สอนอาจเลือกสอน โดยเริ่มต้นด้วย การบรรยายเพื่อปูพื้นฐานหลักการ ข้อจำกัด ข้อควรระวัง ของทักษะดังกล่าว จากนั้นคงต้องมีการฝึกปฏิบัติ เพื่อให้ผู้เรียน ได้มีโอกาสลองทำ ฝึกทำ ให้เกิดทักษะดังที่ต้องการ และหากต้องการสอนเจตคติหรือทัศนคติ ผู้สอนอาจต้องพิจารณารูปแบบ การสอนเป็นการ อภิปราย กลุ่มย่อย การถกเถียงปัญหา การเล่นบทบาทสมมติ เป็นต้น ไม่ว่าวัตถุประสงค์การศึกษาจะเป็น Domain ใดก็ตามและ ผู้สอนคาดว่าได้จัดประสบการณ์ การเรียนร ู้แก่ผู้เรียนได้อย่างเหมาะสมตามชนิดของวัตถุประสงค์แล้ว ก็ควรจะต้องมีการวัดผลและประเมินผล เพื่อตรวจสอบว่าผู้เรียนได้เรียนรู้จริง ตามวัตถุประสงค์หรือ ไม่
            หากผลการประเมินไม่เป็นไปตามคาดหมาย ผู้สอนคงต้องพิจารณาดูว่าปัจจัยใดใน OLE ที่ส่งผลให้ผู้เรียน ไม่สามารถเรียนรู้จนบรรลุ วัตถุประสงค ์ เป็นไปได้หรือไม่ว่า…การเขียนหรือการกำหนดวัตถุประสงค์ไม่ชัดเจน ส่งผลให้ เลือกวิธีการสอนที่ไม่เหมาะสม หรืออาจเกิดจาก วัตถุประสงค์ชัดเจนแต่เลือกวิธีการสอนที่ไม่สอดคล้องไม่เอื้อให้เกิดการ เรียนรู้ตามวัตถุประสงค์นั้น หรืออาจเกิดจากการเลือกเครื่องมือวัดผลที่ ไม่เหมาะสม ดังนั้นจะเห็นว่าทั้ง 3 องค์ประกอบ ในไตรยางค์การศึกษามีส่วนเกี่ยวข้องกันอย่างแยกไม่ออก แต่ในเอกสารนี้จะขอนำเสนอ รายละเอียดเฉพาะในส่วนของการวัดผล และการประเมินผลเท่านั้น โดยอยู่บนสมมติฐานว่าวัตถุประสงค ์การศึกษาและการจัดประสบการณ์ การเรียนรู้เหมาะสมดีแล้ว

            ทุกครั้งที่จะทำการวัดผลและประเมินผล ซึ่งมักเรียกทั่ว ๆ ไปว่า "ทำการสอบ" เราในฐานะผู้สอนคงจะต้องตอบคำถามต่อไปนี้ เป็นอย่างน้อยเพื่อที่จะทำให้การจัดสอบนั้น ๆ เหมาะสมและยุติธรรมแก่ผู้ถูกสอบหรือผู้เรียน ในเรื่องการสอบ "ความยุติธรรม" เป็นสิ่งที่ผู้สอนพึงตระหนักอยู่เสมอ ก่อนอื่นขอทำความเข้าใจเกี่ยวกับ คำ (Term) ในเรื่องการวัดผล การประเมินผล 2 คำ ดังนี้คือ การวัดผล หรือ การวัด หรือ Measurement หรือ Assessment มีความหมายว่า การจัดหาข้อมูล หรือ จัดหาคะแนนจากหลากหลายวิธี ส่วนการประเมินผล คือ การนำผลที่วัดได้มาตัดสินว่ามีคุณค่าอย่างไร เช่น ในการสอบครั้งหนึ่ง นักศึกษา ก. สอบได้คะแนน 70 % ค่าคะแนน 70 % คือค่าคะแนนที่วัดได้ = Assessment จากนั้นผู้สอนจึงพิจารณาอีกครั้งว่าค่าคะแนน 70 % นี้อยู่ในเกณฑ์ดีมาก หรือ ดี หรือ พอใช้ เราเรียกการตัดสินคุณค่า ของสิ่งที่วัดได้ว่าการประเมินผล = Evaluation เพราะฉะนั้นความสัมพันธ์ระหว่าง Assessment และ Evaluation เป็นดังนี้

             Measurement = Assessment = การวัดผล

             Evaluation = Measurement (Assessment) + Judgment

             อย่างไรก็ตาม คำ 2 คำนี้ในบางครั้งก็สามารถใช้แทนกันได้ แต่สิ่งที่ผู้สอนต้องคำนึงถึงคือ"การวัดผลที่ดี มีโอกาสนำไปสู่การประเมินผลที่ถูกต้อง"

คำถามที่ต้องการคำตอบ
            ก่อนทำการสอบนักศึกษาทุกครั้ง ผู้สอนควรตอบคำถามอย่างน้อย 5 ข้อนี้ คือ

                       Why ? = ทำไมต้องสอบ ?
                       What ? = สอบอะไร ?
                       When ? = สอบเมื่อไหร่ ?
                       Who ? = สอบใคร ?
                       How ? = ใช้เครื่องมืออะไร ?

1. ทำไมต้องสอบ ?
เหตุผลที่ต้องทำการสอบผู้เรียน คือ
- ต้องการทราบว่าผู้เรียนได้เกิดการเรียนรู้ตามวัตถุประสงค์หรือไม่
- สามารถใช้ผลการสอบเป็นข้อมูลย้อนกลับ (feedback) แก่ผู้สอน เพื่อนำไปปรับปรุงกระบวนการการจัดการเรียนการสอน
- สามารถใช้ผลการสอบเป็นข้อมูลย้อนกลับแก่ผู้เรียน เพื่อนำไปปรับปรุงวิธีการเรียนและเพื่อทราบความก้าวหน้าในการเรียนรู้  ของตนเอง
   รู้จุดอ่อน-จุดแข็ง
- ใช้เป็นแรงจูงใจให้ผู้เรียนทำการศึกษา/เรียน (Motivate students to study)
- ใช้จัดกลุ่มผู้เรียน (Placement evaluation)
- ใช้ตัดสินผลการเรียนของผู้เรียน (ได้-ตก ; A / B / C /….)
- ใช้เป็นกลไกหนึ่งในการประกันคุณภาพของผู้เรียนต่อสังคม
 
       
            ผู้สอนคงต้องตอบตัวเองว่า การจัดสอบของเราในแต่ละครั้งหวังผลในข้อใดข้างต้น ซึ่งจะเป็นตัวกำหนดถึงเนื้อหา เวลา เครื่องมือ ที่จะใช้ในการสอบได้อย่างเหมาะสม

2. สอบอะไร ?

         สิ่งที่จะทำการสอบนักศึกษาคือวัตถุประสงค์ของรายวิชานั้น ๆ ซึ่งได้กล่าวไปบ้างแล้วในข้างต้นว่า วัตถุประสงค์ทางการศึกษา สามารถจำแนกเป็น 3 หมวดหมู่ (Domain) คือ

         ความรู้ = Cognitive Domain      = Knowledge
          ทักษะ = Psychomotor Domain = Skill
        ทัศนคติ = Affective Domain      = Attitude

         ผู้สอนคงต้องกำหนดให้ชัดเจนว่าต้องการวัด Domain ใด จึงจะสามารถเลือกใช้เครื่องมือวัดที่เหมาะสมได้ ส่งผลให้ผลการวัดน่าเชื่อถือและยุติธรรมต่อผู้เรียน ตัวอย่างเช่น ต้องการทดสอบว่าผู้เรียนว่ายน้ำเป็นหรือไม่ ซึ่งเป็น ความสามารถทางทักษะ หากใช้เครื่องมือวัดเป็นการสอบข้อเขียน (paper-pencil exam) ก็คงไม่สามารถสะท้อน ความเป็นจริงที่ว่าผู้ที่ตอบข้อสอบได้คะแนนดี สามารถว่ายน้ำได้จริงหรือไม่ ดังนั้นการวัดผลควรคำนึงถึงการเลือกใช้ เครื่องมือที่สอดคล้องกับสิ่งที่ต้องการวัดเพื่อให้การวัดผลการประเมินผลนั้นเป็นการวัดผลการประเมินผลตามสภาพ
ความเป็นจริง (Authentic Assessment)

3. สอบเมื่อไหร่ ?

         สืบเนื่องจากเราสามารถนำผลการสอบมาใช้เป็นข้อมูลย้อนกลับแก่ผู้เรียนให้รู้ถึงความก้าวหน้าในการเรียนและ
ใช้ปรับปรุงวิธีการเรียน (feedback to improve) เราเรียกการสอบเพื่อวัตถุประสงค์นี้ว่า Formative Evaluation / Diagnostic Evaluation ส่วนการสอบที่หวังผลในการตัดสิน ได้-ตก หรือ การให้ค่าคะแนน (Grading) ซึ่งจัดเป็น final grade of record เราเรียกการสอบแบบหลังนี้ว่า Summative Evaluation / Certifying Evaluation เมื่อทราบถึง
วัตถุประสงค์ของการสอบ 2 ชนิดข้างต้นนี้ ก็สามารถช่วยให้ผู้สอนตัดสินใจว่าจะจัดสอบในช่วงใด รวมทั้งหากต้องการสอบ
เพื่อจัดกลุ่มผู้เรียน (Placement Evaluation) ผู้สอนก็คงต้องคำนึงถึงช่วงเวลาการจัดสอบเช่นกัน

         หากคำนึงถึงช่วงเวลาที่ใช้จัดสอบ คงพอจะแบ่งเป็นช่วงเวลาหยาบ ๆ ดังนี้คือ

         ก่อนเริ่มกระบวนการเรียนการสอนในรายวิชา (Beginning of course)
         ในระหว่างที่รายวิชาดำเนินอยู่ (In course)
         และ เมื่อสิ้นสุดรายวิชา (End of course)

         ดังนั้น หากเราต้องการจัดสอบเพื่อ Formative Evaluation คงต้องจัดสอบในระหว่างรายวิชายังดำเนินอยู่ หากจัดสอบเมื่อสิ้นสุดรายวิชาแล้วคงไม่มีประโยชน์ เป็นต้น
4. สอบใคร ?         กลุ่มผู้เรียนที่ถูกสอบ เป็นผู้เรียนชั้นใด กลุ่มใด ทั้งนี้เพื่อให้ผู้สอนได้คำนึงถึงความยากง่าย และความลึกซึ้งของวัตถุประสงค์ที่ทำการสอบว่าเหมาะสมหรือไม่อย่างไร ทั้งนี้เพื่อให้เกิดความยุติธรรมต่อผู้เรียน
5. ใช้เครื่องมืออะไร ?          โดยทั่วไป เครื่องมือที่ใช้ในการสอบก็คือสิ่งที่เราเรียกโดยทั่วไปว่า ข้อสอบ (Test format) ซึ่งมีหลายชนิด ไม่ว่าจะเป็นชนิดใดก็ตาม เครื่องมือ/ข้อสอบ ที่ดี ต้องมีคุณสมบัติดังต่อไปนี้
      1. มีความเที่ยงตรง (Validity) ซึ่งแบ่งออกเป็น 4 ชนิด คือ
         - Constructive Validity ความเที่ยงตรงในการสร้างข้อสอบให้สามารถวัดพฤติกรรมการเรียนรู้
ของผู้เรียนได้ บางครั้งเรียกว่า ความเที่ยงตรงตามทฤษฎี

                           Construct Validity ของเครื่องมือชนิดต่างๆ
Triple jump
MEQ
Direct observation
MCQ
 OSCE
Knowledge
+
 ++
+++
+
Problem solving
 +++
++
 + 
+
+
Interpersonal skill 
+++
+
Technical skil
++
Attitudes
+ 
+
+++

         - Content Validity ความเที่ยงตรงตามเนื้อหา หมายถึงมีการสุ่มเนื้อหาที่ออกสอบได้เหมาะสม จนสามารถ เป็นตัวแทนของรายวิชานั้น ๆ (adequate sampling of content) เราสามารถใช้ตารางเนื้อหา (Table of specification) ช่วย ในการให้ได้มาซึ่งข้อสอบที่มี content validity โดยทั่วไปมีข้อแนะนำว่า ในชุดข้อสอบใด ๆ ควรประกอบด้วยเนื้อหาที่   
                         ต้องรู้  =   60-85 %
                         ควรรู้  =   10-35 %
                         น่ารู้     =   5-10 %


         - Concurrent Validity ความเที่ยงตรงตามสถานการณ์ เช่น ข้อสอบนี้วัดหลักการการใช้เครื่องมือ A ดังนั้นหากนักศึกษาที่ได้คะแนนสูง ควรใช้เครื่องมือ A เป็น และในทางกลับกัน นักศึกษาที่ได้คะแนนต่ำ ควรใช้เครื่องมือ A ไม่เป็น หรือ ไม่ถูกต้อง
         - Predictive Validity ความเที่ยงตรงในการคาดเดา เช่น หากข้อสอบชุดนี้มี predictive validity ดี หมายความว่า นักศึกษาที่สอบได้คะแนนสูง คงไม่มีปัญหาในการเรียน และนักศึกษาที่ได้คะแนนต่ำ คงมีปัญหาในการเรียน เป็นต้น

      2. มีความเป็นปรนัย (Objectivity) หมายถึง ผลของการสอบชุดข้อสอบนั้น ๆ สะท้อนถึงความสามารถของผู้เรียน อย่างแท้จริง ไม่ได้มีอิทธิพลของผู้สอนเข้ามาเกี่ยวข้อง อิทธิพลอันเนื่องมาจากผู้สอนเรียกว่า Subjectivity ข้อสอบที่ดีควรมี Objectivity สูง ๆ และมี Subjectivity ต่ำ ๆ
         ความเป็นปรนัย ได้แก่
         - ความเป็นปรนัยในการถาม หรือ ความชัดเจนในการถาม คือ อ่านแล้วเข้าใจตรงกัน ไม่ต้องการ การตีความ เพิ่มเติม
         - ความเป็นปรนัยในการให้คะแนน หรือ ความชัดเจนในการให้คะแนน หมายถึง ตรวจแล้วให้คะแนนตรงกัน ไม่ว่าผู้ตรวจจะเป็นใคร เท่ากับเป็นการสะท้อนผลการกระทำของผู้เรียนเท่านั้น ตัวอย่างชนิดของข้อสอบที่มีความเป็น ปรนัยสูงในการให้คะแนน คือ ข้อสอบแบบเลือกตอบ (Multiple Choice Question : MCQ) ส่วนข้อสอบที่มี ความเป็น ปรนัยต่ำในการให้คะแนน ได้แก่ ข้อสอบแบบบรรยาย (Essay) เป็นต้น

         ความเป็นปรนัย (Objectivity) และความเป็นอัตนัย (Subjectivity) เป็นคุณสมบัติของข้อสอบ ไม่ใช่รูปแบบ ข้อสอบแบบเลือกตอบ(MCQ) หากไม่ระมัดระวังในการออก ก็อาจกลายเป็นข้อสอบที่ไม่มีความเป็นปรนัยก็ได้ และ ในทางตรงกันข้าม ข้อสอบแบบบรรยาย(Essay) หากระมัดระวังในการออกโดยใช้คำพูดที่ชัดเจน จำเพาะเจาะจง ก็อาจเป็นข้อสอบที่มีความเป็นปรนัยได้เช่นกัน ความเป็น "ปรนัย/อัตนัย" อาจทำให้ผู้สอนมีความเข้าใจคลาดเคลื่อน เนื่องจากเราได้มีการกำหนดเรียกข้อสอบชนิดเลือกตอบ(MCQ) ว่าข้อสอบปรนัย และเรียกข้อสอบแบบ บรรยาย(Essay) ว่าข้อสอบอัตนัย โดยนำคำเหล่านั้นผูกเข้ากับรูปแบบ (test format) ทั้ง ๆ ที่ในความเป็นจริงเป็น คุณสมบัติ ของข้อสอบ
      3. มีความเชื่อถือได้ (Reliability) หมายความว่า หากนำข้อสอบชุดเดิมมาทำการสอบ 2 ครั้ง แล้วให้ผลเหมือนเดิม ซึ่งเป็นการยากที่จะทำการทดสอบชุดข้อสอบใด ๆ 2 ครั้งโดยผู้สอบกลุ่มเดิมในช่วงเวลาห่างกันพอสมควร (1-2 สัปดาห์) โดยผู้สอบไม่รู้ล่วงหน้า ทั้งนี้ปัจจัยต่าง ๆเกี่ยวกับผู้สอบจะต้องเหมือนเดิมทุกอย่าง การทดสอบความเชื่อถือ/เชื่อมั่นของ ข้อสอบแบบนี้เรียกว่าการทำ Test-Retest ดังนั้น นักการศึกษาจึงได้คิดวิธีสะท้อนค่าความเชื่อถือของชุดข้อสอบ โดยใช้ค่าสถิติในการหาค่า Reliability โดยไม่ต้องให้ผู้สอบสอบ 2 ครั้ง เรียกค่าความเชื่อมั่นดังกล่าวว่า ค่าคงที่ภายใน (Internal consistency) ใช้สัญลักษณ์ว่า rtt

rtt = ค่าความเชื่อมั่นของข้อสอบ
X = Mean
S = Standard deviation
K = จำนวนข้อสอบ
ค่า rtt ที่เป็นที่ยอมรับคือ > 0.6


      4. มีความยากง่ายพอเหมาะ (Difficulty index) โดยมีข้อแนะนำว่าในแต่ละชุดข้อสอบควรมีข้อสอบที่มี ค่าความยากง่ายปากกลาง = 50 % ; ยาก = 25% ; และ ง่าย = 25%

      5. มีค่าอำนาจจำแนกดี (Discrimination power) หมายถึง สามารถจำแนกคนเก่ง - อ่อน ออกจากกันได้ ข้อสอบชนิดเลือกตอบแบบคำตอบเดียวถูก ( MCQ : One-Best Response) สามารถนำมาหาค่าทางสถิติ ที่แสดงถึงความยากง่ายและค่าอำนาจจำแนกได้ ในขณะที่ข้อสอบรูปแบบอื่นยังมีข้อจำกัดในการหาค่าทั้งสองดังกล่าว รายละเอียดเกี่ยวกับการหาค่ายากง่ายของข้อสอบและค่าอำนาจจำแนก ผู้สนใจสามารถศึกษาได้ในหัวข้อการวิเคราะห์
ข้อสอบ (Item analysis) ในหนังสือเกี่ยวกับการวัดผลการศึกษาโดยทั่วไป

      6. สร้างง่าย ใช้ง่าย ใช้สดวก คุ้มค่า (Feasibility, Practicability, Usability)

ชนิดของข้อสอบ (Test format)    

         แบ่งเป็น 2 จำพวกใหญ่คือ Limited Choice Item (question) และ Open-ended Item (question)
 Limited Choice Item ได้แก่ Multiple choice question, True/False question, Matching Column เป็นต้น
 Open-ended Item ได้แก่ Sentence completion, Short answer question (SAQ), Modified essay question
(MEQ), และ Essay เป็นต้น

         ข้อสอบสองจำพวกนี้มีข้อดี-ข้อเสียแตกต่างกันดังต่อไปนี้

Open-ended Item
Limited Choice Item
สามารถวัดความสามารถของผู้เรียนในระดับที่สูงกว่า
ความจำ เช่น ความเข้าใจ, ทักษะการแก้ปัญหา เป็นต้น
วัดความสามารถในระดับความจำเป็นส่วนใหญ
ครอบคลุมเนื้อหา (content coverage) ได้ค่อนข้างจำกัด
ครอบคลุมเนื้อหาได้มากกว่า
มีส่วนเพิ่มทักษะการเขียนของผู้เรียน
ไม่มีการฝึกทักษะการเขียน
ตรวจ - ให้คะแนนยาก
(ความเป็นปรนัยในการให้คะแนนค่อนข้างต่ำ)
ตรวจ-ให้คะแนนง่าย
สามารถได้ข้อมูลย้อนกลับที่ชัดเจน
ข้อมูลย้อนกลับที่ได้คลุมเครือไม่ชัดเจน
ป้องกันการทุจริตในการสอบได้ดีกว่า
ง่ายต่อการทุจริตในการสอบ

สรุป
         การวัดผลการประเมินผล จัดเป็นองค์ประกอบสำคัญอย่างยิ่งในไตรยางค์การศึกษา จนกระทั่งมีการกล่าวอ้างว่า "Evaluations shape up study" ผู้เรียนจะเรียนตามสิ่งที่เขาคาดว่าจะถูกสอบ ดังนั้นหากผู้สอนระมัดระวังหรือ ให้ความสำคัญในการออกข้อสอบก็สามารถกำกับการเรียนรู้ของผู้เรียนไปในทิศทางที่ต้องการได้ด้วยนอกเหนือจาก
การจัดประสบการณ์การเรียนรู้ และดูจะมีประสิทธิภาพในการกำกับการเรียนรู้ของผู้เรียนมากกว่าด้วยซ้ำ สิ่งที่ผู้สอน
ควรจะต้องตระหนักเกี่ยวกับการประเมินผลคือ

         1. ต้องชัดเจนว่าต้องการวัดอะไร เพื่ออะไร         2. ต้องเลือกเครื่องมือที่ใช้ในการวัดผลให้เหมาะสม สอดคล้องกับสิ่งที่ต้องการวัด         3. ควรใช้เครื่องมือที่หลากหลาย เพราะเครื่องมือแต่ละชนิดมีข้อจำกัดแตกต่างกัน         4. ตระหนักว่าการวัดผลไม่ใช่จุดสิ้นสุดของการเรียนการสอนควรนำผลไปปรับปรุงเปลี่ยนแปลงการเรียนการสอน
ในโอกาสต่อไปอย่างต่อเนื่องดังวงจรการวัดผล (Evaluation cycle) ต่อไปนี้





         ผู้ที่สามารถบอกว่าข้อสอบดีหรือไม่ ได้แก่ ผู้รู้ในเนื้อหานั้นๆ (Content expert) และนักการศึกษาที่มี
ความรู้เรื่องการวัดผล (Test technician)ผู้สอนที่มิได้ศึกษาเกี่ยวกับการศึกษาโดยตรงหากทำความเข้าใจ/เรียนรู้
เกี่ยวกับเรื่องเหล่านี้ก็สามารถมีบทบาทเป็น Test technician ไปในตัวได้ด้วย ทั้งนี้เพื่อส่งผลให้ได้ข้อสอบที่ดี ได้ผลการวัดที่น่าเชื่อถือ และนำไปสู่การประเมินผลที่ถูกต้อง


ไม่มีความคิดเห็น:

แสดงความคิดเห็น