Ep.1: การวัดและประเมินผล (The Judge) - สรุปสอบครู Std.4

สังเวียนคำศัพท์ (Basic Terms)

คู่ไหนต่างกันยังไง? อย่าจำสลับ!

Measurement (การวัด)

คือการหา "ปริมาณ/จำนวน"
Key: ตัวเลข, เครื่องมือ

"เด็กชาย A สูง 170 ซม."

Evaluation (การประเมิน)

คือการ "ตัดสินคุณค่า"
Key: ผ่าน/ไม่ผ่าน, เกรด

"เด็กชาย A สูงตามเกณฑ์"

Formative
ประเมินย่อย/ระหว่างเรียน

เป้าหมาย: เพื่อพัฒนา/ปรับปรุง (Improve)
เวลา: ระหว่างสอน, ท้ายคาบ
คะแนน: น้อย หรือไม่มี (เน้น Feedback)

Summative
ประเมินรวม/หลังเรียน

เป้าหมาย: เพื่อตัดสินผล (Judge)
เวลา: จบบท, จบเทอม
คะแนน: เยอะ (ตัดเกรด)

อิงกลุ่ม (Norm)

แข่งกับเพื่อน / ตัดเกรดตามโค้ง / ใช้คัดเลือกคนจำนวนจำกัด
(เช่น สอบเข้ามหาลัย, สอบบรรจุครู)

อิงเกณฑ์ (Criterion)

แข่งกับมาตรฐาน / ผ่านเกณฑ์คือผ่านทุกคน
(เช่น สอบใบขับขี่, สอบหมอ, การเรียนรู้แบบรอบรู้)

คุณภาพเครื่องมือ

Validity vs Reliability ต่างกันยังไง?

1. Validity (ความตรง)

วัดได้ตรงตามสิ่งที่อยากวัดไหม?

Content (ตรงเนื้อหา) Construct (ตรงโครงสร้าง)

ตรวจสอบโดยผู้เชี่ยวชาญ (IOC)

2. Reliability (ความเที่ยง)

วัดกี่ครั้งก็ได้ผลเหมือนเดิม (คงเส้นคงวา)

"ตาชั่งที่ดี ชั่งวันนี้ 50kg พรุ่งนี้ก็ต้อง 50kg (ถ้าไม่อ้วนขึ้น)"

Low Reliability
Low Validity

ซ้าย: มั่วกระจาย / ขวา: แม่นยำเข้าเป้า

ห้องแล็บวิเคราะห์ข้อสอบ

ค่า p และ ค่า r คืออะไร? (ต้องจำตัวเลข!)

ค่า p (ความยากง่าย)

คือ สัดส่วนคนตอบถูก (ยิ่งมาก = ยิ่งง่าย)

ยากเกินไป (0.0 - 0.19) p = 0.1

ใช้ได้ (0.20 - 0.80) p = 0.5 (ดีมาก)

ง่ายเกินไป (0.81 - 1.00) p = 0.9

ค่า r (อำนาจจำแนก)

แยกคนเก่งออกจากคนอ่อนได้ไหม?

≥ 0.2

ใช้ได้ (จำแนกได้)

คนเก่งตอบถูก คนอ่อนตอบผิด

< 0.2

ใช้ไม่ได้ (จำแนกไม่ได้)

ทิ้งข้อสอบข้อนี้ไป

ติดลบ (Negative):

คนอ่อนตอบถูก แต่คนเก่งตอบผิด! (แปลว่าเฉลยผิด หรือโจทย์หลอกคนเก่ง)

รู้ทฤษฎีวัดผลแล้ว...
ไปดูวิธี "วิจัย" แก้ปัญหาเด็กกัน!

ตอนต่อไป: "วิจัยในชั้นเรียน (Classroom Research)" และวิธีเลือกนวัตกรรม (เกม/แบบฝึก) มาช่วยเด็ก

ไปต่อ Ep.2: นักวิจัยแก้ปัญหา