วิชาการศึกษา เรื่อง การตรวจสอบคุณภาพของแบบทดสอบ

วิชาการศึกษา เรื่อง การตรวจสอบคุณภาพของแบบทดสอบ
การตรวจสอบคุณภาพของแบบทดสอบ
การตรวจสอบคุณภาพของแบบทดสอบที่ใช้ในการวัดผลจะต้องทำการตรวจสอบคุณภาพด้านต่างๆ ที่จำเป็นของแบบทดสอบแต่ละชนิดดังต่อไปนี้
- ความเที่ยงตรง (Validity) เป็นความถูกต้องสอดคล้องของแบบทดสอบกับสิ่งที่ต้องการจะวัด ซึ่งเป็นคุณลักษณะของแบบทดสอบที่ถือว่าสำคัญที่สุด โดยมีเกณฑ์ในการเปรียบเทียบ คือ เนื้อหาโครงสร้าง สภาพปัจจุบัน และอนาคต
- ความเชื่อมั่น (Reliability) เป็นความคงเส้นคงวาของคะแนนในการวัดแต่ละครั้ง หรือความคงที่ของผลการวัด ผลของการวัดไม่ว่าจะเป็นคะแนนหรืออันดับที่ก็ตาม เมื่อวัดได้ผลออกมาแล้วสามารถเชื่อถือได้ในระดับสูงจนสามารถประกันได้ว่า ถ้ามีการตรวจสอบผลซ้ำอีกไม่ว่า กี่ครั้งก็จะได้ผลใกล้เคียงและ สอดคล้องกับผลการวัดเดิมนั่นเอง
- ความเป็นปรนัย (Objectivity) เป็นความชัดเจนที่ทุกฝ่ายที่เกี่ยวข้องกับการวัดผล ครั้งนั้นมีความเห็นสอดคล้องกันในเรื่องของคำถามค่าของคะแนนหรืออันดับที่ที่วัดได้ตลอดจนการแปลงค่าคะแนนเป็นผลประเมินในการตัดสินคุณค่าก็สอดคล้องตรงกัน การพิจารณาความเป็นปรนัยของมีหลายประการ คุณสมบัติความเป็นปรนัยของแบบทดสอบที่สำคัญ ได้แก่ คุณสมบัติ 3 ประการ ดังนี้
3.1 ชัดแจ้งในความหมายของคำถาม ข้อสอบที่เป็นปรนัย ทุกคนที่อ่านข้อสอบ ไม่ว่าจะเป็นผู้สอบหรือผู้ตรวจข้อสอบย่อมจะเข้าใจตรงกันไม่ตีความไปคนละแง่
3.2 ตรวจให้คะแนนได้ตรงกันข้อสอบที่มีความเป็นปรนัย ไม่ว่าจะเป็นผู้ออก ข้อสอบหรือใครก็ตามสามารถตรวจให้คะแนนได้ตรงกัน ข้อสอบที่ผู้ตรวจเฉลยไม่ตรงกัน แสดงให้เห็นถึงความไม่ชัดเจนในคำถามและคำตอบ
3.3 แปลความหมายของคะแนนได้ตรงกัน โดยทั่วไปข้อสอบปรนัยนั้นผู้ตอบถูกจะได้ 1คะแนน ตอบผิดจะได้ศูนย์คะแนน จำนวนคะแนนที่ได้จะแทนจำนวนข้อที่ถูก ทำให้สามารถแปลความหมายได้ชัดเจนว่าใครเก่ง อ่อนอย่างไร ตอบถูกมากน้อยต่างกันอย่างไรข้อสอบประเภทถูกผิด จับคู่ เติมคำ หรือเลือกตอบที่ขาดคุณสมบัติข้อใดข้อหนึ่งอาจกล่าวได้ว่าเป็นข้อสอบปรนัยเฉพาะรูปแบบของข้อสอบเท่านั้น ส่วนคุณสมบัติยังไม่เป็นปรนัยความเป็นปรนัยของข้อสอบจะทำให้เกิดคุณสมบัติทางความเชื่อมั่นของคะแนนอันจะนำไปสู่ความเที่ยงตรงของผลการวัดด้วย
- ความยากง่าย (Difficulty) ความยากง่ายของข้อสอบพิจารณาได้จากผลการสอบของผู้สอบเป็นสำคัญ ข้อสอบใดที่ผู้สอบส่วนมากตอบถูก ค่าคะแนนเฉลี่ยของข้อสอบสูงกว่า 50 เปอร์เซ็นต์ของคะแนนเต็ม อาจกล่าวได้ว่าเป็นข้อสอบที่ง่าย หรือค่อนข้างง่าย ข้อสอบที่มีความยากง่ายพอเหมาะคะแนนเฉลี่ยของข้อสอบควรมีประมาณ 50 เปอร์เซ็นต์ ของคะแนนเต็ม ถ้าคะแนนเฉลี่ยต่ำกว่า 50เปอร์เซ็นต์ แสดงว่าเป็นข้อสอบค่อนข้างยาก ข้อสอบที่ดีควรมีความยากง่ายพอเหมาะ ไม่ยากหรือง่ายเกินไป ข้อสอบฉบับหนึ่งควรมีผู้ตอบถูกไม่ต่ำกว่า 50 คนและไม่เกิน 80 คน จากผู้สอบ 100 คน
- อำนาจจำแนก (Discrimination) เป็นลักษณะของแบบทดสอบที่สามารถออกเป็นประเภทต่าง ๆ ได้ทุกระดับ ตั้งแต่อ่อนสุดจนถึงเก่งสุด แม้ว่าจะเก่ง -อ่อนกว่ากันเพียงเล็กน้อยก็สามารถชี้จำแนกให้เห็นได้ ข้อสอบที่มีอำนาจจำแนกสูงนั้น เด็กเก่งมักตอบถูกมากว่าเด็กอ่อนเสมอข้อสอบที่ทุกคนตอบถูกหมดจะไม่สามารถบอกอะไรได้เลยหรือข้อสอบที่ทุกคนตอบผิดหมดไม่สามารถบอกได้ว่าใครเก่งหรืออ่อน
- ความมีประสิทธิภาพ (Eficiency) เครื่องมือวัดผลที่มีประสิทธิภาพ หมายถึง เครื่องมือที่ทำให้ได้ข้อมูลได้ถูกต้องเชื่อถือได้ โดยลงทุนน้อยที่สุดไม่ว่าจะเป็นการลงทุนในแง่เวลา แรงงาน และทุนทรัพย์ รวมทั้งความสะดวกสบาย คล่องตัวในการรวบรวมข้อมูล ข้อสอบที่มีประสิทธิภาพสามารถให้คะแนนได้เที่ยงตรงและเชื่อถือได้มากที่สุด โดยใช้เวลาแรงงานและเงินน้อยที่สุด แต่ประโยชน์ที่ได้จากการสอบคุ้มค่า ข้อสอบที่พิมพ์ผิดตกหล่นมาก จำนวนหน้า ไม่ครบรูปแบบของแบบทดสอบเรียงไม่เป็นระเบียบทำให้ผู้สอบเกิดความสับสน มีผลต่อคะแนนที่ได้จากการทำแบบทดสอบทั้งสิ้นการจัดรูปแบบของข้อสอบปรนัยแบบเลือกตอบเพื่อให้ดูง่าย มีความเป็นระเบียบเรียบร้อยนิยมพิมพ์ แบ่งครึ่งหน้ากระดาษ
- ความยุติธรรม (Fair) ความยุติธรรมเป็นคุณลักษณะของข้อสอบที่ดีต้องไม่เปิดโอกาสให้เด็กได้เปรียบเสียเปรียบกัน เช่น ข้อสอบบางฉบับครูไปเน้นเรื่องใดเรื่องหนึ่ง ซึ่งตรงกับเรื่องที่เด็กทำรายงานในบางกลุ่ม ทำให้กลุ่มนั้น ๆ ได้เปรียบคนอื่น ๆ ข้อสอบบางข้อใช้คำถามหรือข้อความที่แนะคำตอบ ทำให้นักเรียนใช้ไหวพริบเดาได้ การใช้ข้อสอบแบบอัตนัยเพียง 5 หรือ 10 ข้อมาทดสอบเด็กนั้นไม่อาจสร้างความยุติธรรมในการสอบให้แก่เด็กได้เพราะผู้สอบมีโอกาสเก็งข้อสอบได้ถูกมากกว่าแบบปรนัยที่มีจำนวนข้อมาก ๆ เช่น 100 ข้อ
- คำถามลึก (Searching) ข้อสอบที่ถามลึกไม่ถามแต่เพียงความรู้ความจำเท่านั้น แต่จะถามวัดความเข้าใจ การนำความรู้ที่ได้เรียนไปแล้วมาแก้ปัญหา วิเคราะห์ ตลอดจนสร้างสรรค์สิ่งใหม่ขึ้นมาจนท้ายที่สุดคือการประเมินผล คำถามที่ถามลึกนั้นผู้ตอบต้องคิดค้นก่อนจึงจะสามารถหาคำตอบได้ มิใช่เพียงแต่ระลึกถึงประสบการณ์ต่างๆ เพียงตื้นๆ ก็ตอบปัญหาได้ แต่เป็นแบบทดสอบที่วัดความลึกซึ้งทางวิชาการตามแน นวดิ่งมากกว่าจะวัดตามแนวกว้าง
- คำถามยั่วยุ (Exemplary) คำถามยั่วย ได้แก่ คำถามที่มีลักษณะท้าทายให้เด็กอยากคิดอยากทำ มีลีลาการถามที่น่าสนใจ ไม่ถามวนเวียนซ้ำซาก น่าเบื่อหน่าย การใช้รูปภาพประกอบ ก็เป็นวิธีหนึ่งที่ทำให้ข้อสอบน่าสนใจ ข้อสอบที่ยากเกินไปทำให้ผู้สอบหมดกำลังใจที่จะทำส่วนข้อสอบที่ง่ายเกินไปก็ไม่ท้าทายให้อยากทำการเรียงลำดับคำถามจากข้อง่ายไปหายากเป็นวิธีหนึ่งที่ทำให้ข้อสอบมีลักษณะท้าทายน่าทำ
- จำเพาะเจาะจง (Definite) คำถามที่ดีต้องไม่ถามกว้างเกินไป ไม่ถามคลุมเครือหรือเล่นสำนวนให้ผู้สอบงง ผู้สอบอ่านแล้วต้องเข้าใจชัดเจนว่าครูถามอะไร ส่วนจะตอบได้หรือไม่อยู่ที่ความสามารถของผู้ตอบเป็นสำคัญ
ระดับการวัดคุณภาพของแบบทดสอบ
- มาตรานามบัญญัติ (Nominal Scale) ลักษณะเด่นของมาตรานี้คือ เป็นการกำหนดขึ้นเพื่อใช้เรียกชื่อการจัดประเภท เป็นตัวแปรที่ถูกจัดเป็นกลุ่มๆ โดยที่ตัวแปรนี้ไม่สามารถจัดลำดับก่อนหลังหรือบอกระยะห่างได้ เช่น หมายเลขมือถือ ภูมิลำเนา ชื่อคน เชื้อชาติ อาชีพ “ตัวเลขในมาตรานี้เปรียบเทียบกันไม่ได้”
- มาตราจัดลำดับ (Ordinal Scale) ลักษณะของมาตรานี้ จะมีลักษณะคล้ายกับมาตรานามบัญญัติ คือสามารถจัดเป็นกลุ่มๆ ได้และไม่สามารถบอกระยะห่างระหว่างกลุ่มได้เช่นเดียวกับมาตรานามบัญญัติ แต่มาตราจัดลำดับสามารถจัดลำดับก่อนหลังของตัวแปรได้ เช่น วุฒิการศึกษา อาจแบ่งได้เป็น 3 กลุ่ม คือ ต่ำว่าปริญญาตรี ปริญญาตรี และสูงกว่าปริญญาตรี และสามารถจัดลำดับก่อนหลังได้ว่าผู้ที่จะรียนในระดับปริญญาตรีได้ต้องผ่านการศึกษาในระดับมัธยมมาก่อน หรือผลการประกวดนางงามที่ผลออกมาเป็น อันดับ 1, 2, 3, ฯลๆ “ตัวเลขในมาตรานี้บวกลบกันมิได้”
- มาตราอันตรภาคชั้น (Interval Scale) คุณลักษณะของมาตรานี้สามารถแบ่งตัวแปรออกเป็นกลุ่มๆ ได้ จัดลำดับก่อนหลังของตัวแปรได้ อีกทั้งมีระยะห่างของช่วงการวัดที่เท่ากัน และที่สำคัญที่สุดของมาตรานี้คือ มาตรานี้เป็นมาตรการวัดที่ไม่มีศูนย์แท้ (Absolute Zero) นั่นหมายความว่าศูนย์ของมาตรานี้ไม่ได้หมายความว่าไม่มี แต่เป็นศูนย์ที่เกิดจากการสมมติขึ้น เช่น ผลคะแนนสอบวิชาสถิติของนาย ก พบว่าได้คะแนนเท่ากับ 0 (ศูนย์) นั่นไม่ได้หมายความว่านาย ก ไม่มีความรู้ในเรื่องสถิติเพียงแต่การสอบในครั้งนั้นวัดได้ไม่ตรงกับสิ่งที่นาย ก รู้ “ตัวเลขในมาตรานี้เปรียบเทียบอัตราส่วนกันมีได้”
- มาตราอัตราส่วน (Ratio Scale) มาตรานี้ เป็นมาตราที่มีลักษณะเหมือนกับมาตราอัตราส่วนทุกประการ แต่สิ่งที่แตกต่างกันในมาตรานี้คือ มาตรานี้เป็นมาตราที่มี ศูนย์แท้ (Absolutezero) นั่นหมายความว่า ผลที่ได้จากการวัดในมาตรานี้หากเท่ากับศูนย์แสดงว่าไม่มีอย่างแท้จริงส่วนมากมักเป็นข้อมูลด้านกายภาพ เช่น ตัวแปรน้ำหนัก หรือส่วนสูง 0 (ศูนย์) ของตัวแปรทั้งสองตัวนี้หมายถึงไม่มีน้ำหนักและไม่มีความสูงเลย “ตัวเลขในมาตรานี้นำมาเปรียบเทียบอัตราส่วนกันได้ “