การเปรียบเทียบวิธีการสุ่มตัวอย่างเพื่อตรวจสอบการนำเข้าข้อมูล
คำสำคัญ:
การสุ่มตรวจสอบการนำเข้าข้อมูล, การสุ่มตรวจสอบแบบต่อเนื่องบทคัดย่อ
การนำเข้าข้อมูลเป็นขั้นตอนหนึ่งที่มีผลต่อคุณภาพของข้อมูล ซึ่งแต่ละวิธีจะมีลักษณะเฉพาะของการทำงานความซับซ้อน
ของกระบวนการทำงานและข้อจำกัดในการใช้งาน งานวิจัยนี้ศึกษาการสุ่มตัวอย่างเพื่อการตรวจสอบ(verify) การนำเข้าข้อมูล 4 วิธี
ได้แก่ (1). Continuous Sampling Plan 1 (CSP-1) โดยการตรวจสอบ100% (การตรวจสอบข้อมูลต่อเนื่อง i ชุด) หากข้อมูลทั้ง i ชุด
ถูกต้องจะสลับมาทำการตรวจสอบสัดส่วน คือ สุ่มข้อมูล 1 ชุดจาก i ชุด ถ้าข้อมูลชุดดังกล่าวถูกต้องจะทำการตรวจสอบแบบสัดส่วน
ไปเรื่อยๆ และจะสลับมาเป็นการตรวจสอบ 100% เมื่อการตรวจสอบสัดส่วนพบข้อมูลไม่ถูกต้อง (2). CSP-2 เหมือน CSP-1 แต่จะ
สลับมาตรวจสอบ 100% เมื่อพบข้อมูลไม่ถูกต้องจากการตรวจสอบสัดส่วน 2 ครั้งติดต่อกัน (3). Systematic Continuous
Sampling Plan 1 (SCSP-1) ตรวจสอบ 100% 1 ครั้ง สลับกับตรวจสอบสัดส่วน 1 ครั้ง (4). SCSP-2 ตรวจสอบ 100% หนึ่งครั้ง
สลับกับตรวจสอบสัดส่วน 2 ครั้ง กำหนดค่า i เป็น 5, 10, 15, 20 จำลองวิธีการสุ่มกับประชากรที่มีความผิดพลาดของการนำเข้าเป็น
แบบสุ่ม(Random error) และมีสัดส่วนความผิดพลาด (p) 8 ระดับ คือ 0.0034, 0.0080, 0.0130, 0.0188, 0.0254, 0.0528,
0.0670, และ 0.0822 ด้วยโปรแกรม Microsoft Office Excel 2007
ผลการศึกษา พบว่า เมื่อ p มีแนวโน้มเพิ่มขึ้น ค่าเปอร์เซ็นต์เฉลี่ยคุณภาพที่เพิ่มขึ้น (Percent Gain in Average Quality ;
PGAQ) มีแนวโน้มเพิ่มขึ้น ที่ p=0.0034 และ i=5 มีค่า PGAQ และค่าเฉลี่ยของสัดส่วน record ที่ถูกตรวจสอบ (Average Fraction
Inspection ; AFI) สูงกว่า i=10, 15, 20 และที่ p=0.0822 และ i=20 มีค่า PGAQ และค่า AFI สูงกว่า i=5, 10, 15 วิธีการสุ่ม
CSP-2 พบว่า ทุกค่า p จะมีค่า PGAQ และค่า AFI ที่มีแนวโน้มคงที่ และที่ i=5 ให้ค่า PGAQ และค่า AFI สูงกว่า i=10, 15, และ 20
วิธีการสุ่ม SCSP-1 พบว่า ทุกค่า p จะมีค่า PGAQ และค่า AFI มีแนวโน้มคงที่ โดยที่ i=5 ให้ค่า PGAQ และค่า AFI สูงกว่า i=10,
15, และ 20 และวิธีการสุ่ม SCSP-2 พบว่า ทุกค่า p จะมีค่า PGAQ และค่า AFI มีแนวโน้มคงที่ โดยที่ i=5 ให้ค่า PGAQ และค่า AFI
สูงกว่า i=10, 15, และ 20 โดยวิธีการที่ดีที่สุดค่า วิธี SCSP-1 และเป็นวิธีการที่ใช้งานง่ายและให้ประสิทธิภาพของข้อมูลหลังการสุ่ม
ตรวจสอบที่ดีที่สุด ซึ่งจากผลการศึกษาจะเห็นได้ว่าค่า PGAQ และค่า AFI มีความสอดคล้องกันในลักษณะที่เมื่อจำนวนชุดที่
ตรวจสอบมากโอกาสที่พบข้อมูลที่ไม่ถูกต้องมากขึ้น ทำให้ค่า PGAQ มีค่าสูงขึ้นจึงทำให้ประสิทธิภาพของวิธีการดีขึ้นตามไปด้วย