การพยากรณ์ภาวะการมีงานทำของบัณฑิตด้วยเทคนิคการจำแนกข้อมูลด้วยกฎร่วมกับวิธีการสุ่มเพิ่มตัวอย่างกลุ่มน้อยบนชุดข้อมูลที่ไม่สมดุล

ผู้แต่ง

  • ภรัณยา ปาลวิสุทธิ์ สาขาวิชาวิทยาการข้อมูล คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราขภัฏนครปฐม
  • อภินันท์ จุ่นกรณ์ สาขาวิชาวิทยาการข้อมูล คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราขภัฏนครปฐม
  • มงคล รอดจันทร์ สาขาวิชาเทคโนโลยีคอมพิวเตอร์ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราขภัฏนครปฐม
  • ประภาพรรณ เพียรชอบ สาขาวิชาวิทยาศาสตร์และเทคโนโลยีการอาหาร คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราขภัฏนครปฐม

คำสำคัญ:

ภาวะการมีงานทำของบัณฑิต, การจำแนกข้อมูลด้วยกฎ, การสุ่มเพิ่มตัวอย่างกลุ่มน้อย

บทคัดย่อ

การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อศึกษาและเปรียบเทียบเทคนิคการพัฒนาแบบจำลองการพยากรณ์ภาวะการมีงานทำของบัณฑิตด้วยเทคนิคการจำแนกข้อมูลด้วยกฎร่วมกับวิธีการสุ่มเพิ่มตัวอย่างกลุ่มน้อยบนชุดข้อมูลที่ไม่สมดุล ผลจากการวิเคราะห์ข้อมูลพบว่า ข้อมูลมีความไม่สมดุลของกลุ่มข้อมูล โดยมีจำนวนกลุ่มหนึ่งมากกว่าอีกกลุ่มหนึ่งเป็นจำนวนมาก ผู้วิจัยจึงได้ทำการแก้ปัญหาโดยปรับความสมดุลของข้อมูลด้วยวิธีเทคนิคการสุ่มเพิ่มตัวอย่างกลุ่มน้อย (Synthetic Minority Over-sampling Technique--SMOTE) แล้วพัฒนาตัวแบบด้วยเทคนิคการจำแนกข้อมูลด้วยกฎ ได้แก่ RIPPER PART และ PRISM โดยใช้ 5-fold cross validation ในการแบ่งข้อมูลออกเป็นชุดข้อมูลสอนและชุดข้อมูลทดสอบ และได้ใช้ค่าความถูกต้อง (accuracy) ค่าความแม่นยำ (precision) ค่าความระลึก (recall) และค่าความเหวี่ยง (F-measure) ในการวัดประสิทธิภาพการพยากรณ์ของตัวแบบ ผลการทดลองประสิทธิภาพในการพยากรณ์ของตัวแบบ พบว่า ตัวแบบที่ได้จากอัลกอริทึม PRISM ร่วมกับการปรับสมดุลข้อมูลด้วยวิธี SMOTE มีประสิทธิภาพสูงที่สุด โดยมีค่าความถูกต้อง เท่ากับร้อยละ 85.69 ค่าความแม่นยำเท่ากับร้อยละ 85.60 ค่าความระลึกเท่ากับร้อยละ 85.70 และค่าความเหวี่ยงเท่ากับร้อยละ 85.60 ตามลำดับ

References

Amphawan, K. (2022). Data mining. Retrieved from https://staff.informatics.buu.ac.th/~komate/886464/%5B6%5D-Classification.pdf. (in Thai)

Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmayer, W. P., (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligent Research, 16(2002), 321-357. https://doi.org/10.1613/jair.953

Chinjoho, P., Jabjone S., & Jongmuanwai, B. (2021). Developing information technology model into future careers forecast of graduate information technology major in Nakhonratchasima Rajabhat University. Journal of Technology Management Rajabhat Maha Sarakham University, 8(2), 20–32. (in Thai)

Chiroma, F., Liu, H., & Cocea, M. (2018). Suiciderelated text classification with prism algorithm. 2018 International Conference on Machine Learning and Cybernetics (ICMLC), Chengdu, China, 2018, (pp. 575-580). China: IEEE. doi: 10.1109/ICMLC.2018.8527032.

Hevo Data Inc. (2024). Rule based data mining classifier: A comprehensive guide 101. Retrieved from https://hevodata.com/learn/rule-based-data-mining/

Li, X., & Liu, B. (2014). Rule-based classification. Retrieved from https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=8557fde1e865f0dcc209468ccaf94f12a04b7835.

Kijsirikul, B. (2002). Data mining algorithm. Bangkok: Department of Computer Engineering, Faculty of Engineering, Chulalongkorn University, Thailand. (in Thai)

Kladkaew, S. (2014). Decision support systems for selecting careers in accordance with the ability of the graduates (Master’s thesis). Ramkhamhaeng University. Bangkok (in Thai)

Markoulidakis, J., Rallis, I., Georgoulas, I., Kopsiaftis, G., Doulamis, A., & Doulamis, N. (2021). Multiclass confusion matrix reduction method and Its application on net promoter score classification problem. Technologies 2021, 9, 81. doi: 10.3390/technologies9040081

Mohamed, W. N. H. W., Salleh, M. N. M., & Omar, A. H. (2012). A comparative study of reduced error pruning method in decision tree algorithms. 2012 IEEE International Conference on Control System,Computing and Engineering, Penang, Malaysia, 2012 (pp. 392-397). Malaysia: IEEE. doi: 10.1109/ICCSCE.2012.6487177.

Thakur, S. (2020). Detection of malicious URLs in big data using RIPPER algorithm. International Journal of Creative Research Thoughts (IJCRT), 8(4), 767-771. https://ijcrt.org/papers/IJCRT2004096.pdf

Vilailuck, S., Jaroenpuntaruk, V., & Wichadakul, D. (2015). Utilizing data mining techniques to forecast student academic achievement of Kasetsart University Laboratory School Kamphaeng Saen Campus Educational Research and Development Center. Veridian E-Journal, Science and Technology Silpakorn University, 2(2), 1-17. (in Thai)

Wanon, S., Arreerard T., & Sanrach, C. (2018). A study of techniques in predicting career counseling for undergraduate students of the computer program by using data mining technique. Journal of Technology Management Rajabhat Maha Sarakham University, 5(1), 164–171. (in Thai)

Downloads

เผยแพร่แล้ว

2024-04-26