การพยากรณ์การเกิดพายุฝนฟ้าคะนองระยะปัจจุบัน ด้วยเทคนิคการเรียนรู้ของเครื่อง กรณีศึกษาสนามบินภาคเหนือของประเทศไทย
คำสำคัญ:
พายุฝนฟ้าคะนอง, พยากรณ์อากาศระยะปัจจุบัน, การเรียนรู้ของเครื่อง, แบบจำลองการจำแนก, อัลกอริทึมการเรียนรู้แบบกลุ่มบทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อ (1) สร้างแบบจำลองในการพยากรณ์การเกิดพายุฝนฟ้าคะนองระยะปัจจุบัน และ (2) ประเมินประสิทธิภาพของแบบจำลองในการพยากรณ์การเกิดพายุฝนฟ้าคะนองระยะปัจจุบัน ที่มีระยะเวลาพยากรณ์ 1 และ 2 ชั่วโมงข้างหน้า สำหรับสนามบินภาคเหนือของประเทศไทยด้วยเทคนิคการเรียนรู้ของเครื่อง โดยชุดข้อมูลนำเข้า คือ ข่าวอากาศการบินของสนามบินในพื้นที่ภาคเหนือจำนวน 9 สนามบินที่มีการรายงานข่าวอากาศการบินรายชั่วโมงโดยกรมอุตุนิยมวิทยา ระหว่างเดือนมกราคม พ.ศ. 2558 ถึงเดือนธันวาคม พ.ศ. 2565 รวมทั้งสิ้น 364,382 ชุดข้อมูล และทำการแบ่งข้อมูลทั้งหมดออกเป็น 5 กลุ่มข้อมูล คือ กลุ่มข้อมูลรวมสนามบินภาคเหนือ กลุ่มข้อมูลสนามบินภาคเหนือตอนบน กลุ่มข้อมูลสนามบินภาคเหนือตอนล่าง กลุ่มข้อมูลสนามบินที่มีภูเขาล้อมรอบ 1-2 ด้าน และกลุ่มข้อมูลสนามบินที่มีภูเขาล้อมรอบ 3-4 ด้าน โดยพยากรณ์การเกิดพายุฝนฟ้าคะนองระยะปัจจุบันด้วยเทคนิคการเรียนรู้ของเครื่อง และสร้างแบบจำลองการจำแนกด้วยอัลกอริทึมมาตรฐาน 3 อัลกอริทึม ได้แก่ Naive Bayes Decision Tree และ Neural Networks และอัลกอริทึมมาตรฐานร่วมกับอัลกอริทึมการเรียนรู้แบบกลุ่ม ซึ่งได้แก่ Bagging AdaBoost และ Random Forest และทำการปรับความสมดุลของข้อมูลด้วยเทคนิคการสุ่มตัวอย่างเกิน SMOTE และเปรียบเทียบประสิทธิภาพของแบบจำลองด้วยวิธี 10-Fold Cross Validation ผลการวิจัยพบว่า แบบจำลองที่ดีที่สุดสำหรับกลุ่มข้อมูลรวมสนามบินภาคเหนือ ระยะเวลาการพยากรณ์ 1 ชั่วโมงข้างหน้า คือ Random Forest โดยมีค่า F-measure เท่ากับร้อยละ 76.45 และค่าพื้นที่ใต้กราฟเท่ากับ 0.888 และสำหรับระยะเวลาการพยากรณ์ 2 ชั่วโมงข้างหน้า คือ Neural Networks ร่วมกับ Bagging โดยมีค่า F-measure เท่ากับร้อยละ 30.62 และค่า AUC เท่ากับ 0.746
References
Aeronautical Meteorology Division. (2015). Meteorological messages for aviation and dissemination. Retrieved from http://www2.aeromet.tmd.go.th/KnowledgeNews1.php
Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16(2002), 321-357. https://doi.org/10.1613/jair.953
Chen, H., Li, T., Fan, X., & Luo, C. (2019). Feature selection for imbalanced data based on neighborhood rough sets. Information Sciences, 483(2019), 1-20. https://doi.org/10.1016/j.ins.2019.01.041
Dey, I., & Pratap, V. (2023). A Comparative Study of SMOTE, Borderline-SMOTE, and ADASYN Oversampling Techniques using Different Classifiers. Proceeding of 2023 3rd International Conference on Smart Data Intelligence (pp. 294-302). Trichy, India: ICSMDI.
Environment and Pollution Control Office 2. (2021). Analysis of area potential to support water pollution risks in 17 provinces of the northern region. Retrieved from https://shorturl.asia/yEVaS
Gupta, V., Mishra, V. K., Singhal, P., & Kumar, A. (2022). An overview of supervised machine learning algorithm. Proceeding of International Conference on System Modeling & Advancement in Research Trends (pp. 87-92). Moradabad, India: IEEE.
Jantarakongkul, B., Rasmequan, S., Rimcharoen, S., Kulkasem, P., Chinnasarn, K., Rodtook, A., Vorraboot, P., & Onpans, J. (2014). Optimal methods for classification of highly imbalanced datasets (Research report). Bangkok: National Research Council of Thailand (NRCT). (in Thai)
Khunsuk, T., & Thongkam, J. (2020). Feature selection method for improving customer reviews classification. RMUTI Journal Science and Technology, 13(1), 129-143. (in Thai)
Lamprakhon, B. (2017). A proposed method to compare areas under the roc curves for a single dataset: A case study of credit scoring model (Master’s thesis). Chulalongkorn University. Bangkok. (in Thai)
Manokij, F. (2019). Thailand’s precipitation forecasting using deep learning approach model (Master’s thesis). Chulalongkorn University. Bangkok. (in Thai)
Moon, S. H., Kim, Y. H., Lee, Y. H., & Moon, B. R. (2019). Application of machine learning to an early warning system for very short-term heavy rainfall. Journal of Hydrology, 568(2019), 1042-1054. https://doi.org/10.1016/j.jhydrol.2018.11.060
Nasritha, K., Kerdprasop, K., & Kerdprasop, N. (2018). Comparison of sampling techniques for imbalanced data classification. Journal of Applied Informatics and Technology, 1(2018), 20-37. https://doi.org/10.14456/jait.2018.2 (in Thai)
Northern Met Center. (2023). Today forecast. Retrieved from http://www.cmmet.tmd.go.th/forecast/todayforecast.jpg (in Thai)
Phaeobang, A., & Sinsomboonthong, S. (2019). Adjusting the imbalanced data with 5 classification methods. Thai Journal of Science and Technology, 9(4), 418–435. https://doi.org/10.14456/tjst.2020.46 (in Thai)
Promla, P., & Sanrach, C. (2020). The comparison of efficiency on the analysis of satisfaction on teaching performance using sentiment analysis by ensemble technique. KKU Research Journal (Graduate Studies), 20(4), 140-149. (in Thai)
Senawong, N., Wichitchan, S., & Kumphon, O. (2022). Large-scale data classification based on K-means clustering and deep learning. The Journal of King Mongkut’s University of Technology North Bangkok, 32(4), 957-965. (in Thai)
Sridee, A. (2021). Applying machine learning techniques to detect failure in hard disk drive test process (Master’s thesis). Chulalongkorn University. Bangkok. (in Thai)
Srithagon, S. (2021). Rainfall nowcasting using learning machines based on rain gauge data in Bangkok Metropolis (Master’s thesis). Kasetsart University. Bangkok. (in Thai)
Tanwanon, P., Yingsayree, C., Pongphet, W., & Kangkajit, T. (2017). Predict stock price trends in stock exchange of Thailand using ensemble model. Journal of information Science and Technology, 7(1), 12-21. https://doi.org/10.14456/jist.2017.2 (in Thai)
Thai Meteorological Department. (2023). Meteorological knowledge. Retrieved from https://www.tmd.go.th/info/การพยากรณอากาศ-1
Thummikarat, H. (2020). Parkinson’s disease diagnosis using machine learning (Master’s thesis). Chulalongkorn University. Bangkok. (in Thai)