การประเมินข้อความทวิตเตอร์ที่เกี่ยวกับทัศนคติด้านสุขภาพในสถานการณ์แพร่ระบาด ของโควิด-19 เพื่อวิเคราะห์ความรู้สึกโดยใช้อัลกอริทึมการเรียนรู้ของเครื่องแบบมีผู้สอน

Main Article Content

เทวัญ เทียนวรรณ
วีรยุทธ์ เลิศนที

บทคัดย่อ

วัตถุประสงค์: เพื่อหาโมเดลการเรียนรู้ของเครื่องแบบมีผู้สอนในการทำนายข้อความจากทวิตเตอร์ เพื่อวิเคราะห์ความคิดเห็นที่เกี่ยวข้องกับวัคซีนโควิด-19 ด้านประสิทธิภาพ อาการไม่พึงประสงค์ และความรู้สึกต่อวัคซีนแต่ละชนิดที่มีในประเทศไทย วิธีการ: ผู้วิจัยรวบรวมข้อความเกี่ยวกับวัคซีนโควิด-19 ที่มีการติดกำกับจำนวน 1,843 ข้อความ โดยแบ่งเป็นชุดข้อมูลเรียนรู้ร้อยละ 90 และชุดข้อมูลทดสอบร้อยละ 10 ผู้วิจัยลบคำหรือสัญลักษณ์ที่ไม่ต้องการออก และตัดคำในข้อความ ศึกษาการสร้างคุณลักษณะของเอกสารและเลือกคุณลักษณะด้วยวิธีเคที่ดีที่สุด การพัฒนาโมเดลการเรียนรู้ใช้โปรแกรมภาษาไพทอน (python) โดยใช้อัลกอริทึมซับพอร์ตเวกเตอร์แมกชีน ร่วมกับวิธี One-vs-Rest ในการจำแนกข้อความแบบหลายเลเบล และร่วมกับวิธี One-vs-One ในการจำแนกข้อความแบบหลายคลาส การศึกษาใช้ชุดเรียนรู้พัฒนาโมเดลด้วยวิธีการตรวจสอบไขว้ 10 ครั้ง และประเมินประสิทธิภาพด้วยค่าคะแนนไมโครเอฟวัน (micro-F1 score) แล้วปรับค่าพารามิเตอร์ของโมเดลเพื่อเพิ่มประสิทธิภาพ จากนั้นนำโมเดลที่มีประสิทธิภาพดีที่สุดมาทำนายชุดข้อมูลที่ไม่ได้ติดกำกับข้อความ ผลการวิจัย: โมเดลที่มีประสิทธิภาพมากที่สุดในการจำแนกข้อความหลายเลเบล ได้แก่ ชนิดของวัคซีน ประสิทธิภาพ และอาการไม่พึงประสงค์ของวัคซีน ด้วยชุดเรียนรู้มีคะแนน micro-F1 ร้อยละ 91.31 และชุดทดสอบได้ค่าคะแนน micro-F1 ร้อยละ 90.80  โมเดลที่ดีที่สุดสำหรับการจำแนกข้อความแบบหลายคลาส อันได้แก่ ความรู้สึก ด้วยชุดเรียนรู้ได้ค่าคะแนน micro-F1 ร้อยละ 82.20 และชุดทดสอบได้ค่าคะแนน micro-F1 ร้อยละ 81.11  เมื่อนำโมเดลมาวิเคราะห์ข้อความที่ไม่ได้ติดกำกับข้อความจำนวน 8,070 ข้อความ พบว่าโมเดลสามารถจำแนกเนื้อหาที่เกี่ยวกับชนิดของวัคซีน มีการจำแนกข้อความที่เกี่ยวกับประสิทธิภาพของวัคซีน 5,643 ข้อความ และข้อความเกี่ยวกับอาการไม่พึงประสงค์ของวัคซีน 3,255 ข้อความ โดยเป็นข้อความเชิงบวก 3,229 ข้อความ  ข้อความเชิงลบ 2,228 ข้อความ และข้อความเป็นกลาง 2,613 ข้อความ สรุป: การจำแนกประเภทข้อความที่เกี่ยวกับวัคซีนโควิดด้วยวิธีการเรียนรู้ของเครื่อง สามารถนำไปประยุกต์ใช้ในการกำหนดนโยบายทางด้านสาธารณสุข

Article Details

บท
บทความวิจัย

References

World Health Organization. Coronavirus disease (COVID-19) [online]. 2020 [cited Nov 4, 2022]. Available from: www.who.int/health-topics/coronavi rus#tab=tab_1.

Department of Disease Control, Ministry of Public Health. Thailand Covid-19 cases weekly report [online]. 2022 [cited Dec 27, 2022]. Available from: ddc.moph.go.th/covid19-dashboard/.

Department of Disease Control, Ministry of Public Health. Covid-19 protection guidance on post-pandemic phase [online] 2022. [cited Dec 28, 2022]. Available from: ddc.moph.go.th/viralpneumonia/file/ int_ protection /i nt_protection_220665.pdf.

Ministry of Public Health. Covid-19 vaccination program report (recorded at 4.00 pm. Dec 29, 2022) on Jan 3, 2023 [online]. 2023 [cited Jan 8, 2023]. Available from: ddc.moph.go.th/vaccine-covid19/get Files/10/1672906472872.pdf.

Department of Disease Control, Ministry of Public Health. Covid-19 vaccine administration practice in Thailand’s 2021 pandemic situation. 2nd ed Samut Prakan: TS Interprint; 2021.

Food and Drug Administration. Press Release: Thai FDA as approved 6 covid-19 vaccines as WHO [online]. 2021 [cited Dec 28, 2022] Available from: www.prd.go.th/th/file/get/file/2021072366bfac34425915e905a1c1c8aa45c654103208.pdf.

Department of Disease Control, Ministry of Public Health. Definition of adverse event following immuni- zation and vaccine administration guidance by panel of experts [online]. 2021 [cited Dec 28, 2022]. Available from: ddc.moph.go.th/vaccine-covid19/get Files/12/1620107182946.pdf.

Payaprom Y, Tantipong H, Manasatchakun P, Chan deekeawchakool S and Khamchai S. COVID-19 vaccine acceptance from the perspective of people living in northern Thailand: a mixed methods research. Nursing Journal. 2022; 49: 41-54.

Reveilhac M, Steinmetz S, Morselli D. A systematic literature review of how and whether social media data can complement traditional survey data to study public opinion. Multimed Tools Appl 2022; 81: 10107-42.

Kwak H, Lee C, Park H, Moon S. In: Rappa M. editor. What is Twitter, a social network or a news media? In proceedings of the 19th international conference on world wide web. 2010 Apr 26-30; Raleigh, North Carolina. New York: Association for Computing Machinery; 2010. p.591–600.

Electronic Transactions Development Agency, Ministry of Digital Economy and Society. Thailand internet user behavior 2022 [online] 2022 [cited Jan 15, 2023]. Available from: www.etda.or.th/ getattach ment/78750426-4a58-4c36-85d3-d1c11c3db1f3/IU B-65-Final.pdf.aspx.

Drus Z, Khalid H. Sentiment analysis in social media and its application: systematic literature review. Procedia Comput Sci 2019; 16: 707-14.

Giustini D, Ali SM, Fraser M, Kamel Boulos MN. Effective uses of social media in public health and medicine: a systematic review of systematic reviews. Online J Public Health Inform 2018; 10: e215. doi: 10.5210/ojphi.v10i2.8270.

Sinnenberg L, Buttenheim AM, Padrez K, Manche- no C, Ungar L, Merchant RM. Twitter as a tool for health research: a systematic review. Am J Public Health. 2017; 107: e1-8. doi.org/10.2105/AJPH.2016 .30 3512.

Liu S, Liu J. Public attitudes toward COVID-19 vac- cines on English-language Twitter: a sentiment analysis. Vaccine 2021; 39: 5499-505.

Sattar NS, Arifuzzaman S. COVID-19 vaccination awareness and aftermath: public sentiment analysis on Twitter data and vaccinated population prediction in the USA. Appl Sci 2021; 11: 6128. doi:10.3390/ app11136128.

Zunic A, Corcoran P, Spasic I. Sentiment analysis in health and well-being: systematic review. JMIR Med Inform 2020; 8: e16023. doi:10.2196/16023.

Sanguansat P. Artificial intelligence with machine learning: AI built by machine learning. Bangkok: ICD Premiere; 2019.

Chang CC, Lin CJ. LIBSVM: a library for support vector machines. ACM Trans Intell Syst Technol 2011; 2: 1-27. doi:10.1145/1961189.1961199.

Yenkar P, Sawarkar S. An incremental model for multi-label classification of tweets based on label co-occurrence. In processing of the third international conference on inventive research in computing applications. 2021 Sep 2-4; Coimbatore, India. New York: IEEE; 2021. p.786-93.

Amjad A, Qaiser S, Anwar A, Ijaz ul H, Ali R. Analysing public sentiments regarding COVID-19 vaccines: a sentiment analysis approach. In proceeding of the IEEE international smart cities conference. 2021 Sep 7-10; Manchester. UK. New York: IEEE; 2021. p. 1-7.

Twitter. Twitter API. [online]. 2020. [cited Dec 8, 2022]. Available from: developer.twitter.com/en/docs /twitter-api

GitHub. Just another archivist/snscrape [online]. 2021. [cited Dec 14, 2022]. Available from: github. com/JustAnotherArchivist/snscrape.

Bogatinovski J, Todorovski L, Džeroski S, Kocev D. Comprehensive comparative study of multi-label classification methods. Expert Syst Appl 2022; 203: 117215. doi: 10.1016/j.eswa.2022.117215

Xiao Y, Liu Y, Deng Y, Li H. Enhancing multi-class classification in one-versus-one strategy: a type of base classifier modification and weighted voting mechanism. In proceeding of the international conference on communications, Information System and Computer Engineering (CISCE). 2021 May 14-16; Beijing. China. New York: IEEE; 2021. p. 303-7.

Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics. 1977; 33: 159-74.

Kittinaradorn R., Achakulvisut T., Chaovavanich K., Srithaworn K., Chormai P., Kaewkasi C., Ruangrong T., Oparad K. DeepCut: a Thai word tokenization library using deep neural network [online] 2019. [cited Dec 30, 2022]. Available from: doi.org/10.5281 /zenodo.3457707.

Phatthiyaphaibun W, Chaovavanich K, Polpanumas C, Suriyawongkul A, Lowphansirikul L, Chormai P. PyThaiNLP: Thai natural language processing in python [online] 2016. [cited Dec 30, 2022]. Available from: doi.org/10.5281/zenodo.3519354.

Havrlant L, Kreinovich V. A simple probabilistic explanation of term frequency-inverse document frequency (tf-idf) heuristic (and variations motivated by this explanation). Int J Gen Syst 2017; 46: 27-36.

Tang J, Alelyani S, Liu H. Feature selection for classification: a review. In: Aggarwal CC, editor. Data classification: algorithms and applications. New York: CRC Press; 2014. p. 37-64.

Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, et al. Scikit-learn: Machine learning in python. J Mach Learn Res 2011; 12: 2825-30.

Cervantes J, Garcia-Lamont F, Rodríguez-Mazahua L, Lopez A. A comprehensive survey on support vector machine classification: applications, challenges and trends. Neurocomputing 2020; 408: 189-215.

Kalcheva N, Karova M, Penev I. Comparison of the accuracy of SVM kernel functions in text classi- fication. In: Markova V, Ganchev T, editors. BIA 2020: Proceeding of the international conference on biomedical innovations and applications. 2020 Sep 24-27; Varna, Bulgaria. New York: IEEE; 2020. p. 141-5.

Department of Disease Control, Ministry of Public Health. Thailand Covid-19 cases weekly report [online]. 2023 [cited March 18, 2023]. Available from: ddc.moph.go.th/vaccine-covid19/pages/รายงานความ ก้าวหน้าการให้บริการฉีดวัคซีนโควิด-19.

Wu N, Joyal-Desmarais K, Ribeiro PAB, Vieira AM, Stojanovic J, Sanuade C, et al. Long-term effective ness of COVID-19 vaccines against infections, hospitalisations, and mortality in adults: findings from a rapid living systematic evidence synthesis and meta-analysis up to December, 2022. Lancet Respir Med. 2023; 11: 439-452. doi:10.3389/fpubh.2022.10 0852.

Al-Momani H, Aldajah K, Alda'ajah E, Y AL, Abusha wer Z. Effectiveness of Pfizer/BioNTech and Sino pharm COVID-19 vaccines in reducing hospital admissions in prince Hamza hospital, Jordan. Front Public Health. 2022; 10: 1008521. doi:10.3389/fpubh .2022.1008521.

McMenamin ME, Nealon J, Lin Y, Wong JY, Cheung JK, Lau EHY, et al. Vaccine effectiveness of one, two, and three doses of BNT162b2 and CoronaVac against COVID-19 in Hong Kong: a population-based observational study. Lancet Infect Dis. 2022; 22: 1435-43.

Hearst MA, Pedersen E, Patil L, Lee E, Laskowski P, Franconeri S. An Evaluation of semantically grouped word cloud designs. IEEE Trans Vis Comput Graph. 2020; 26: 2748-61.

Omar A, Mahmoud TM, Abd-El-Hafeez T, Mahfouz A. Multi-label Arabic text classification in online social networks. Inf Syst 2021; 100: 101785. doi:10.1016/j.is.2021.101785

Lian AT, Du J, Tang L. Using a machine learning approach to monitor COVID-19 vaccine adverse events (VAE) from Twitter data. Vaccines (Basel). 2022; 10: 103. doi:10.3390/vaccines10010103