การศึกษาข้อความในคลังข้อมูลการเกษตรสำหรับประยุกต์ใช้กับการประมวลผลคำตอบด้านการเกษตรของระบบถาม-ตอบอัตโนมัติ
คำสำคัญ:
ข้อความ, คลังข้อมูล, การประมวลผลของระบบถาม-ตอบอัตโนมัติบทคัดย่อ
งานวิจัยนี้มุ่งศึกษารูปแบบโครงสร้างของบทความด้านการเกษตรและการเชื่อมโยงความ รวมทั้งชุดคำบ่งชี้เพื่อใช้ในการตอบคำถามสำหรับระบบถาม-ตอบภาษาไทย ข้อมูลที่ใช้ในการศึกษาวิเคราะห์นำมาจากบทความในคลังข้อมูลการเกษตรแห่งชาติจำนวนทั้งสิ้น 95 บทความ การวิเคราะห์ข้อมูลประยุกต์ใช้ทฤษฎีโครงสร้าง ความของ Halliday and Hasan (1985) และการเชื่อมโยง ความของ Halliday and Hasan (1976)
ผลการศึกษาพบว่าโครงสร้างของบทความด้านการเกษตรประกอบด้วย 7 องค์ประกอบ คือ (1) หัวเรื่อง (2) เกริ่นนำ (3) ส่วนประกอบ (4) วิธีทำ (5) การนำไปใช้ (6) ประโยชน์และ (7) การจบ จำนวนรูปแบบโครงสร้างมี17 รูปแบบ การเชื่อมโยงความ ประกอบด้วยการอ้างอิงแบบปรากฏรูป แบบไม่ปรากฏรูป และการใช้คำเชื่อม ส่วนชุดคำบ่งชี้เพื่อใช้ในการสกัดคำตอบมีจำนวน 5 ชุด แบ่งตามประเภทของคำถาม 5 ประเภท ประกอบด้วย คำถามประเภทถามวิธีการ เวลา สถานที่ บุคคล และการแจกแจง ทั้งนี้ผลการศึกษารูปแบบโครงสร้างการเชื่อมโยงความชุดคำบ่งชี้เหล่านี้มีความสัมพันธ์กับโครงสร้างของบทความและการเชื่อมโยงความอันจะเป็นประโยชน์ต่อผู้พัฒนาระบบถาม-ตอบอัตโนมัติ
References
กมลวรรณ โพธิ์สาย. (2552). การวิเคราะห์หาความหมายแฝงและการเรียนรู้เครื่องจักรสำหรับระบบถามตอบอัตโนมัติภาษาไทย. วิทยานิพนธ์วิทยาศาสตร์มหาบัณฑิต สาขาวิทยาการคอมพิวเตอร์ มหาวิทยาลัยธรรมศาสตร์.
จิรวรรณ เจริญสุข. (2549). การแบ่งขอบเขตอนุพากย์ปริจเฉทในภาษาไทยโดยใช้คำระบุนัย และข้อสนเทศเชิงวากยสัมพันธ์. วิทยานิพนธ์วิศวกรรมศาสตร์มหาบัณฑิต สาขาวิศวกรรมคอมพิวเตอร์มหาวิทยาลัยเกษตรศาสตร์.
ฉวีวรรณ เพ็ชรศิริ. (2553). การสกัดความรู้เกี่ยวกับสรรพคุณทางยาของพืชสมุนไพรไทยจากเอกสารภาษาไทยเพื่อสนับสนุนการตอบคำถามอัตโนมัติ. รายงานการวิจัยมหาวิทยาลัยธุรกิจบัณฑิตย์.
ชญานุตย์ จินดารักษ์. (2546). การเชื่อมโยงความในจารึกล้านนา. วิทยานิพนธ์ศิลปศาสตร์มหาบัณฑิต สาขาจารึกภาษาไทย. มหาวิทยาลัยศิลปากร.
พรศิริ ตันติจิตจารุ. (2548). การเชื่อมโยงความในหมายรับสั่งสมัยกรุงธนบุรีและสมัยรัชกาลที่ 1. วิทยานิพนธ์ศิลปศาสตร์มหาบัณฑิต สาขาจารึกภาษาไทย มหาวิทยาลัยศิลปากร.
ยุทธศักดิ์ วุฒิกร และคณะ. (2553). การขยายฐานความรู้แบบอัตโนมัติสําหรับระบบถาม-ตอบโดยใช้ความหมายของประโยค. วารสารรวมบทความการประชุมวิชาการระดับชาติด้านคอมพิวเตอร์และเทคโนโลยีสารสนเทศ ครั้งที่ 6. 940-945.
ราชวิทย์ ทิพย์เสนา และคณะ. (2557). การจําแนกกลุ่มคําถามอัตโนมัติบนกระดานสนทนา โดยใช้เทคนิคเหมืองข้อความ. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยมหาสารคาม. 33(5), 493-502.
ฤทธิ์ดำรง มงคลสรรพ์. (2547). การเชื่อมโยงความในภาษาถิ่นเหนือ อำเภอแจ้ห่ม จังหวัดลำปาง.วิทยานิพนธ์ศิลปศาสตร์มหาบัณฑิต สาขาจารึกภาษาไทย มหาวิทยาลัยศิลปากร.
วรวรรธน์ ศรียาภัย. (2544). การเชื่อมโยงความในภาษาถิ่นสุราษฎร์ธานี. วิทยานิพนธ์ศิลปศาสตร์มหาบัณฑิต สาขาจารึกภาษาไทย มหาวิทยาลัยศิลปากร.
วิยะดา ตานี. (2544). การเชื่อมโยงความในจารึกสุโขทัย. วิทยานิพนธ์ศิลปศาสตร์มหาบัณฑิต สาขาจารึกภาษาไทย มหาวิทยาลัยศิลปากร.
สิงห์ทัย สุขสว่างโรจน์. (2557). ระบบถาม-ตอบภาษาไทยเพื่อสนับสนุนการตัดสินใจของนักศึกษามหาวิทยาลัยรามคำแหง. สารนิพนธ์วิทยาศาสตร์มหาบัณฑิต สาขาระบบสนับสนุนการตัดสินใจ มหาวิทยาลัยรามคำแหง.
สุชาดา เจียพงษ์. (2553). การศึกษาเปรียบเทียบคำบุรุษสรรพนามในภาษาไทย 4 ถิ่น. วิทยานิพนธ์อักษรศาสตร์ดุษฎีบัณฑิต สาขาภาษาไทย คณะอักษรศาสตร์ มหาวิทยาลัยศิลปากร.
สุพจน์ บัวเลิง และวรารัตน์ สงฆ์แป้น. (2557). การแยกกลุ่มคำถามเพื่อค้นหาคำตอบโดยใช้เว็บเชิงความหมาย และการทําเหมืองข้อมูล. วารสารรวมบทความการประชุมวิชาการระดับชาติด้านคอมพิวเตอร์และเทคโนโลยีสารสนเทศ ครั้งที่ 10. 101-108.
อัศนีย์ ก่อตระกูลและคณะ. (2541). การประมวลผลภาษามนุษย์ด้วยคอมพิวเตอร์. วารสารมนุษย์ศาสตร์. 6(1), 1-12.
Castagnola.(2002).Anaphora Resolution for Question Answering. Master of Engineering in Electrical Engineering and Computer Science. Massachusetts Institute of Technology
Cooper, R. J. and S. M. Ruger. (2000). "A Simple Question Answering System". In Proceedings of the 9 Text Retrieval Conference (TREC'00). 251-257.
Danilo, T.D. 2008. "The Discourse of Print Advertising in the Philippines: Generic Structures and Linguistic Features". In Proceeding of 22 Pacific Asia Conference on Language, Information and Computation (PACLIC). 1-15.
Deepa Yogish et al. 2016. A Survey of Intelligent Question Answering System Using NLP and Information Retrieval Techniques. International Journal of Advanced Research in Computer and Communication Engineering. 5(5),536-540
Halliday, M.A.K and Hasan.R. (1985). Language, Context, and Text: Aspects of Language in a Social-Semiotic Perspective. Oxford University Press.
_____. (1976). Cohesion in English. London, Longman.
Inya, O. (2010). Discourse Structure and Pragmatic Acts in Christian Apologetic Discourse. Master of Arts Thesis. Federal Univer sity of Technology, Akure.
Kawtrakul, A.et al. (2002). "A State of the Art of Thai Language Resources and Thai Language Behavior Analysis and Modeling". In Proceedings of the International Conference on Natural Language Processing.Post COLING 2002 Workshop.Taipei, Taiwan.1-8.
Olagunju, S. 2015. Generic Structure Potential of Football Matches in Newspaper Reporting. IOSR Journal of Humanities and Social Science (IOSR-JHSS). 20(3), 38-50.
Patpong, P. (2009). "An Analysis of Generic Structure Potential of Some Selected Austroasiatic Folktales: A Preliminary Report". The 4 International Conference on Austroasiatic Linguistics (ICAAL 4), Research Institute for Languages and Cultures of Asia Mahidol University Thailand
Patpong, P. (2011). "A Generic Structure Potential Analysis of A Generic Structure Potential Analysis of Thai Song Dam Folktales Thai Song Dam Folktales". Presented at 21 Annual Conference of Southeast Asian Linguistics Society. Kasetsart University Thailand.
Sungkaman. (2016). "The Study of Korean Series Synopsis Structure: Discourse Analysis".In Proceeding of the 4 International Joint Conference on Korean Studies and Thai Studies. 184-191.
Srihari, R. and Li, W. (2010). "A Question Answering System Supported by Information Extraction". In Proceedings of the Sixth Conference on Applied Natural Language Processing.166-172.
Wee, S.C. (2009). Newspaper reporting of SARS in Singapore: A Systemic Functional Approach. Ph.D.dissertation, National University of Singapore.
Yamane, T. (1973). Statistic: An Introductory Analysis. 3 ed. New York , Harper and Row.