การเปรียบเทียบประสิทธิภาพของวิธีการสร้างแบบจำลองในการออกแบบการทดลอง ด้วยวิธีการทางสถิติและวิธีการเรียนรู้ด้วยเครื่อง

Main Article Content

จุฑามาศ จินตนา
ณฐภัทร ผดุงวิทยากร
กฤษกร อุบลศิลป์
ปฐมวรรษ วงศ์รัตนกมล
นพดล ชลอธรรม

บทคัดย่อ

วัตถุประสงค์: เพื่อเปรียบเทียบประสิทธิภาพของการสร้างแบบจำลองด้วยวิธีการวิเคราะห์ถดถอยเชิงเส้น (Linear Regression: LR) และอัลกอริทึมการเรียนรู้ด้วยเครื่อง (Machine Learning: ML) ทั้ง 4 วิธี คือ ต้นไม้การตัดสินใจ (Decision Tree: DT) ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine: SVM) เพื่อนบ้านใกล้ที่สุดแบบ k ตัว (K-Nearest Neighbor: K-NN) และโครงสร้างประสาทเทียม (Neurol Network: NN) วิธีการ: การศึกษาใช้ข้อมูลจากงานวิจัยด้านการออกแบบการทดลองทางเภสัชกรรมจำนวน 88 เรื่อง ที่เผยแพร่ระหว่างเดือนตุลาคม พ.ศ. 2564 ถึงตุลาคม พ.ศ. 2565 ผ่านการสืบค้นจากฐานข้อมูล PubMed และ Scopus จากนั้นนำข้อมูลดิบมาสร้างแบบจำลองด้วยโปรแกรม RapidMiner Studio 10 และประเมินประสิทธิภาพด้วยค่าสัมประสิทธิ์สหสัมพันธ์ยกกำลังสอง (Coefficient of Determination: R²) พร้อมทดสอบสมมติฐานด้วยสถิติ Kruskal–Wallis test ผลการศึกษา: จากการวิเคราะห์ทุกรูปแบบการทดลอง (All DOE types) พบว่า แบบจำลอง K-NN และ DT ให้ค่า R² เฉลี่ยสูงกว่า LR อย่างมีนัยสำคัญทางสถิติ ขณะที่ NN และ SVM มีประสิทธิภาพใกล้เคียงกับ DT และ K-NN แต่ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติ สำหรับ Central Composite Design แบบจำลอง K-NN, NN และ SVM มีค่า R² สูงกว่า LR อย่างมีนัยสำคัญทางสถิติ ส่วน DT มีประสิทธิภาพใกล้เคียงกับ LR โดยไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติ สำหรับ Full Factorial Design แบบจำลอง K-NN และ DT ให้ค่า R² สูงกว่า LR อย่างมีนัยสำคัญทางสถิติ และ K-NN ยังเหนือกว่า NN และ SVM ด้วย ขณะที่ NN และ SVM มีค่าใกล้เคียงกับ LR โดยไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ส่วน Mixture Design ไม่พบความแตกต่างของค่าเฉลี่ย R² อย่างมีนัยสำคัญทางสถิติ ระหว่าง LR และอัลกอริทึม ML ใด ๆ โดยรวมแบบจำลองทุกอัลกอริทึมให้ประสิทธิภาพใกล้เคียงกัน สรุป: เทคนิค ML โดยเฉพาะ K-NN, NN และ DT สามารถสร้างแบบจำลองจากข้อมูลการออกแบบการทดลองได้อย่างมีประสิทธิภาพ โดยให้ค่า R² สูงกว่าแบบจำลอง LR ในหลายประเภทของ DOE ได้แก่ All DOE types, Central Composite Design และ Full Factorial Design ขณะที่ Mixture Design ไม่พบความแตกต่างอย่างชัดเจน ซึ่งสะท้อนว่า ML มีศักยภาพในการเสริมประสิทธิภาพการวิเคราะห์ข้อมูลเชิงทดลอง และสามารถประยุกต์ใช้เป็นแนวทางในการพัฒนาแบบจำลองเพื่อการออกแบบตำรับยาในอนาคตได้อย่างมีประสิทธิผล

Article Details

ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

Montgomery DC. Design and analysis of experiments. 9th ed. Hoboken, NJ: Wiley; 2017.

International Conference on Harmonisation (ICH). ICH Q8(R2) Pharmaceutical development. Geneva: ICH; 2009.

Belda-Galbis CM, Manzanares P, Soto J, Martínez A. Application of design of experiments (DoE) for optimization of pharmaceutical formulations. Pharmaceutics. 2020; 12: 853. doi:10.3390/pharma ceutics12090853

Bouza AA, Almalki SA, Kamel FO. Design of experiments in pharmaceutical development: A systematic review of trends and applications. Eur J Pharm Biopharm. 2022; 173: 105–115. doi:10.1016/ j.ejpb.2022.02.007

Hastie T, Tibshirani R, Friedman J. The elements of statistical learning: Data mining, inference, and prediction. 2nd ed. New York: Springer; 2009.

Brownlee J. Machine learning mastery with Python. San Francisco, CA: Machine Learning Mastery; 2016.

Kuhn M, Johnson K. Applied predictive modeling. New York: Springer; 2013.

James G, Witten D, Hastie T, Tibshirani R. An introduction to statistical learning: With applications in R. 2nd ed. New York: Springer; 2021.

Fontana R, Molena A, Pegoraro L, Salmaso L. Design of experiments and machine learning with application to industrial experiments. Stat Pap 2023; 64: 1251–74.

Pestana H, Bonacin R, Rosa FF, Dametto M. A review on the use of machine learning for pharmaceutical formulations. In: Advances in Intelligent Systems and Computing. Cham: Springer; 2024. (AISC; vol. 1456).

Kolluri S, Lin J, Liu R, Zhang Y, Zhang W. Machine learning and artificial intelligence in pharmaceutical research and development: a review. AAPS J. 2022; 24: 19.

Rodriguez-Granrose D, et al. Design of experiment applied to artificial neural network architecture enables rapid bioprocess improvement. Biotechnol J 2021; 16: e2100064.

Grzesik P, Warth SC. One-time optimization of advanced T cell culture media using a machine learning pipeline. Sci Rep. 2021; 11: 24274.

Belei C, et al. Fused-filament fabrication of short carbon fiber-reinforced polyamide: Parameter optimization. Mater Today Commun. 2021; 28: 102583.

Hameg R, et al. Modeling and optimizing culture medium mineral composition for in vitro propagation of Actinidia arguta. Plant Cell Tissue Organ Cult. 2022; 150: 465–77.

Arboretti R, et al. Machine learning and design of experiments for product innovation. J Ind Eng Chem. 2022; 106: 306–16.

Reina-Romo E, et al. In silico nozzle design optimization for extrusion-based bioprinting. Biofabrication. 2022; 14: 025001.