ความถูกต้องของข้อมูลทะเบียนมะเร็งไทยเมื่อใช้การเชื่อมโยงข้อมูลแบบความน่าจะเป็น
Main Article Content
บทคัดย่อ
วัตถุประสงค์: เพื่อสร้างและทดสอบโมเดลการเชื่อมโยงข้อมูลในทะเบียนมะเร็งไทยและข้อมูลจากฐานข้อมูลโรงพยาบาลตติยภูมิแห่งหนึ่งด้วยหลักความน่าจะเป็น และเพื่อทดสอบความถูกต้องของข้อมูลทะเบียนมะเร็งไทยจากการใช้วิธีการดังกล่าว วิธีการ: การศึกษาเชื่อมโยงข้อมูลทั้งสองแหล่งโดยใช้หมายเลขอ้างอิงที่เข้ารหัสใหม่ ด้วยการเชื่อมโยงแบบกำหนดตายตัวแบบหนึ่งต่อหนึ่ง และการเชื่อมโยงแบบความน่าจะเป็นจำนวน 17 โมเดล แต่ละโมเดลประกอบด้วยตัวแปรที่เป็นตัวระบุ (identifier) และไม่ใช่ตัวระบุ (non-identifiers) ได้แก่ หมายเลขประจำตัวอ้างอิง หมายเลขโรงพยาบาลอ้างอิง ชื่อ นามสกุล ที่อยู่ที่ติดต่อได้ วันที่เกิด วันที่เสียชีวิต รหัสจังหวัดที่อยู่ตามทะเบียนบ้านออกโดยกรมการปกครอง เพศ และรหัสการวินิจฉัยโรค โดยเลือกมาจำนวน 3-8 ตัวแปรเพื่อสร้างแต่ละโมเดล พร้อมกำหนดค่าคะแนนจุดตัดคะแนนที่เหมาะสม ผลการวิจัย: ฐานข้อมูลทั้งสองมีผู้ป่วยจำนวน 7,243 รายที่ตรงกัน คิดเป็นร้อยละ 89.72 จากผู้ป่วยในฐานข้อมูลทะเบียนมะเร็งไทยทั้งหมด 8,073 คน หรือร้อยละ 36.72 ของผู้ป่วยจากฐานข้อมูลทั้งสองรวม 19,725 ราย ทุกโมเดลของการเชื่อมโยงแบบความน่าจะเป็นให้ค่าพยากรณ์ผลบวกร้อยละ 99.83-99.94 ค่าพยากรณ์ผลลบร้อยละ 97.04-99.98 ค่าความไวร้อยละ 94.74-99.97 และค่าความจำเพาะร้อยละ 99.90-99.97 สรุป: การเชื่อมโยงข้อมูลมะเร็งจากสองฐานข้อมูลโดยใช้การเชื่อมโยงแบบความน่าจะเป็นทำให้พบผู้ป่วยที่ตรงกันมากขึ้น จึงเหมาะสมกับการใช้ในงานใด ๆ หรืองานวิจัยที่ข้อมูลมีการปกปิดตัวตนและการรักษาความลับมีความสำคัญ อย่างไรก็ตามความถูกต้องของโมเดลที่ใช้การเชื่อมโยงข้อมูลแบบความน่าจะเป็นนั้นขึ้นอยู่กับการเลือกตัวแปรที่ใช้ในโมเดลเป็นหลัก ดังนั้นนักวิจัยควรพิจารณาเลือกตัวแปรที่ใช้ในสมการทำนายอย่างรอบคอบ
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
ผลการวิจัยและความคิดเห็นที่ปรากฏในบทความถือเป็นความคิดเห็นและอยู่ในความรับผิดชอบของผู้นิพนธ์ มิใช่ความเห็นหรือความรับผิดชอบของกองบรรณาธิการ หรือคณะเภสัชศาสตร์ มหาวิทยาลัยสงขลานครินทร์ ทั้งนี้ไม่รวมความผิดพลาดอันเกิดจากการพิมพ์ บทความที่ได้รับการเผยแพร่โดยวารสารเภสัชกรรมไทยถือเป็นสิทธิ์ของวารสารฯ
References
Maruekhatat R. Data linking techniques and privacy protection. Journal of King Mongkut's University of Technology North Bangkok 2007;17: 80-5.
WHO. Cancer fact sheet [online]. 2021 [cited April 22, 2022]. Available from: www.who.int/en/news-room/fact-sheets/detail/cancer.
Ministry of Public Health. Cancer in Thailand [online]. 2021 [cited April 22, 2022]. Available from: www .nci.go.th/e_book/cit_x/index.html.
Ministry of Public Health. Definition of key perfor- mance indicator for service plan of cancer 2017-2022 [online]. 2017 [cited April 22, 2022]. Available from: tcb.nci.go.th/CWEB/files/ServicePlan61.pdf.
National Cancer Institute. Cancer registry manual in Thailand. Bangkok: Information Technology Division, National Cancer Institute; 2015.
Merriel SWD, Turner EL, Walsh E, Young G, Metcalfe C, Hounsome L, et al. Validation of the National Cancer Registration and analysis service prostate cancer registry with data from the CAP study. Lancet 2016; 388: S77. DOI: https://doi.org/10.1016/S0140-6736(16)32313-3.
Margulis AV, Fortuny J, Kaye JA, Calingaert B, Reynolds M, Plana E, et al. Validation of cancer cases using primary care, cancer registry, and hospitalization data in the United Kingdom. Epidemio logy 2018; 29: 308-13. DOI: 10.1097/EDE.00000000 00000786
Creighton N, Walton R, Roder D, Aranda S, Currow D. Validation of administrative hospital data for identi fying incident pancreatic and periampullary cancer cases: a population-based study using linked cancer registry and administrative hospital data in New South Wales, Australia. BMJ open. 2016; 6: e0111 61. DOI: 10.1136/bmjopen-2016-011161.
Dusetzina SB, Tyree S, Meyer AM, Meyer A, Green L, Carpenter WR. AHRQ methods for effective health care. Rockville, Maryland: Agency for Health care Research and Quality; 2014.
Kranker K. dtalink: Faster probabilistic deduplication methods in Stata for record linking and large data files [online]. 2018 [cited April 22, 2022]. Available from: www.stata.com/meeting/columbus18/slides/co lumbus18_Kranker.pdf.
Blakely T, Salmond C. Probabilistic record linkage and a method to calculate the positive predictive value. Int J Epidemiol 2002; 31: 1246-52.
Capuani L, Bierrenbach AL, Abreu F, Takecian PL, Ferreira JE, Sabino EC. Accuracy of a probabilistic record-linkage methodology used to track blood donors in the Mortality Information System database. Cadernos de saude publica. 2014; 30: 1623-32. DOI: 10.1590/0102-311x00024914.
Personal Data Protection Act B.E. 2562. Royal Gazette No. 136, Part 69A (May 27, 2019).