TR
EN
Medikal Sentetik Veri Üretimiyle Veri Dengelemesi
Abstract
Sağlık hizmetleri planlaması, klinik deneyler ve araştırma geliştirme çalışmaları gibi sağlık verisi kullanımını gerektiren alanlarda, kişisel sağlık verisinin elde edilmesi ve kullanımında etik, bürokratik ve operasyonel zorluklar yaşanmaktadır. Elektronik kişisel sağlık kayıtlarının güvenliği ve kişisel veri mahremiyeti konularındaki kısıtlamalar başta olmak üzere, klinik ve saha çalışmalarından veri elde edilmesinin maliyetli ve zaman alıcı olması, gerçek veriye en yakın şekilde yapay veri üretilmesini gerekli kılmaktadır. Bu çalışmada, son dönemde sağlık alanında artan veri kullanımı ihtiyacı doğrultusunda, sentetik veri kullanımının önemi ele alınarak, sentetik veri üretiminde kullanılan SMOTE, SMOTEENN, BorderlineSMOTE, SMOTETomek ve ADASYN yöntemlerinin performanslarının karşılaştırılması amaçlanmıştır. Çalışmada, gözlem ve sınıf sayısı birbirinden farklı ve ikisi de kamuya açık, 390 hastaya ait 15 değişkenden oluşan veri seti ile 19.212 COVID-19 hastasına ilişkin 16 değişkenden oluşan veri seti kullanılmıştır. Çalışma sonucunda SMOTE tekniğinin gözlem ve sınıf sayısının fazla olduğu veri setini dengelemede daha başarılı olduğu ve sentetik veri üretiminde hibrit tekniklere göre etkin olarak kullanılabileceği sonucuna ulaşılmıştır.
Keywords
References
- [1] ReportLinker (2021). Big Data Industry. https://www.reportlinker.com/market-report/Advanced- IT/513221/Big-Data,20.07.2021
- [2] Gartner (2021). Top Strategic Technology Trends for 2021, https://www.gartner.com/en/publications/top-tech-trends-2021,13.07.2021
- [3] Jacob, P.D. (2020). Management of patient healthcare information: Healthcare-related information flow, access, and availability, In Fundamentals of Telemedicine and Telehealth (ss. 35-57) (Eds. Shashi Gogia), Academic Press.
- [4] Goncalves, A., Ray, P., Soper, B., Stevens, J., Coyle, L., & Sales, A. P. (2020). Generation and evaluation of synthetic patient data. BMC Medical Research Methodology, 20(1), 1–40. https://doi.org/10.1186/s12874-020-00977-1
- [5] Yale, A., Dash, S., Dutta, R., Guyon, I., Pavao, A., & Bennett, K. P. (2020). Generation and evaluation of privacy preserving synthetic health data. Neurocomputing, 416: 244–255. https://doi.org/10.1016/j.neucom.2019.12.136
- [6] Rocher, L., Hendrickx, J.M. & de Montjoye, YA. (2019). Estimating the success of re-identifications in incomplete datasets using generative models. Nat Commun, 10: 3069.
- [7] Tucker, A., Wang, Z., Rotalinti, Y., & Myles, P. (2020). Generating high-fidelity synthetic patient data for assessing machine learning healthcare software. Npj Digital Medicine, 3(1). https://doi.org/10.1038/s41746-020-00353-9
- [8] Walonoski, J., Klaus, S., Granger, E., Hall, D., Gregorowicz, A., Neyarapally, G., Watson, A., & Eastman, J. (2020). SyntheaTM Novel coronavirus (COVID-19) model and synthetic data set. Intelligence- Based Medicine, 1–2: 100007. https://doi.org/10.1016/j.ibmed.2020.100007
Details
Primary Language
Turkish
Subjects
-
Journal Section
Research Article
Publication Date
June 30, 2022
Submission Date
April 20, 2022
Acceptance Date
June 26, 2022
Published in Issue
Year 2022 Number: 5
APA
Deveci, A., & Esen, M. F. (2022). Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. Journal of Statistics and Applied Sciences, 5, 17-27. https://doi.org/10.52693/jsas.1105599
AMA
1.Deveci A, Esen MF. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022;(5):17-27. doi:10.52693/jsas.1105599
Chicago
Deveci, Ahmet, and M. Fevzi Esen. 2022. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences, nos. 5: 17-27. https://doi.org/10.52693/jsas.1105599.
EndNote
Deveci A, Esen MF (June 1, 2022) Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. Journal of Statistics and Applied Sciences 5 17–27.
IEEE
[1]A. Deveci and M. F. Esen, “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”, JSAS, no. 5, pp. 17–27, June 2022, doi: 10.52693/jsas.1105599.
ISNAD
Deveci, Ahmet - Esen, M. Fevzi. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences. 5 (June 1, 2022): 17-27. https://doi.org/10.52693/jsas.1105599.
JAMA
1.Deveci A, Esen MF. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022;:17–27.
MLA
Deveci, Ahmet, and M. Fevzi Esen. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences, no. 5, June 2022, pp. 17-27, doi:10.52693/jsas.1105599.
Vancouver
1.Ahmet Deveci, M. Fevzi Esen. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022 Jun. 1;(5):17-2. doi:10.52693/jsas.1105599