Research Article

Medikal Sentetik Veri Üretimiyle Veri Dengelemesi

Number: 5 June 30, 2022
TR EN

Medikal Sentetik Veri Üretimiyle Veri Dengelemesi

Abstract

Sağlık hizmetleri planlaması, klinik deneyler ve araştırma geliştirme çalışmaları gibi sağlık verisi kullanımını gerektiren alanlarda, kişisel sağlık verisinin elde edilmesi ve kullanımında etik, bürokratik ve operasyonel zorluklar yaşanmaktadır. Elektronik kişisel sağlık kayıtlarının güvenliği ve kişisel veri mahremiyeti konularındaki kısıtlamalar başta olmak üzere, klinik ve saha çalışmalarından veri elde edilmesinin maliyetli ve zaman alıcı olması, gerçek veriye en yakın şekilde yapay veri üretilmesini gerekli kılmaktadır. Bu çalışmada, son dönemde sağlık alanında artan veri kullanımı ihtiyacı doğrultusunda, sentetik veri kullanımının önemi ele alınarak, sentetik veri üretiminde kullanılan SMOTE, SMOTEENN, BorderlineSMOTE, SMOTETomek ve ADASYN yöntemlerinin performanslarının karşılaştırılması amaçlanmıştır. Çalışmada, gözlem ve sınıf sayısı birbirinden farklı ve ikisi de kamuya açık, 390 hastaya ait 15 değişkenden oluşan veri seti ile 19.212 COVID-19 hastasına ilişkin 16 değişkenden oluşan veri seti kullanılmıştır. Çalışma sonucunda SMOTE tekniğinin gözlem ve sınıf sayısının fazla olduğu veri setini dengelemede daha başarılı olduğu ve sentetik veri üretiminde hibrit tekniklere göre etkin olarak kullanılabileceği sonucuna ulaşılmıştır.

Keywords

References

  1. [1] ReportLinker (2021). Big Data Industry. https://www.reportlinker.com/market-report/Advanced- IT/513221/Big-Data,20.07.2021
  2. [2] Gartner (2021). Top Strategic Technology Trends for 2021, https://www.gartner.com/en/publications/top-tech-trends-2021,13.07.2021
  3. [3] Jacob, P.D. (2020). Management of patient healthcare information: Healthcare-related information flow, access, and availability, In Fundamentals of Telemedicine and Telehealth (ss. 35-57) (Eds. Shashi Gogia), Academic Press.
  4. [4] Goncalves, A., Ray, P., Soper, B., Stevens, J., Coyle, L., & Sales, A. P. (2020). Generation and evaluation of synthetic patient data. BMC Medical Research Methodology, 20(1), 1–40. https://doi.org/10.1186/s12874-020-00977-1
  5. [5] Yale, A., Dash, S., Dutta, R., Guyon, I., Pavao, A., & Bennett, K. P. (2020). Generation and evaluation of privacy preserving synthetic health data. Neurocomputing, 416: 244–255. https://doi.org/10.1016/j.neucom.2019.12.136
  6. [6] Rocher, L., Hendrickx, J.M. & de Montjoye, YA. (2019). Estimating the success of re-identifications in incomplete datasets using generative models. Nat Commun, 10: 3069.
  7. [7] Tucker, A., Wang, Z., Rotalinti, Y., & Myles, P. (2020). Generating high-fidelity synthetic patient data for assessing machine learning healthcare software. Npj Digital Medicine, 3(1). https://doi.org/10.1038/s41746-020-00353-9
  8. [8] Walonoski, J., Klaus, S., Granger, E., Hall, D., Gregorowicz, A., Neyarapally, G., Watson, A., & Eastman, J. (2020). SyntheaTM Novel coronavirus (COVID-19) model and synthetic data set. Intelligence- Based Medicine, 1–2: 100007. https://doi.org/10.1016/j.ibmed.2020.100007

Details

Primary Language

Turkish

Subjects

-

Journal Section

Research Article

Publication Date

June 30, 2022

Submission Date

April 20, 2022

Acceptance Date

June 26, 2022

Published in Issue

Year 2022 Number: 5

APA
Deveci, A., & Esen, M. F. (2022). Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. Journal of Statistics and Applied Sciences, 5, 17-27. https://doi.org/10.52693/jsas.1105599
AMA
1.Deveci A, Esen MF. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022;(5):17-27. doi:10.52693/jsas.1105599
Chicago
Deveci, Ahmet, and M. Fevzi Esen. 2022. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences, nos. 5: 17-27. https://doi.org/10.52693/jsas.1105599.
EndNote
Deveci A, Esen MF (June 1, 2022) Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. Journal of Statistics and Applied Sciences 5 17–27.
IEEE
[1]A. Deveci and M. F. Esen, “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”, JSAS, no. 5, pp. 17–27, June 2022, doi: 10.52693/jsas.1105599.
ISNAD
Deveci, Ahmet - Esen, M. Fevzi. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences. 5 (June 1, 2022): 17-27. https://doi.org/10.52693/jsas.1105599.
JAMA
1.Deveci A, Esen MF. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022;:17–27.
MLA
Deveci, Ahmet, and M. Fevzi Esen. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences, no. 5, June 2022, pp. 17-27, doi:10.52693/jsas.1105599.
Vancouver
1.Ahmet Deveci, M. Fevzi Esen. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022 Jun. 1;(5):17-2. doi:10.52693/jsas.1105599