Araştırma Makalesi

Medikal Sentetik Veri Üretimiyle Veri Dengelemesi

Sayı: 5 30 Haziran 2022
PDF İndir
TR EN

Medikal Sentetik Veri Üretimiyle Veri Dengelemesi

Öz

Sağlık hizmetleri planlaması, klinik deneyler ve araştırma geliştirme çalışmaları gibi sağlık verisi kullanımını gerektiren alanlarda, kişisel sağlık verisinin elde edilmesi ve kullanımında etik, bürokratik ve operasyonel zorluklar yaşanmaktadır. Elektronik kişisel sağlık kayıtlarının güvenliği ve kişisel veri mahremiyeti konularındaki kısıtlamalar başta olmak üzere, klinik ve saha çalışmalarından veri elde edilmesinin maliyetli ve zaman alıcı olması, gerçek veriye en yakın şekilde yapay veri üretilmesini gerekli kılmaktadır. Bu çalışmada, son dönemde sağlık alanında artan veri kullanımı ihtiyacı doğrultusunda, sentetik veri kullanımının önemi ele alınarak, sentetik veri üretiminde kullanılan SMOTE, SMOTEENN, BorderlineSMOTE, SMOTETomek ve ADASYN yöntemlerinin performanslarının karşılaştırılması amaçlanmıştır. Çalışmada, gözlem ve sınıf sayısı birbirinden farklı ve ikisi de kamuya açık, 390 hastaya ait 15 değişkenden oluşan veri seti ile 19.212 COVID-19 hastasına ilişkin 16 değişkenden oluşan veri seti kullanılmıştır. Çalışma sonucunda SMOTE tekniğinin gözlem ve sınıf sayısının fazla olduğu veri setini dengelemede daha başarılı olduğu ve sentetik veri üretiminde hibrit tekniklere göre etkin olarak kullanılabileceği sonucuna ulaşılmıştır.

Anahtar Kelimeler

Kaynakça

  1. [1] ReportLinker (2021). Big Data Industry. https://www.reportlinker.com/market-report/Advanced- IT/513221/Big-Data,20.07.2021
  2. [2] Gartner (2021). Top Strategic Technology Trends for 2021, https://www.gartner.com/en/publications/top-tech-trends-2021,13.07.2021
  3. [3] Jacob, P.D. (2020). Management of patient healthcare information: Healthcare-related information flow, access, and availability, In Fundamentals of Telemedicine and Telehealth (ss. 35-57) (Eds. Shashi Gogia), Academic Press.
  4. [4] Goncalves, A., Ray, P., Soper, B., Stevens, J., Coyle, L., & Sales, A. P. (2020). Generation and evaluation of synthetic patient data. BMC Medical Research Methodology, 20(1), 1–40. https://doi.org/10.1186/s12874-020-00977-1
  5. [5] Yale, A., Dash, S., Dutta, R., Guyon, I., Pavao, A., & Bennett, K. P. (2020). Generation and evaluation of privacy preserving synthetic health data. Neurocomputing, 416: 244–255. https://doi.org/10.1016/j.neucom.2019.12.136
  6. [6] Rocher, L., Hendrickx, J.M. & de Montjoye, YA. (2019). Estimating the success of re-identifications in incomplete datasets using generative models. Nat Commun, 10: 3069.
  7. [7] Tucker, A., Wang, Z., Rotalinti, Y., & Myles, P. (2020). Generating high-fidelity synthetic patient data for assessing machine learning healthcare software. Npj Digital Medicine, 3(1). https://doi.org/10.1038/s41746-020-00353-9
  8. [8] Walonoski, J., Klaus, S., Granger, E., Hall, D., Gregorowicz, A., Neyarapally, G., Watson, A., & Eastman, J. (2020). SyntheaTM Novel coronavirus (COVID-19) model and synthetic data set. Intelligence- Based Medicine, 1–2: 100007. https://doi.org/10.1016/j.ibmed.2020.100007

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

30 Haziran 2022

Gönderilme Tarihi

20 Nisan 2022

Kabul Tarihi

26 Haziran 2022

Yayımlandığı Sayı

Yıl 2022 Sayı: 5

Kaynak Göster

APA
Deveci, A., & Esen, M. F. (2022). Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. Journal of Statistics and Applied Sciences, 5, 17-27. https://doi.org/10.52693/jsas.1105599
AMA
1.Deveci A, Esen MF. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022;(5):17-27. doi:10.52693/jsas.1105599
Chicago
Deveci, Ahmet, ve M. Fevzi Esen. 2022. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences, sy 5: 17-27. https://doi.org/10.52693/jsas.1105599.
EndNote
Deveci A, Esen MF (01 Haziran 2022) Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. Journal of Statistics and Applied Sciences 5 17–27.
IEEE
[1]A. Deveci ve M. F. Esen, “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”, JSAS, sy 5, ss. 17–27, Haz. 2022, doi: 10.52693/jsas.1105599.
ISNAD
Deveci, Ahmet - Esen, M. Fevzi. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences. 5 (01 Haziran 2022): 17-27. https://doi.org/10.52693/jsas.1105599.
JAMA
1.Deveci A, Esen MF. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 2022;:17–27.
MLA
Deveci, Ahmet, ve M. Fevzi Esen. “Medikal Sentetik Veri Üretimiyle Veri Dengelemesi”. Journal of Statistics and Applied Sciences, sy 5, Haziran 2022, ss. 17-27, doi:10.52693/jsas.1105599.
Vancouver
1.Ahmet Deveci, M. Fevzi Esen. Medikal Sentetik Veri Üretimiyle Veri Dengelemesi. JSAS. 01 Haziran 2022;(5):17-2. doi:10.52693/jsas.1105599