Araştırma Makalesi

Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması

Cilt: 9 Sayı: 2 15 Mart 2026
PDF İndir
EN TR

Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması

Öz

Tıbbi araştırmalar başta olmak üzere diğer birçok araştırma dallarında veri kıtlığı ve/veya gizlilik kısıtlamaları, çeşitli çalışmalar için yapay zekâ (makine öğrenmesi, derin öğrenme) modellerinin geliştirilmesinde engeller oluşturmaktadır. Bu çalışmada, sentetik veri üretiminin küçük veri setlerini büyütmede nasıl bir çözüm üretebileceği gösterilmiştir. UCI Makine Öğrenmesi Deposu'ndan elde edilen Farklılaşmış Tiroit Kanseri Nüks Veri Seti kullanılmıştır. Orijinal verinin istatistiksel özelliklerini koruyan büyük ölçekli sentetik veri üretilmiş ve sınıf dengesizliği iyileştirilmiştir. XGBoost, LightGBM, k-En Yakın Komşu (kEYK) ve Karar Ağacı (KA) algoritmaları ile performans değerlendirmesi yapılmıştır. Sonuçlara bakıldığında, sentetik veri ile eğitilen modellerin orijinal veri ile karşılaştırılabilir veya daha iyi performans gösterdiği ortaya çıkmıştır. Topluluk yöntemlerinde tutarlı performans, basit modellerde ise kayda değer iyileşmeler elde edilmiştir. Kararlılık analizi, XGBoost ve LightGBM'in en tutarlı modeller olduğunu göstermiştir.

Anahtar Kelimeler

Etik Beyan

Bu çalışmada kullanılan veri seti, UCI Makine Öğrenmesi Deposu’ndan halka açık olarak erişilebilen, anonim hasta verilerinden oluştuğundan etik kurul onayı gerekmemektedir.

Teşekkür

Bu çalışmada kullanılan Farklılaşmış Tiroit Kanseri Nüks veri setini halka açık olarak sunan araştırmacılara teşekkür ederiz. Orijinal tiroit kanseri veri seti UCI Makine Öğrenmesi Deposu’nda halka açıktır (https://archive.ics.uci.edu). Sentetik veri, DataXid platformu ile üretilmiştir ve gizlilik nedeniyle halka açık değildir. Model eğitim kodları, makul talep üzerine sorumlu yazardan temin edilebilir.

Kaynakça

  1. Bender, S., Jarmin, R. S., Kreuter, F., & Lane, J. (2020). Privacy and confidentiality. In Big data and social science (pp. 313–331). Chapman and Hall/CRC.
  2. Borisov, V., Seßler, K., Leemann, T., Pawelczyk, M., & Kasneci, G. (2022). Language models are realistic tabular data generators. arXiv. https://doi.org/10.48550/arXiv.2210.06280
  3. Borzooei, S., Briganti, G., Golparian, M., Lechien, J. R., & Tarokhian, A. (2024). Machine learning for risk stratification of thyroid cancer patients: A 15-year cohort study. European Archives of Oto-Rhino-Laryngology, 281(4), 2095–2104. https://doi.org/10.1007/s00405-023-08766-2
  4. Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16, 321–357. https://doi.org/10.1613/jair.953
  5. Chen, R. J., Lu, M. Y., Chen, T. Y., Williamson, D. F. K., & Mahmood, F. (2021). Synthetic data in machine learning for medicine and healthcare. Nature Biomedical Engineering, 5(6), 493–497. https://doi.org/10.1038/s41551-021-00751-8
  6. Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785–794). ACM. https://doi.org/10.1145/2939672.2939785
  7. DataXID. (2024). DataXID: Blockchain-powered synthetic data platform. https://dataxid.com
  8. Donaldson, M. S., & Lohr, K. N. (Eds.). (1994). Health data in the information age: Use, disclosure, and privacy. National Academies Press.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Esnek Hesaplama

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

15 Mart 2026

Gönderilme Tarihi

21 Kasım 2025

Kabul Tarihi

3 Şubat 2026

Yayımlandığı Sayı

Yıl 2026 Cilt: 9 Sayı: 2

Kaynak Göster

APA
Gazioğlu, E. (2026). Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması. Black Sea Journal of Engineering and Science, 9(2), 608-615. https://doi.org/10.34248/bsengineering.1828346
AMA
1.Gazioğlu E. Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması. BSJ Eng. Sci. 2026;9(2):608-615. doi:10.34248/bsengineering.1828346
Chicago
Gazioğlu, Emrullah. 2026. “Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması”. Black Sea Journal of Engineering and Science 9 (2): 608-15. https://doi.org/10.34248/bsengineering.1828346.
EndNote
Gazioğlu E (01 Mart 2026) Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması. Black Sea Journal of Engineering and Science 9 2 608–615.
IEEE
[1]E. Gazioğlu, “Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması”, BSJ Eng. Sci., c. 9, sy 2, ss. 608–615, Mar. 2026, doi: 10.34248/bsengineering.1828346.
ISNAD
Gazioğlu, Emrullah. “Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması”. Black Sea Journal of Engineering and Science 9/2 (01 Mart 2026): 608-615. https://doi.org/10.34248/bsengineering.1828346.
JAMA
1.Gazioğlu E. Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması. BSJ Eng. Sci. 2026;9:608–615.
MLA
Gazioğlu, Emrullah. “Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması”. Black Sea Journal of Engineering and Science, c. 9, sy 2, Mart 2026, ss. 608-15, doi:10.34248/bsengineering.1828346.
Vancouver
1.Emrullah Gazioğlu. Tiroit Kanseri Nüks Tahmini: Sentetik ve Gerçek Veri Karşılaştırması. BSJ Eng. Sci. 01 Mart 2026;9(2):608-15. doi:10.34248/bsengineering.1828346

                           24890