Polycystic Ovary Syndrome (PCOS), a complex endocrine disorder, affects women of reproductive age. It involves a combination of symptoms including menstrual irregularities, hyperandrogenism and polycystic ovaries. Although the presence of an increased number of stroma and follicles on ultrasound indicates polycystic ovaries, this is not considered sufficient for the diagnosis of PCOS. Metabolic abnormalities, female pattern hair loss, sexual satisfaction and depression are associated with PCOS. Making sense of and analyzing these relationships is important for the diagnosis of PCOS. This study aims to diagnose PCOS with the XGBoost algorithm, which is frequently used in the literature in recent years and is reported to be faster and safer than other algorithms. In this direction, XGBoost algorithm was applied to the dataset taken from the Kaggle database and consisting of 554 records in total. The dataset used in the study was obtained from 10 different hospitals in Kerala (India). In addition, in order to examine the effects of categorical data on algorithm performance, different data sets were created and their performances were evaluated. Finally, the performance was tested by balancing the data set in order to reveal the effect of the distribution in the data set on the performance. With a dataset of 554 records, an accuracy value of 0,87 was obtained. In line with the performance metrics obtained in the study, it can be said that the XGBoost algorithm will contribute to the solution of classification problems in the field of health.
Karmaşık bir endokrin bozukluk olan Polikistik Over Sendromu (PKOS), üreme çağındaki kadınları etkilemektedir. Adet düzensizlikleri, hiperandrojenizm ve polikistik överler gibi çeşitli semptomların kombinasyonunu barındırır. Ultrasonda artan sayıda stroma ve folikül varlığı polikistik yumurtalıkları ifade etse de bu durum PKOS tanısı için yeterli görülmemektedir. Metabolik anormallikler, kadın tipi saç dökülmesi, cinsel tatmin ve depresyon PKOS ile ilişkilendirilmektedir. Bu ilişkilerin anlamlandırılması ve analiz edilmesi PKOS teşhisi için önem arz etmektedir. Bu çalışma kapsamında son yıllarda literatürde sıklıkla kullanılan ve diğer algoritmalara göre daha hızlı ve güvenli olduğu belirtilen XGBoost algoritmasıyla PKOS’un teşhis edilmesi amaçlanmıştır. Bu doğrultuda Kaggle veri tabanından alınmış ve toplamda 554 kayıttan oluşan veri setine XGBoost algoritması uygulanmıştır. Çalışmada kullanılan veri seti Kerala (Hindistan)'da yer alan 10 farklı hastaneden elde edilmiştir. Ayrıca kategorik verilerin algoritma performansı üzerindeki etkilerinin incelenmesi amaçlanarak farklı veri setleri oluşturularak performansları değerlendirilmiştir. Son olarak veri setindeki dağılımın performans üzerindeki etkisinin ortaya konulması amaçlanarak veri seti dengeli hale getirilerek performans test edilmiştir. 554 kayıttan oluşan veri setiyle 0,87 doğruluk değeri elde edilmiştir. Çalışmada elde edilen performans metrikleri doğrultusunda sağlık alanında sınıflandırma problemlerinin çözümünde XGBoost algoritmasının katkı sağlayacağı söylenebilir.
Birincil Dil | Türkçe |
---|---|
Konular | Kadın Hastalıkları ve Doğum |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 26 Eylül 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 13 Sayı: 3 |