Fertility rates have decreased significantly in recent years. This situation has started to be seen especially in men and it has been expressed as infertility. According to the World Health Organization, infertility is the absence of pregnancy even though a sexually active couple has regular sexual intercourse for one year without taking any precautions. Infertility is a reproductive health problem for whatever reason the cause. Impairment of sperm function is one of the most important causes of male infertility. Another factor of infertility is semen quality and sperm immobility. Life habits and environmental factors affect the quality of semen in humans and reduce fertility. Semen analysis is a good indicator of male fertility potential. Therefore, motility, density and morphology of sperm are examined in semen analysis. These analyzes are performed in the laboratory by experts. Laboratory analyzes can be observational, error-prone, and subjective. Computer-aided studies are used to minimize such errors. In this study, normal and altered semen estimation was performed by using machine learning algorithms, which were formed according to the results of the questionnaires and semen samples taken from 100 subjects. In estimation models, Support Vector Machines, K Nearest Neighborhood, Linear Discriminant and Logistic Regression methods were used. The most suitable estimation algorithms for the solution of the problem were determined by comparing the performance values obtained in the study with similar studies in the literature. Deteriorated and normal semen samples were estimated using machine learning methods and evaluated in two stages. First, the entire data set was used, and then the success rates were compared by taking the number of data sets equally. The data set used for the training and testing process was first evaluated by cross-validation and then the training and test values of the data set were 50% - 50% processed. In the classification results, the ratio of correctly predicted samples to all samples was used as performance criteria. The success results obtained using the whole data set were 90% with the Support Vector Machines and the K Nearest Neighborhood methods. Since normal and impaired semen samples are not equal in the dataset, normal semen samples are used as much as the impaired semen samples, which are few in number, and thus provided 7 evaluation cases. The highest success rate achieved in this way was 91.7% using Support Vector Machines for the 4th evaluation case, and for the average of 7 evaluation status, the highest success was 73.8% using the K Nearest Neighborhood method.
Semen Quality Machine Learning Algorithms Estimation Classification
Doğurganlık oranları son yıllarda önemli ölçüde azalmıştır. Bu durum özellikle erkeklerde daha fazla görülmeye başlanmış ve kısırlık olarak ifade edilmiştir. Kısırlık, Dünya Sağlık Örgütüne göre seksüel olarak aktif bir çiftin herhangi bir önlem alınmadan bir yıl süreyle düzenli cinsel ilişlkide bulunmasına rağmen gebeliğin oluşmamasıdır. Kısırlık, sebebi ne olursa olsun üreme sağlığı sorunudur. Sperm fonksiyonunun bozulması, erkek kısırlığının en önemli nedenlerinden biridir. Kısırlığın bir diğer etmeni de semen kalitesi ve sperm hareketsizliğidir. Yaşam alışkanlıkları ve çevresel faktörler insanlarda semen kalitesini etkileyip doğurganlık oranını azaltmaktadır. Semen analizi erkek doğurganlık potansiyelinin iyi bir göstergesidir. Bu yüzden spermin hareketliliği, yoğunluğu ve morfolojisi semen analizinde incelenmektedir. Bu analizler uzmanlarca laboratuvar ortamında yapılmaktadır. Laboratuvarda analizler, gözleme dayalı hataya açık ve subjektif olabilmektedir. Bu tür hataları minimize edebilmek için Bilgisayar destekli çalışmalar kullanılmaktadır. Bu çalışmada 100 denekten alınmış semen örnekleri ve yapılan anket sonuçlarına göre oluşturulan veri seti makine öğrenme algoritmaları kullanılarak normal ve değiştirilmiş semen tahmini yapılmıştır. Tahmin modellerinde, Destek Vektör Makineleri, K En Yakın Komşuluk, Doğrusal Ayırt Edici ve Lojistik Regresyon yöntemleri kullanılmıştır. Çalışmada elde edilen performans değerleri, literatürdeki benzer çalışmalarla kıyaslanarak problemin çözümüne ilişkin en uygun tahmin algoritmaları tespit edilmiştir. Bozulmuş ve normal semen örnekleri tahmin yapma işlemi makine öğrenme yöntemleri kullanılarak yapılmış ve iki aşamada değerlendirilmiştir. İlk olarak tüm veri seti kullanılmış ve daha sonra veri seti sayısı eşit alınarak başarı oranları karşılaştırılmıştır. Eğitim ve test işlemi için kullanılan veri seti ilk olarak çapraz doğrulama yapılarak değerlendirilmiş ve daha sonra veri setinin eğitim ve test değerleri %50 %50 alınarak işleme alınmıştır. Sınıflandırma sonuçlarında performans ölçütü olarak, doğru tahmin edilen örneklerin tüm örneklere oranı kullanılmıştır. Tüm veri seti kullanılarak elde edilen başarı sonuçları, Destek Vektör Makineleri ve K En Yakın Komşuluk yöntemleri ile %90 olmuştur. Verisetinde normal ve bozulmuş semen örnekleri eşit olmadığı için sayıca az olan bozulmuş semen örnekleri kadar normal semen örnekleri kullanılmış ve bu şekilde 7 değerlendirme durumu sağlanmıştır. Bu şekilde elde edilen en yüksek başarı oranı 4. değerlendirme durumu için Destek Vektör Makineleri kullanılarak % 91.7 olmuş ve 7 değerlendirme durumu ortalaması için ise en yüksek başarı durumu K En Yakın Komşuluk yöntemi kullanılarak %73,8 olmuştur.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 15 Nisan 2020 |
Yayımlandığı Sayı | Yıl 2020 Sayı: 18 |