Makine öğrenmesinde, k-katlı çapraz doğrulama yöntemindeki k değeri, oluşturulan modelin performansını önemli ölçüde etkilemektedir. Yapılmış olan çalışmalarda genellikle k değeri beş veya on alınmaktadır çünkü bu iki değerin ortalama tahminler ürettiği düşünülmektedir. Ancak resmi bir kural yoktur. Farklı modellerin eğitiminde farklı k değerlerinin kullanılması için az sayıda çalışma yapıldığı görülmüştür. Bu çalışmada, çeşitli k değerleri (2, 3, 4, 5, 6, 7, 8, 9 ve 10) ve veri setleri kullanılarak IncRNA-hastalık modeli üzerinde bir performans değerlendirilmesi yapılmıştır. Elde edilen sonuçlar karşılaştırılmış ve model için en uygun k değeri belirtilmiştir. Gelecekte yapılacak olan çalışmalarda veri seti sayısının arttırılması ile daha geniş kapsamlı bir çalışma yapılması hedeflenmektedir.
In machine learning, the k value in the k-fold cross-validation method significantly affects the performance of the created model. In the studies that have been done, the k value is usually taken as five or ten because these two values are thought to produce average estimates. However, there is no official rule. It has been observed that few studies have been carried out to use different k values in the training of different models. In this study, a performance evaluation was performed on the IncRNA-disease model using various k values (2, 3, 4, 5, 6, 7, 8, 9, and 10) and datasets. The obtained results were compared and the most suitable k value for the model was determined. In future studies, it is aimed to carry out a more comprehensive study by increasing the number of data sets.
Primary Language | English |
---|---|
Subjects | Engineering |
Journal Section | Issue |
Authors | |
Publication Date | June 30, 2023 |
Published in Issue | Year 2023 |