The aim of scientific research is to reach general results from the observations and experiments of the studies. Together with the developing technologies, these results are recorded digitally, and these records form big data stacks. The process of processing these masses into meaningful information began in the 1950s and the concept of data mining emerged. Data mining, which is used in forecasting or decision making processes, now finds its place in forecasting agricultural activities. The basis of the plant breeding studies is based on the comparison of the desired phenotype and genotype properties according to the efficiency and environmental conditions. Various statistical package programs are used in the evaluation of these results. These programs do not fully meet the analysis and reporting capabilities required for a breeder’s genotype selection. In this study, the yield of the genotype was estimated from 12 locations with a total of 1153 yields of 24 replicates of 24 genotypes. In addition to the linear regression used in plant breeding, sequential Minimal Optimization (SMO), Nearest k–Neighbor (k–EYK), Random Forest (RO) methods were selected from the methods of machine learning. The success of selected methods was compared according to the mean square root of the mean square error and the mean absolute error metrics. RO has shown higher performance than the other three methods and it has been proposed to use with the linear regression method used in plant breeding programs.
Regression analysis statistics breeding sequential minimal optimization regression linear regression random forest
Bilimsel araştırmaların amacı yapılan çalışmaların gözlem ve denemelerinden genel sonuçlara ulaşmaktır. Gelişen teknolojilerle beraber bu sonuçlar dijital olarak kayıt altına alınmakta ve bu kayıtlar büyük veri (big data) yığınlarını meydana getirmektedir. Bu yığınların işlenmesi yani anlamlı bilgiye dönüştürülmesi 1950’li yıllarda başlamış ve veri madenciliği kavramı ortaya çıkmıştır. Tahmin ya da karar verme süreçlerinde kullanılan veri madenciliği, günümüzde tarımsal faaliyetlerin tahmin çalışmalarında da kendine yer bulmaktadır. Bitki ıslah çalışmalarının temeli, istenilen fenotip ve genotip özelliklerinin verim ve çevre şartlarına göre karşılaştırılması esasına dayanmaktadır. Bu sonuçların değerlendirilmesinde çeşitli istatistik paket programları kullanılmaktadır. Kullanılan bu programlar bir ıslahçının verim ile yapılacak genotip seçimleri için gerekli analiz ve raporlama kabiliyetlerini tam olarak karşılamamakladır. Bu çalışmada, 12 lokasyondan, 24 genotipe ait 4 tekerrürlü toplam 1153 adet verim değerine göre genotipe ait verim tahmini yapılmıştır. Tahminlemede bitki ıslahında kullanılan doğrusal regresyonun yanında makine öğrenmesi metotlarından Sıralı Minimal Optimizasyon (SMO), En Yakın k–Komşu (k–EYK), Rastgele Orman (RO) metotları seçilmiştir. Seçilen metotların başarıları Ortalama Karesel Hatanın Karekökü ve Ortalama Mutlak Hata metriklerine göre karşılaştırılmıştır. RO, diğer üç yönteme göre daha yüksek performans göstermiş ve bitki ıslah programlarında kullanılan doğrusal regresyon yöntemi ile beraber kullanılması önerilmiştir.
regresyon analizi istatistik ıslah sıralı minimal optimizasyon regresyon doğrusal regresyon rastgele orman
Birincil Dil | Türkçe |
---|---|
Konular | Ziraat Mühendisliği (Diğer) |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 29 Kasım 2019 |
Gönderilme Tarihi | 10 Haziran 2019 |
Kabul Tarihi | 16 Temmuz 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 48 Sayı: 2 |
BAHÇE Dergisi
bahcejournal@gmail.com
https://bahcejournal.org
Atatürk Bahçe Kültürleri Merkez Araştırma Enstitüsü, 77100 Yalova
X (Twitter), Linkedin, Facebook, Instagram