Regresyon analizi pek çok bilim dalında olduğu gibi zootekni alanında da en sık kullanılan istatistik yöntemlerden birisidir. Ancak pek çok biyolojik çalışma için doğrusal regresyon varsayımlarının sağlanması mümkün olmamaktadır. Özellikle kesikli verilerin açıklayıcı değişken olarak kullanılması gereken durumlarda doğrusal regresyon kullanılarak elde edilen modellerin istatistiksel olarak hatalı sonuçlar üretebileceği bilinmektedir. Bu gibi durumlar için doğrusal regresyon yerine parametrik olmayan ya da yarı parametrik yöntemlerin kullanılması önerilmektedir. Bu çalışmada, kesikli açıklayıcı değişken varlığında önerilen genelleştirilmiş toplamsal modellerin zootekni alanından elde edilmiş bir veri kümesi kullanılarak tanıtılması amaçlanmıştır. Sonuç değişkeni olarak süt keçilerinden alınan laktasyon süt verimi kullanılırken açıklayıcı değişkenler olarak laktasyon süresi ve ana yaşı kullanılmıştır (n=166). Laktasyon süt verimi, laktasyon süresi ve ana yaşı değişkenlerinin normal dağılış göstermediği belirlenmiştir. Elde edilen doğrusal regresyon modelinin istatistiksel olarak anlamlı olduğu (P<0,001), Hata Kareler Ortalamasının (HKO) 5826,039 ve belirtme katsayısının (R2) 0,16 olduğu belirlenmiştir. Düşük bir belirtme katsayısına rağmen modelin anlamlı olmasının örnek büyüklüğüne bağlı olabileceği yorumlanmıştır. Elde edilen genelleştirilmiş toplamsal model için Ana yaşı değişkeninin laktasyon süresi değişkenine göre daha başarılı düzleştirme değerine sahip olduğu belirlenmiştir. Doğrusal regresyon ve genelleştirilmiş toplamsal modelleri karşılaştırabilmek adına Root Mean Square Error (RMSE), Relative Root Mean Square Error (rRMSE) ve ortalama mutlak sapma (MAD) değerleri hesaplanmıştır. Elde edilen bulgulara göre doğrusal regresyon analizinin tahmin başarısının daha yüksek olduğu anlaşılmaktadır. Ancak açıklayıcı değişkenler arasında çoklu bağlantı problemi olmamasına (VIF=1.000) ve sapmaların normal dağılışa sahip olmasına (P>0,05) rağmen değişkenlerin normal dağılmadığı bilinmektedir. Bu durumda genelleştirilmiş toplamsal modellerin kullanılmasının önerilebileceği söylenebilir. Sonuç olarak zootekni çalışmalarında kesikli değişkenler ile model oluşturmak gerektiğinde doğrusal modeller yerine genelleştirilmiş toplamsal modellerin kullanılmasının elde edilecek modelin güvenilirliğini artıracağı için önerilebileceği belirlenmiştir.
Genelleştirilmiş toplamsal modeller Regresyon Kesikli veri Zootekni
Bu çalışma birinci yazarın yüksek lisans tezinden özetlenmiştir.
Regression analysis is one of the most frequently used statistical methods in the field of animal science, as it is in many branches of science. However, it is not possible to provide linear regression assumptions for many biological studies. It is known that especially in cases where discrete data should be used as explanatory variables, the models obtained using linear regression can produce statistically incorrect results. For such cases, it is recommended to use non-parametric or semi-parametric methods instead of linear regression. In this study, it is aimed to introduce the generalized additive models proposed in the presence of discrete explanatory variables, using a dataset obtained from the field of animal science (n=166). While lactation milk yield was used as the outcome variable, lactation period and maternal age taken from dairy goat were used as explanatory variables. It was determined that the variables of lactation milk yield, lactation period and maternal age did not show normal distribution. It was determined that the obtained linear regression model was statistically significant (P<0.001), the Mean Square Error (MSE) was 5826.039 and the coefficient of determination (R2) was 0.16. It has been interpreted that the significance of the model, despite a low coefficient of determination, may depend on the sample size. For the generalized additive model obtained, it was determined that the maternal age variable had a more successful smoothing value than the lactation period variable. Root Mean Square Error (RMSE), Relative Root Mean Square Error (rRMSE) and mean absolute deviation (MAD) values were calculated to compare linear regression and generalized additive models. According to the findings obtained, it was understood that the estimation success of the linear regression analysis was higher. However, it was known that although there was no multicollinearity problem between the explanatory variables (VIF=1.000) and the deviations had a normal distribution (P>0.05), the variables were not normally distributed. In this case, it can be said to recommend to use of generalized additive models. As a result, it has been determined that when it is necessary to create a model with discrete variables in animal science studies, using generalized additive models instead of linear models can be recommended as it will increase the reliability of the model to be obtained.
Generalized additive models Regression Discrete data Animal science
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Research Articles |
Yazarlar | |
Yayımlanma Tarihi | 1 Ekim 2022 |
Gönderilme Tarihi | 18 Şubat 2022 |
Kabul Tarihi | 23 Nisan 2022 |
Yayımlandığı Sayı | Yıl 2022 |