Tez Özeti
BibTex RIS Kaynak Göster

Examination of Distance Based Regression Methods for Different Data Structures in Animal Science

Yıl 2025, Cilt: 8 Sayı: 2, 13 - 14
https://doi.org/10.34248/bsengineering.1599606

Öz

Distance-based regression is an alternative method for parameter estimation in linear regression models when mixed-type explanatory variables are used. Distance-based regression is similar to classical linear regression, except that explanatory variables are measured by distance measures rather than raw values. In this study, datasets with sample sizes of 10, 25, 50, 100, 250 and 500 produced for Binomial, Normal, t, Chi-square and Poisson distributions of Euclidean, Gower and Manhattan distance measures and real data with discrete and continuous distribution that body weight at sixth months was used as outcome variable, body length and chest depth at sixth months of Saanen kids were used as explanatory variables as continuous data. Milk fat ratio was determined as the response variable, while the number of milking per day and the season of Polish Holstein Friesian cattle were determined as the explanatory variables as discrete data. It was aimed to determine the effect on the data sets (10, 50 and 100 sample sizes) by comparing the results obtained from the Linear Regression method. R packages "dbstats", "cluster" and "tidyverse" were used to perform the analysis. As a result, it has been determined that the use of Manhattan distance in data with Poisson distribution may produce unsuccessful results, especially in small sample sizes (n<50). Although there is no significant difference between Gower and Euclidean distances in different distributions according to sample sizes, it has been determined that the use of Euclidean distance measure in some distributions produces results that cause fluctuation. However, it has been understood that the Gower distance can be recommended as a more suitable choice since it has a more stable structure. For the applicability of the Least Square Estimation method, it may be recommended to use Distance Based Regression methods in cases where the necessary assumptions mentioned in this study cannot be met.

Kaynakça

  • Adıgüzel MB. 2021. Çok değişkenli uyarlanabilir regresyon eğrilerinde alternatif bilgi kriterleri ile model seçimi. PhD Thesis, Ondokuz Mayıs University, Graduate Shool of Education, Department of Statistics, Samsun, Türkiye, pp: 86.
  • Aerts J, Sitkowska B, Piwczyński D, Kolenda M, Önder H. 2022. The optimal level of factors for high daily milk yield in automatic milking system. Livestock Sci, 264: 105035.

Examination of Distance Based Regression Methods for Different Data Structures in Animal Science

Yıl 2025, Cilt: 8 Sayı: 2, 13 - 14
https://doi.org/10.34248/bsengineering.1599606

Öz

Uzaklık Temelli Regresyon, karma tip açıklayıcı değişkenler kullanıldığında doğrusal regresyon modellerinde parametre tahmini için alternatif bir yöntemdir. Uzaklık Temelli Regresyon, açıklayıcı değişkenlerin ham değerler yerine uzaklık ölçüleriyle ölçülmesi dışında klasik doğrusal regresyona benzemektedir. Bu çalışmada, Öklid, Gower ve Manhattan uzaklık ölçümlerinin Binom, Normal, t, Ki-kare ve Poisson dağılımları için üretilen 10, 25, 50, 100, 250 ve 500 örneklem büyüklüklerine sahip veri kümeleri ve altıncı aydaki vücut ağırlığının sonuç değişkeni, altıncı aydaki Saanen oğlaklarının vücut uzunluğu ve göğüs derinliğinin sürekli veri olarak açıklayıcı değişkenler olarak kullanıldığı kesikli ve sürekli dağılıma sahip gerçek veriler kullanılmıştır. Süt yağ oranı yanıt değişkeni olarak belirlenirken, Polonya Holstein Friesian sığırlarının günlük sağım sayısı ve mevsimi ayrık veriler olarak açıklayıcı değişkenler olarak belirlenmiştir. Doğrusal Regresyon yönteminden elde edilen sonuçlar karşılaştırılarak veri setleri (10, 50 ve 100 örneklem büyüklükleri) üzerindeki etki belirlenmeye çalışılmıştır. Analizi gerçekleştirmek için R paketleri "dbstats", "cluster" ve "tidyverse" kullanılmıştır. Sonuç olarak Poisson dağılımına sahip verilerde Manhattan uzaklık ölçüsünün kullanılmasının özellikle küçük örneklem büyüklüklerinde (n<50) başarısız sonuçlar üretebileceği belirlenmiştir. Örneklem büyüklüklerine göre farklı dağılımlarda Gower ve Öklid mesafeleri arasında anlamlı bir fark bulunmamasına rağmen bazı dağılımlarda Öklid mesafesi ölçüsünün kullanılmasının dalgalanmaya neden olan sonuçlar ürettiği belirlenmiştir. Ancak Gower mesafesinin daha kararlı bir yapıya sahip olması nedeniyle daha uygun bir tercih olarak önerilebileceği anlaşılmıştır. En Küçük Kareler Tahmin yönteminin uygulanabilirliği için bu çalışmada belirtilen gerekli varsayımların sağlanamadığı durumlarda Uzaklık Temelli Regresyon yöntemlerinin kullanılması önerilebilir.

Kaynakça

  • Adıgüzel MB. 2021. Çok değişkenli uyarlanabilir regresyon eğrilerinde alternatif bilgi kriterleri ile model seçimi. PhD Thesis, Ondokuz Mayıs University, Graduate Shool of Education, Department of Statistics, Samsun, Türkiye, pp: 86.
  • Aerts J, Sitkowska B, Piwczyński D, Kolenda M, Önder H. 2022. The optimal level of factors for high daily milk yield in automatic milking system. Livestock Sci, 264: 105035.
Toplam 2 adet kaynakça vardır.

Ayrıntılar

Birincil Dil İngilizce
Konular İstatistiksel Analiz, Uygulamalı İstatistik
Bölüm Research Articles
Yazarlar

Burcu Kurnaz 0000-0001-5613-6992

Hasan Önder 0000-0002-8404-8700

Yayımlanma Tarihi
Gönderilme Tarihi 11 Aralık 2024
Kabul Tarihi 16 Ocak 2025
Yayımlandığı Sayı Yıl 2025 Cilt: 8 Sayı: 2

Kaynak Göster

APA Kurnaz, B., & Önder, H. (t.y.). Examination of Distance Based Regression Methods for Different Data Structures in Animal Science. Black Sea Journal of Engineering and Science, 8(2), 13-14. https://doi.org/10.34248/bsengineering.1599606
AMA Kurnaz B, Önder H. Examination of Distance Based Regression Methods for Different Data Structures in Animal Science. BSJ Eng. Sci. 8(2):13-14. doi:10.34248/bsengineering.1599606
Chicago Kurnaz, Burcu, ve Hasan Önder. “Examination of Distance Based Regression Methods for Different Data Structures in Animal Science”. Black Sea Journal of Engineering and Science 8, sy. 2 t.y.: 13-14. https://doi.org/10.34248/bsengineering.1599606.
EndNote Kurnaz B, Önder H Examination of Distance Based Regression Methods for Different Data Structures in Animal Science. Black Sea Journal of Engineering and Science 8 2 13–14.
IEEE B. Kurnaz ve H. Önder, “Examination of Distance Based Regression Methods for Different Data Structures in Animal Science”, BSJ Eng. Sci., c. 8, sy. 2, ss. 13–14, doi: 10.34248/bsengineering.1599606.
ISNAD Kurnaz, Burcu - Önder, Hasan. “Examination of Distance Based Regression Methods for Different Data Structures in Animal Science”. Black Sea Journal of Engineering and Science 8/2 (t.y.), 13-14. https://doi.org/10.34248/bsengineering.1599606.
JAMA Kurnaz B, Önder H. Examination of Distance Based Regression Methods for Different Data Structures in Animal Science. BSJ Eng. Sci.;8:13–14.
MLA Kurnaz, Burcu ve Hasan Önder. “Examination of Distance Based Regression Methods for Different Data Structures in Animal Science”. Black Sea Journal of Engineering and Science, c. 8, sy. 2, ss. 13-14, doi:10.34248/bsengineering.1599606.
Vancouver Kurnaz B, Önder H. Examination of Distance Based Regression Methods for Different Data Structures in Animal Science. BSJ Eng. Sci. 8(2):13-4.

                                                24890