Distance-based regression is an alternative method for parameter estimation in linear regression models when mixed-type explanatory variables are used. Distance-based regression is similar to classical linear regression, except that explanatory variables are measured by distance measures rather than raw values. In this study, datasets with sample sizes of 10, 25, 50, 100, 250 and 500 produced for Binomial, Normal, t, Chi-square and Poisson distributions of Euclidean, Gower and Manhattan distance measures and real data with discrete and continuous distribution that body weight at sixth months was used as outcome variable, body length and chest depth at sixth months of Saanen kids were used as explanatory variables as continuous data. Milk fat ratio was determined as the response variable, while the number of milking per day and the season of Polish Holstein Friesian cattle were determined as the explanatory variables as discrete data. It was aimed to determine the effect on the data sets (10, 50 and 100 sample sizes) by comparing the results obtained from the Linear Regression method. R packages "dbstats", "cluster" and "tidyverse" were used to perform the analysis. As a result, it has been determined that the use of Manhattan distance in data with Poisson distribution may produce unsuccessful results, especially in small sample sizes (n<50). Although there is no significant difference between Gower and Euclidean distances in different distributions according to sample sizes, it has been determined that the use of Euclidean distance measure in some distributions produces results that cause fluctuation. However, it has been understood that the Gower distance can be recommended as a more suitable choice since it has a more stable structure. For the applicability of the Least Square Estimation method, it may be recommended to use Distance Based Regression methods in cases where the necessary assumptions mentioned in this study cannot be met.
Uzaklık Temelli Regresyon, karma tip açıklayıcı değişkenler kullanıldığında doğrusal regresyon modellerinde parametre tahmini için alternatif bir yöntemdir. Uzaklık Temelli Regresyon, açıklayıcı değişkenlerin ham değerler yerine uzaklık ölçüleriyle ölçülmesi dışında klasik doğrusal regresyona benzemektedir. Bu çalışmada, Öklid, Gower ve Manhattan uzaklık ölçümlerinin Binom, Normal, t, Ki-kare ve Poisson dağılımları için üretilen 10, 25, 50, 100, 250 ve 500 örneklem büyüklüklerine sahip veri kümeleri ve altıncı aydaki vücut ağırlığının sonuç değişkeni, altıncı aydaki Saanen oğlaklarının vücut uzunluğu ve göğüs derinliğinin sürekli veri olarak açıklayıcı değişkenler olarak kullanıldığı kesikli ve sürekli dağılıma sahip gerçek veriler kullanılmıştır. Süt yağ oranı yanıt değişkeni olarak belirlenirken, Polonya Holstein Friesian sığırlarının günlük sağım sayısı ve mevsimi ayrık veriler olarak açıklayıcı değişkenler olarak belirlenmiştir. Doğrusal Regresyon yönteminden elde edilen sonuçlar karşılaştırılarak veri setleri (10, 50 ve 100 örneklem büyüklükleri) üzerindeki etki belirlenmeye çalışılmıştır. Analizi gerçekleştirmek için R paketleri "dbstats", "cluster" ve "tidyverse" kullanılmıştır. Sonuç olarak Poisson dağılımına sahip verilerde Manhattan uzaklık ölçüsünün kullanılmasının özellikle küçük örneklem büyüklüklerinde (n<50) başarısız sonuçlar üretebileceği belirlenmiştir. Örneklem büyüklüklerine göre farklı dağılımlarda Gower ve Öklid mesafeleri arasında anlamlı bir fark bulunmamasına rağmen bazı dağılımlarda Öklid mesafesi ölçüsünün kullanılmasının dalgalanmaya neden olan sonuçlar ürettiği belirlenmiştir. Ancak Gower mesafesinin daha kararlı bir yapıya sahip olması nedeniyle daha uygun bir tercih olarak önerilebileceği anlaşılmıştır. En Küçük Kareler Tahmin yönteminin uygulanabilirliği için bu çalışmada belirtilen gerekli varsayımların sağlanamadığı durumlarda Uzaklık Temelli Regresyon yöntemlerinin kullanılması önerilebilir.
Primary Language | English |
---|---|
Subjects | Statistical Analysis, Applied Statistics |
Journal Section | Research Articles |
Authors | |
Publication Date | |
Submission Date | December 11, 2024 |
Acceptance Date | January 16, 2025 |
Published in Issue | Year 2025 Volume: 8 Issue: 2 |