Year 2020, Volume , Issue 18, Pages 188 - 195 2020-04-15

Dayanıklı (Robust) Regresyon: Karşılaştırmalı Simülasyon Çalışması

Yasin BÜYÜKKÖR [1] , Ali Kemal ŞEHİRLİOĞLU [2]


Günümüzde birçok araştırmacı regresyon analizinde hata teriminin dağılışının Gausyan (Normal) olduğunu varsaymakta ve regresyon parametrelerinin tahminini yaparken için En Küçük Kareler (EKK) yöntemini kullanmaktadır. Ancak uygulamada normal dağılış varsayımı kabul edilse bile artıklar genellikle normal dağılıştan farklı bir dağılış göstermektedirler. Özellikle veri setinde bulunan sapan gözlemler veya sapan gözlem olduğundan şüphelenilen gözlemler, verilerin normallik varsayımını bozmakta ve EKK yöntemi ile yapılan parametre tahminleri hatalı (sapmalı) olmaktadır. Araştırmacılar böyle durumların üstesinden gelebilmek için son yıllarda sıklıkla kullanılan dayanıklı (robust) yöntemleri kullanmaktadırlar. Bu yöntemlerin arasında en çok kullanılan M- tahminciler (En Yüksek Olabilirlik tipi) gelmektedir. M- tahminleme yöntemi, En Çok Olabilirlik (MLE) yönteminin genelleştirilmiş bir versiyonudur ve EKK yöntemi de bir M- tahminci olarak bilinmektedir. M- tahminleme yöntemi, eldeki veri setine uygun bir amaç fonksiyonunu minimize ederek parametre tahminlerini iteratif olarak elde etmektedir. Bu çalışmada farklı senaryolar ele alınarak EKK yöntemi, Huber M- tahminleme yöntemi ve Tukey Bisquare M- tahminleme yöntemi karşılaştırılmıştır. Ayrıca bu yöntemlerin amaç, etki ve ağırlık fonksiyonları incelenmiştir. Regresyon parametreleri tahminlenirken İteratif Olarak Tekrar Ağırlıklandırılan En Küçük Kareler (IRWLS) yöntemi kullanılmıştır. IRWLS yönteminde bir başlangıç çözümü uygun bir tahminleme yöntemiyle seçilir (Örn: EKK) ve M- tahminleme yöntemlerinin ağırlık fonksiyonları kullanılarak Ağırlıklı EKK yöntemiyle iteratif olarak parametre tahminleri elde edilir. Elde edilen parametre tahminleri Ortalama Karesel Hata (MSE), Sapma ve R2 kriterleri açısından karşılaştırılmıştır. Eğer veri seti normal ise en kullanışlı yöntem EKK iken veri setinde kirlenme (contaminated) veya sapan gözlem olduğunda EKK yönteminin etkinliğini kaybettiği görülmüştür. Özellikle açıklanan değişken Y yönünde sapan gözlem olduğunda Huber ve Tukey M- tahminleme yöntemleri EKK’ya göre daha iyi sonuçlar vermektedir.
Dayanıklı (Robust) Regresyon, M- Tahminciler, Sapan Gözlem, İteratif Olarak Tekrar Ağırlıklandırılmış En Küçük Kareler
  • Andersen, R. (2008). Modern methods for robust regression (No. 152). Sage.
  • Beaton, A. E., ve Tukey, J. W. (1974). The fitting of power series, meaning polynomials, illustrated on band-spectroscopic data. Technometrics, 16(2), 147-185.
  • Draper, N. R.,ve Smith, H. (2014). Applied regression analysis(Vol. 326). John Wiley & Sons.
  • Hampel FR, Ronchetti EM, Rousseuw PJ, Stahel WA (1986) Robust statistics. The approach based on influence functions. Wiley, New York.
  • Hogg, R. V. (1979). Statistical robustness: One view of its use in applications today. The American Statistician, 33(3), 108-115.
  • Huber, Peter J. Robust Estimation of a Location Parameter. Ann. Math. Statist. 35 (1964), no. 1, 73--101. doi:10.1214/aoms/1177703732.
  • Rousseeuw, P. J., ve Leroy, A. M. (1987). Robust regression and outlier detection (Vol. 1). New York: Wiley.
  • Stuart, C. (2011). Robust regression. Department of Mathematical Sciences, Durham University, 169.
Primary Language tr
Subjects Engineering
Journal Section Articles
Authors

Orcid: 0000-0002-1006-0539
Author: Yasin BÜYÜKKÖR (Primary Author)
Institution: KARAMANOGLU MEHMETBEY UNIVERSITY
Country: Turkey


Orcid: 0000-0001-5190-6740
Author: Ali Kemal ŞEHİRLİOĞLU
Institution: DOKUZ EYLÜL ÜNİVERSİTESİ
Country: Turkey


Thanks Danışaman Hocam ve tez çalışmasında büyük katkıları olan Prof. Dr. Ali Kemal ŞEHİRLİOĞLU' na sonsuz teşekkürlerimi sunuyorum.
Dates

Publication Date : April 15, 2020

APA Büyükkör, Y , Şehi̇rli̇oğlu, A . (2020). Dayanıklı (Robust) Regresyon: Karşılaştırmalı Simülasyon Çalışması . Avrupa Bilim ve Teknoloji Dergisi , (18) , 188-195 . DOI: 10.31590/ejosat.678710