Bağımlı değişkenin sayıma dayalı veri olması durumunda güvenilir tahminler yapabilmek için Sayma Verisi Regresyon Modellerinin kullanılması daha uygundur. Sayıma dayalı veriler kesikli bir yapıda olduğundan bu regresyon modelleri kesikli dağılımlardan yararlanılarak geliştirilmiştir. Bu çalışmada, Türkiye İstatistik Kurumu (TÜİK) 2019 yılı Gelir ve Yaşam Koşulları Araştırması (GKYA) verilerinden yararlanarak bir sayma verisi olan bireylerin işsiz kaldığı sürenin (ay cinsinden) modellenmesi amaçlanmıştır. Analizde kullanılacak bağımsız değişkenler, tüm olası alt küme yöntemi ile medeni durum, eğitim durumu, genel sağlık ve kronik hastalık olarak belirlenmiştir. Sayma veri regresyon modellerinden Poisson Regresyon (PR), Negatif Binom Regresyon (NBR), Sıfır Değer Ağırlıklı Negatif Binom Regresyon (ZINB) ve Genelleştirilmiş Poisson Regresyon (GPR) modelleri ele alınarak, bu dört model tahmin edilmiş ve veri setine en iyi uyum sağlayan model bilgi kriterleri ile belirlenmiştir. Tahmin edilen modeller içerisinde veri setine en iyi uyum sağlayan modelin ZINB modeli olduğu belirlenmiştir.
Sayma veri modelleme Negatif Binom Regresyon Sıfır Değer Ağırlıklı Negatif Binom Regresyon Genelleştirilmiş Poisson Gelir ve Yaşam Koşulları Anketi
In cases where the dependent variable is count data, it is more appropriate to use Count Data Regression Models in order to produce reliable estimates. These regression models have been developed using discrete distributions since the count data has a discrete structure. The study, it is aimed to model the unemployment duration (in months) of individuals which is count data by using the data of the Survey of Income and Living Conditions (SILC) of the Turkish Statistical Institute (TURKSTAT) in 2019. The independent variables to be used in the analysis are marital status, educational status, general health, and chronic disease have been determined by all possible subset method. The Poisson Regression (PR), Negative Binomial Regression (NBR), Zero Inflated Negative Binomial Regression (ZINB), and Generalized Poisson Regression (GPR) models from count data regression models have been estimated and it has been determined the model best fits data by the information criteria. It has been determined that the model that best fits the data set among the predicted models is the ZINB model.
Count data modelling Negative binomial regression Zero-inflated negative binomial regression Generalized Poisson regression Income and Living Conditions Survey
Birincil Dil | Türkçe |
---|---|
Konular | Finans |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 20 Nisan 2022 |
Kabul Tarihi | 25 Ocak 2022 |
Yayımlandığı Sayı | Yıl 2022 |