Regresyon modelleri; birçok
açıklayıcı değişkenin önemini ortaya koyabilmek için tahmin, sınıflama, ve
analitik veri araçlarını kullanarak, veri analizinde etkili bir rol
oynamaktadır. Oldukça basit olmasına rağmen klasik doğrusal model, gerçek
hayattaki örneklerin doğrusal olmaması nedeniyle sıkça yetersiz kalmaktadır.
Bu çalışmada, çoklu doğrusal regresyon analizi varsayımlarından biri olan;
bağımlı değişkenin açıklayıcı değişkenler ile arasındaki ilişkinin belli bir
matematiksel forma uymasının zorunlu olmadığı parametrik olmayan bir
değerlendirme süreci ele alınacaktır. Bu anlamda bağımlı değişkenin iki
düzeyli değerler aldığı, daha çok neden-sonuç ilişkilerinin ortaya koyulması
amacıyla kullanılan klasik lojistik regresyon modelinin yerine, bağımlı
değişken ile açıklayıcı değişkenlerin aralarında var olan ilişki bir benzetim
çalışması kapsamında; genelleştirilmiş doğrusal model, toplamsal lojistik
regresyon model ve karar ağaçları ile incelenecektir. Benzetim çalışmasında
söz konusu olan yöntemler ile küçük, orta ve büyük ölçekli veri kümelerinde
çoklu bağlantının etkileri incelenecek ve bu yöntemler birbirleriyle
karşılaştırılacaktır.
Regression
models used to explore the importance of several explanatory variables in
estimation, classification and analytical tools play an efficient role for many
data analysis. Although the classical linear model is quite easy to use, it is
often not sufficient for many real data sets as the relationships between
variables do not hold the assumption of the linearity of the relationship
between dependent and explanatory variables. Under this study, a nonparametric
model fitting that does not require to form a strict mathematical relationship
between dependent and explanatory variables will be discussed on the contrary
the assumption in multiple linear regression. In this study, the relationship
between a binary dependent variable and the explanatory variables will be
examined in a conducted simulation study by using generalized linear, the
additive logistic regression in case of classical logistic regression model and
decision trees to explore the cause and effect relationship. The methods in question
and the simulation study will be performed for small, medium and large data
sets when multicollinearity problem exists and will be compared with each
other.
Subjects | Industrial Engineering |
---|---|
Journal Section | Research Articles |
Authors | |
Publication Date | April 1, 2017 |
Submission Date | June 22, 2016 |
Acceptance Date | November 23, 2016 |
Published in Issue | Year 2017 |
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.