As a result of
experimental studies on different datasets, it is recommended to use machine
learning regression methods as an alternative to classical regression methods
in the existence of variables which are difficult to model. Health expenditure
is an indicator which is difficult to model and there is no study in the
literature about modelling health expenditure comparing machine learning
regression methods. In this study a
multiple regression model was conducted to predict health expenditure per
capita. Performance results of Lasso Regression, Random Forest Regression and
Support Vector Machine Regression compared when different hyperparameter values
were determined. Lambda (λ) value for Lasso Regression, number of trees for
Random Forest Regression, epsilon () value for Support Vector Regression was determined as hyperparameter
values. Study results performed by using “k” fold cross validation changed from
5 to 50, indicate the difference between machine learning results in terms of R2,
RMSE and MAE values that are statistically significant (p<0.001). Surface and bar plots and statistical test
results of prediction performances show that Random Forest Regression (R2
˃ 0.7500, RMSE ≤ 0.6000 ve MAE ≤ 0.4000) has better prediction performance
according to different hyperparameter values. It is hoped that study results
make contribution to studies about determining optimal hyperparameter values
for machine learning regression methods for studies about modelling health
expenditures.
Machine Learning Lasso Regression Random Forest Regression Support Vector Regression Health Expenditure
Farklı veri setleri üzerinde yapılan uygulamalar
sonucunda modellenmesi zor olan değişkenlerin varlığında klasik regresyon
yöntemlerine alternatif olarak makine öğrenmesi regresyon yöntemlerinin
kullanımı tavsiye edilmektedir. Sağlık harcaması modellenmesi zor olan bir
değişken olup, literatürde makine öğrenmesi regresyon yöntemleri karşılaştırılarak
bu değişkenin modellendiği bir çalışmaya rastlanmamıştır. Bu çalışmada kişi
başı sağlık harcamasının tahmini amacıyla bir çoklu regresyon modeli
oluşturulmuştur. Farklı hiperparametre değerleri belirlendiğinde elde edilen
Lasso Regresyon, Rastgele Ağaç Regresyonu ile Destek Vektör Makinesi Regresyon
performans sonuçları karşılaştırılmıştır. Çalışmada hiperparametre değeri
olarak Lasso Regresyon için lamda (λ) değeri, Rastgele Ağaç Regresyonu için
ağaç sayısı, Destek Vektör Regresyonu için epsilon () değeri esas alınmıştır. Sonuçlar 5 ile 50
arasında değişen “k” parça çapraz geçerlilik uygulanarak performe edildiğinde makine
öğrenmesi regresyon yöntemlerine ait performans sonuçlarının R2,
RMSE ve MAE değerleri bakımından istatistiksel olarak anlamlı farklılıklar gösterdiği
(p<0.001) tespit
edilmiştir. Tahmin performanslarına ait yüzey ve çubuk grafikleri ile
istatistiksel test sonuçları incelendiğinde farklı hiperparametre değerlerine
göre Rastgele Ağaç Regresyonun (R2 ˃ 0.7500, RMSE ≤ 0.6000 ve MAE ≤
0.4000) daha iyi tahmin sonuçlarına sahip olduğu belirlenmiştir. Çalışma
sonuçlarının, sağlık harcamasının modellendiği araştırmalar için makine
öğrenmesi regresyon yöntemleri kullanıldığında en uygun hiperparametre
değerlerinin belirlenmesi konusunda katkı sağlaması beklenmektedir.
Makine Öğrenmesi Lasso Regresyon Rastgele Ağaç Regresyonu Destek Vektör Regresyonu Sağlık Harcaması
Konular | Mühendislik |
---|---|
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 19 Eylül 2017 |
Gönderilme Tarihi | 7 Mart 2016 |
Kabul Tarihi | 19 Ağustos 2017 |
Yayımlandığı Sayı | Yıl 2017 Cilt: 22 Sayı: 2 |
DUYURU:
30.03.2021- Nisan 2021 (26/1) sayımızdan itibaren TR-Dizin yeni kuralları gereği, dergimizde basılacak makalelerde, ilk gönderim aşamasında Telif Hakkı Formu yanısıra, Çıkar Çatışması Bildirim Formu ve Yazar Katkısı Bildirim Formu da tüm yazarlarca imzalanarak gönderilmelidir. Yayınlanacak makalelerde de makale metni içinde "Çıkar Çatışması" ve "Yazar Katkısı" bölümleri yer alacaktır. İlk gönderim aşamasında doldurulması gereken yeni formlara "Yazım Kuralları" ve "Makale Gönderim Süreci" sayfalarımızdan ulaşılabilir. (Değerlendirme süreci bu tarihten önce tamamlanıp basımı bekleyen makalelerin yanısıra değerlendirme süreci devam eden makaleler için, yazarlar tarafından ilgili formlar doldurularak sisteme yüklenmelidir). Makale şablonları da, bu değişiklik doğrultusunda güncellenmiştir. Tüm yazarlarımıza önemle duyurulur.
Bursa Uludağ Üniversitesi, Mühendislik Fakültesi Dekanlığı, Görükle Kampüsü, Nilüfer, 16059 Bursa. Tel: (224) 294 1907, Faks: (224) 294 1903, e-posta: mmfd@uludag.edu.tr