Sağlık harcamaları, ülkelerin ekonomik sürdürülebilirliği ve sağlık politikalarının etkinliği açısından kritik öneme sahiptir. Bu harcamaların doğru biçimde modellenmesi karmaşık bir süreçtir ve klasik regresyon yöntemlerinin ötesinde yaklaşımlar gerektirir. Bu çalışma, 190 ülkenin 2022 yılına ait Dünya Bankası verileri kullanılarak kişi başına sağlık harcamalarını makine öğrenmesi ve düzenlileştirilmiş regresyon yöntemleriyle tahmin etmeyi amaçlamıştır.
Veri bütünlüğünü sağlamak için eksik değerler Zincirleme Denklemlerle Çoklu Atama (MICE) yöntemiyle tamamlanmıştır. Bağımlı değişken kişi başına sağlık harcaması olup, bağımsız değişkenler sosyoekonomik ve demografik göstergeleri içermektedir. Altı model—Destek Vektör Regresyonu (SVR), Rastgele Ormanlar (RF), Aşırı Gradyan Artırma (XGBoost), Elastic Net, Lasso ve Ridge regresyonu—RMSE, MAE ve R² ölçütleri kullanılarak karşılaştırılmıştır. En iyi performans SVR modeliyle elde edilmiştir (RMSE = 463 ± 13.3, R² = 0.940 ± 0.003). XGBoost modeli en düşük MAE değerine (262 ± 15.5) ve yüksek doğruluk oranına (R² = 0.923 ± 0.007) ulaşmıştır. Kişi başına düşen GSYİH en güçlü yordayıcı olurken, yaşlı nüfus oranı, yaşam beklentisi ve kentleşme oranı ikincil katkılar sağlamıştır. SVR ve XGBoost modelleri yüksek tahmin gücü sergileyerek sağlık harcamalarının öngörülmesinde politika yapıcılar için değerli karar destek araçları olarak öne çıkmaktadır.
Çalışmalarda gerçekleştirilen tüm prosedürler, benzer kurumsal ve/veya ulusal araştırma komitelerinin etik standartlarına uygundur.
Herhangi bir kurum veya kuruluştan destek alınmamaktadır.
.
Health expenditures are crucial for countries’ economic sustainability and the effectiveness of health policies. Accurately modeling these expenditures is complex and requires methods beyond classical regression. This study aimed to estimate per capita health expenditures using machine learning and regularized regression approaches based on 2022 World Bank data from 190 countries.
Missing values were imputed using the Multiple Imputation by Chained Equations (MICE) method. The dependent variable was per capita health expenditure, while independent variables included socioeconomic and demographic indicators. Six models—Support Vector Regression (SVR), Random Forest (RF), Extreme Gradient Boosting (XGBoost), Elastic Net, Lasso, and Ridge—were compared using RMSE, MAE, and R² metrics. SVR achieved the best performance (RMSE = 463 ± 13.3, R² = 0.940 ± 0.003). XGBoost yielded the lowest MAE (262 ± 15.5) with high accuracy (R² = 0.923 ± 0.007). GDP per capita was the most important predictor, followed by the proportion of elderly population, life expectancy, and urbanization rate. SVR and XGBoost models demonstrated high predictive power, highlighting their potential as decision-support tools for forecasting health expenditures.
All procedures performed in studies comply with the ethical standards of comparable institutional and/or national research committees.
No support is taken from any institution or organization.
.
| Primary Language | English |
|---|---|
| Subjects | Econometrics (Other) |
| Journal Section | Research Article |
| Authors | |
| Submission Date | September 28, 2025 |
| Acceptance Date | October 16, 2025 |
| Publication Date | December 29, 2025 |
| Published in Issue | Year 2025 Volume: 12 Issue: 2 |
PIAR is licensed under a Creative Commons Attribution 4.0 International License.
