The healthcare industry today has to deal with huge piles of data. Data mining methodologies are used for many purposes such as better understanding diseases and improving health services by analyzing the information in the depths of these data. This study investigates how Gradient Boosting, a data mining classification technique, can categorize micro health data. In the study, micro data for 2022 obtained from the Turkish Statistical Institute (TUIK) was used. Health status determination was estimated by using 9 independent variables obtained from the questionnaire used in the research in the analyses. Additionally, the effects of various socio-demographic factors (age, gender, marital and employment status) and lifestyle habits (tobacco use) on general health were analyzed. The results of the study show how effective machine learning methods can be in the healthcare sector. Among these models, the Gradient Boosting model came to the fore in the analysis of classification performance, taking into account metrics such as accuracy, sensitivity, sensitivity and F1 score, providing important information that will contribute to the development of health policies and interventions. In particular, determining the negative effects of tobacco use on health reveals that these factors have a great impact on human health. These findings indicate that machine learning can provide significant benefits in the development of health policies and public health programs.
Data Mining Classification Microhealth Data Machine Learning Gradient Boosting
Sağlık sektörü, günümüzde devasa veri yığınlarıyla başa çıkmak zorundadır. Bu verilerin derinliklerindeki bilgileri çözümleyerek hastalıkları daha iyi anlama ve sağlık hizmetlerini geliştirme gibi birçok amaç doğrultusunda veri madenciliği metodolojileri kullanılmaktadır. Bu çalışma, bir veri madenciliği sınıflandırma tekniği olan Gradient Boosting’in, mikro sağlık verilerini nasıl kategorize edebileceğini araştırmaktadır. Çalışmada, Türkiye İstatistik Kurumu’ndan (TÜİK) elde edilen 2022 yılına ait mikro veriler kullanılmıştır. Araştırmada kullanılan soru formundan elde edilen 9 adet bağımsız değişken, analizlerde kullanılarak sağlık durum tespiti tahmin edilmiştir. Ayrıca, çeşitli sosyo-demografik faktörlerin (yaş, cinsiyet, medeni ve çalışma durumu) ve yaşam tarzı alışkanlıklarının (tütün kullanımı) genel sağlık üzerindeki etkileri analiz edilmiştir. Çalışmanın sonuçları, makine öğrenmesi metodlarının sağlık sektöründe ne denli etkili olabileceğini göstermektedir. Bu modeller arasında Gradient Boosting modeli, sınıflandırma performansında, doğruluk, hassasiyet, duyarlılık ve F1 skoru gini metrikler dikkate alınarak yapılan incelemede ön plana çıkarak, sağlık politikalarının ve müdahalelerinin geliştirilmesine katkıda bulunacak önemli bilgiler sunmuştur. Özellikle, tütün kullanımının sağlık üzerindeki olumsuz etkilerinin belirlenmesi, bu faktörlerin insan sağlığına etkisinin büyük olduğunu ortaya koymaktadır. Bu bulgular, sağlık politikaları ve halk sağlığı programlarının geliştirilmesinde makine öğrenmesinin önemli faydalar sağlayabileceğine işaret etmektedir.
Veri Madenciliği Sınıflandırma Mikro Sağlık Verileri Makine Öğrenmesi Gradient Boosting
Birincil Dil | Türkçe |
---|---|
Konular | Nicel Karar Yöntemleri |
Bölüm | Makaleler |
Yazarlar | |
Erken Görünüm Tarihi | 11 Kasım 2024 |
Yayımlanma Tarihi | 2 Aralık 2024 |
Gönderilme Tarihi | 29 Mayıs 2024 |
Kabul Tarihi | 31 Ağustos 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 24 Sayı: 6 |
Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.