Araştırma Makalesi
BibTex RIS Kaynak Göster

Makine Öğrenmesi Temelli Obezite Durum Tahminlemesi

Yıl 2024, Cilt: 17 Sayı: 2, 156 - 164
https://doi.org/10.54525/bbmd.1469701

Öz

Obezite ciddi bir halk sağlığı sorunudur ve Dünya üzerinde gittikçe artış göstermektedir. Biyolojik, fizyolojik, psikolojik ve çevresel faktörlerden etkilenen karmaşık bir konudur. Yaşam kalitesini olumsuz etkileyen bir hastalık olarak kabul edilmektedir. Yüksek tansiyon, koroner arter hastalığı, kalp krizi, uyku apnesi, nefes alma zorluğu, eklem ağrısı ve osteoartrit eklem hastalıklarının oluşmasına neden olabilir. Ayrıca çeşitli kanser türlerinin görülme riski obez bireylerde daha yüksektir. Yüksek tansiyon, yüksek kan şekeri, yüksek trigliserid seviyeleri ve düşük HDL kolesterol seviyeleri gibi faktörlerin bir araya gelmesiyle oluşan metabolik sendrom riskini de artırır. Çalışma, makine öğrenimi sınıflandırıcıları kullanarak obezite tahmini için risk faktörlerini belirlenmesini amaçlamaktadır. Makine öğrenimi yöntemleri özellikle büyük veri kümelerinin analiz edilmesi ve bu verilerden obezitenin ana belirleyici değişkenlerini saptanmasını kolaylaştırır. Bu yöntemlerin uygulanması ile risk faktörlerinin öncelikle belirlenerek takibinin kolaylaşmasını sağlayabilir. Makine öğrenimi, obeziteyle ilgili sonuçların anlaşılması ve tahmin edilmesi için umut verici bir yol sunmaktadır. Araştırmacılar, büyük veri kümelerinden ve karmaşık algoritmalardan yararlanarak obezitenin temel belirleyicilerini ve risk faktörlerini belirleyebilir ve bu da önleme ve müdahale stratejilerine bilgi sağlayabilir. Geliştirilmiş algoritmalar, gelişmiş tahmin başarımını ortaya koyar ve çeşitli veri kaynaklarının entegrasyonu, obezite tahmin modellerini daha da geliştirebilir. Bu bilgiler, küresel obezite problemine yönelik müdahalelerin geliştirilmesine rehberlik edebilir. Bu yöntemlerin uygulanması ile elde edilecek sonuçların kullanımı ile hastalık tanılamada uzmanlara yardımcı olacaktır ve karar vermelerinde destek sağlayacaktır. Çalışmada “kaggle” ortamında temin edilen ve içeriğinde on yedi parametreyi barındıran veri seti kullanılarak gerçekleştirilen makine öğrenmesi yöntemleri kullanılmıştır. Elde edilen sınıflandırma sonuçları hastalık riski olabilecek hastaların verilerinin diyabet risklerini belirlemede kullanılabilir. Bu veri kümesi üzerinde on bir farklı makine öğrenme algoritması kullanılmıştır. Bu makalede bu yöntemler karşılaştırılarak tahminde en başarılı yöntemler belirlenmiştir. Örneklemelerde veri seti içinden eğitim ve test seti oluşturulmuştur. Algoritmaların başarımı çeşitli metriklerle karşılaştırılmıştır. Ayrıca en başarılı birkaç algoritma değişkenlerin bazılarının ince ayar yapılarak başarımı arttırılmıştır. Uygulanan sınıflandırıcı algoritmalarından en başarılı başarım, Gradient Boost ve XGBoost kullanan modeller olmuştur. Bu modeller test verileri üzerinde %97 doğruluk değerini elde etmiştir. Literatür taramasında bu çalışmada elde edilen sonucun en iyi sonuç olduğu görülmektedir. Kısıtlı özelliklerle obezite konusunun çalışıldığı makalelere göre farklı özellikleri de dikkate alan bir veri kümesi olması ve on bir farklı modelleme ile obezite sınıflandırmalarının makine öğrenmesinin yapılması açısından da anlamlı bir çalışma olduğu düşünülmektedir.

Kaynakça

  • Khanna D., Peltzer C., Kahar P. ve Parmar, M. S. “Body mass index (BMI): a screening tool analysis,” Cureus, cilt 14, 2022.
  • Tan K. C. B. ve Ark., “Appropriate body-mass index for Asian populations and its implications for policy and intervention strategies,” The lancet, 2004.
  • Haslam D. W. ve James W. P. T., “Obesity,” The Lancet, cilt 366, pp. 1197-1209, 2005.
  • World Health Organization, World Health Organization, 2024.
  • World obesity day atlases: Obesity Atlas 2024 (no date) World Obesity Federation Global Obesity Observatory, 2024.
  • Palechor F. M, Manotas A. Estimation of obesity levels UCI dataset, Kaggle, 2021.
  • Quinlan J. R., “Induction of Decision Trees,” Machine Learning, cilt 1, pp. 81-106, 1986.
  • Breiman L., “Random Forests,” Machine Learning, vol. 45, pp. 5-32, 2001.
  • Tolles J. ve Meurer W. J., “Logistic Regression: Relating Patient Characteristics to Outcomes,” JAMA, cilt 316, p. 533, August 2016.
  • Hosmer D. W., Lemeshow S. ve Sturdivant R. X., “Applied Logistic Regression: Hosmer/Applied Logistic Regression,” 2005.
  • Silverman B. W. ve Jones M. C., “E. Fix and J.L. Hodges (1951): An Important Contribution to Nonparametric Discriminant Analysis and Density Estimation: Commentary on Fix and Hodges (1951),” International Statistical Review / Revue Internationale de Statistique, cilt 57, p. 233, December 1989.
  • Cover T. M. ve Hart P. E., “Nearest neighbor pattern classification,” IEEE Trans. Inf. Theory, cilt 13, pp. 21-27, 1967.
  • Doğan M., Orman A., Örkcü M. ve Örkcü H., “Çok gruplu sınıflandırma problemlerine regresyon analizi ve matematiksel programlama tabanlı yeni bir yaklaşım,” Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, June 2019.
  • Martinez A. M. ve Kak A. C., “PCA versus LDA,” IEEE Transactions on Pattern Analysis and Machine Intelligence, cilt 23, p. 228–233, 2001.
  • Hand D. J. ve Yu K., “Idiot’s Bayes: Not So Stupid after All?,” International Statistical Review / Revue Internationale de Statistique, cilt 69, p. 385, December 2001.
  • Caruana R. ve Niculescu-Mizil A., “An empirical comparison of supervised learning algorithms,” Proceedings of the 23rd International Conference on Machine Learning, New York, NY, USA, 2006.
  • Cortes C. ve Vapnik V., “Support-vector networks,” Machine Learning, cilt 20, p. 273–297, September 1995.
  • Madeh Piryonesi S. ve El-Diraby T. E., “Using Machine Learning to Examine Impact of Type of Performance Indicator on Flexible Pavement Deterioration Modeling,” Journal of Infrastructure Systems, cilt 27, June 2021.
  • Piryonesi S. M. ve El-Diraby T. E., “Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index,” Journal of Infrastructure Systems, cilt 26, p. 04019036, 2020.
  • Cybenko G., “Approximation by superpositions of a sigmoidal function,” Mathematics of Control, Signals, and Systems, cilt 2, p. 303–314, December 1989.
  • Freund Y. ve Schapire R. E., “A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting,” Journal of Computer and System Sciences, cilt 55, pp. 119-139, 1997.
  • Turan T., “Optimize Edilmiş Denetimli Öğrenme Algoritmaları ile Obezite Analizi ve Tahmini,” Mehmet Akif Ersoy Üniversitesi Fen Bilimleri Enstitüsü Dergisi, cilt 14, p. 301–312, 2023.
  • Cuhadar S. N., Karaduman G., Uyanik A. ve Durmaz H., “Performance Analysis Of Machine Learning-Based Models For Early Diagnosis Of Obesity Using Blood Test Parameters,” International Journal of Engineering Science and Application, cilt 7, p. 117–128, 2023.
  • Kabongo J., Luzolo M., CLEM’S ve D. R. Congo, “Five Machine Learning Supervised Algorithms for The Analysis and the Prediction of Obesity”.
  • Cui T., Chen Y., Wang J., Deng H. ve Huang Y., “Estimation of Obesity Levels Based on Decision Trees,” 2021 International Symposium on Artificial Intelligence and its Application on Media (ISAIAM), 2021.
  • Yagin F. H., Gülü M., Gormez Y., Castañeda-Babarro A., Colak C., Greco G., Fischetti F. ve Cataldi S., “Estimation of Obesity Levels with a Trained Neural Network Approach optimized by the Bayesian Technique,” Applied Sciences, cilt 13, p. 3875, March 2023.
  • Roy M., Das S. ve Protity A. T., OBESEYE: Interpretable Diet Recommender for Obesity Management using Machine Learning and Explainable AI, 2023.
  • Zheng Z. ve Ruggiero K., “Using machine learning to predict obesity in high school students,” 2017 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2017.
  • Singh B. ve Tawfik H., “Machine Learning Approach for the Early Prediction of the Risk of Overweight and Obesity in Young People,” Computational Science – ICCS 2020, Cham, 2020.
  • Montanez C. A. C., Fergus P., Hussain A., Al-Jumeily D., Abdulaimma B., Hind J. ve Radi N., “Machine learning approaches for the prediction of obesity using publicly available genetic profiles,” 2017 International Joint Conference on Neural Networks (IJCNN), 2017.
  • Kıvrak M., “Deep Learnıng-Based Predıctıon Of Obesıty Levels Accordıng To Eatıng Habıts And Physıcal Condıtıon,” The Journal of Cognitive Systems, cilt 6, p. 24–27, June 2021.
  • Daud N., Mohd Noor N. L., Aljunid S. A., Noordin N. ve Fahmi Teng N. I. M., “Predictive Analytics: The Application of J48 Algorithm on Grocery Data to Predict Obesity,” 2018 IEEE Conference on Big Data and Analytics (ICBDA), 2018.
  • Alqahtani A., Albuainin F., Alrayes R. ve Ark., “Obesity level prediction based on data mining techniques,” International journal of computer science and network security: IJCSNS, cilt 21, p. 103–111, 2021.
  • Jindal K., Baliyan N. ve Rana P. S., “Obesity Prediction Using Ensemble Machine Learning Approaches,” 2018.
  • Kitis S. ve Goker H., “Detection of Obesity Stages Using Machine Learning Algorithms,” Anbar Journal of Engineering Sciences, cilt 14, p. 80–88, April 2023.
  • Sançar B. ve Özcanarslan F., “Akademisyenlerin Obesite Farkındalıklarının Belirlenmesi: Toros Üniversitesi Örneği,” Uluslararası İktisadi ve İdari Bilimler Dergisi, cilt 7, December 2021.
  • Alebna P. L., Mehta A., Yehya A., daSilva-deAbreu A., Lavie C. J. ve Carbone S., “Update on obesity, the obesity paradox, and obesity management in heart failure,” Progress in Cardiovascular Diseases, cilt 82, pp. 34-42, 2024.

Machine Learning Based Obesity Status Prediction

Yıl 2024, Cilt: 17 Sayı: 2, 156 - 164
https://doi.org/10.54525/bbmd.1469701

Öz

Obesity is a serious public health problem and is increasing worldwide. It is a complex issue affected by biological, physiological, psychological and environmental factors. It is recognized as a disease that negatively affects quality of life. It can cause high blood pressure, coronary artery disease, heart attack, sleep apnea, breathing difficulties, joint pain and osteoarthritis joint diseases. In addition, the risk of various types of cancer is higher in obese individuals. It also increases the risk of metabolic syndrome, a combination of factors such as high blood pressure, high blood sugar, high triglyceride levels and low HDL cholesterol levels. The study aims to identify risk factors for obesity prediction using machine learning classifiers. Machine learning methods facilitate the analysis of large datasets and the identification of key determinants of obesity from these data. By applying these methods, risk factors can be identified first and follow-up can be facilitated. Machine learning offers a promising way to understand and predict obesity-related outcomes. By leveraging large datasets and complex algorithms, researchers can identify key determinants and risk factors of obesity, which can inform prevention and intervention strategies. Improved algorithms reveal improved prediction performance, and the integration of various data sources can further enhance obesity prediction models. This information can guide the development of interventions to address the global obesity problem. Using the results obtained by applying these methods will help experts in disease diagnosis and support decision-making. It is considered to be a meaningful study in terms of being a dataset that takes into account different features compared to the articles where obesity is studied with limited features and machine learning of obesity classifications with eleven different modeling.

Kaynakça

  • Khanna D., Peltzer C., Kahar P. ve Parmar, M. S. “Body mass index (BMI): a screening tool analysis,” Cureus, cilt 14, 2022.
  • Tan K. C. B. ve Ark., “Appropriate body-mass index for Asian populations and its implications for policy and intervention strategies,” The lancet, 2004.
  • Haslam D. W. ve James W. P. T., “Obesity,” The Lancet, cilt 366, pp. 1197-1209, 2005.
  • World Health Organization, World Health Organization, 2024.
  • World obesity day atlases: Obesity Atlas 2024 (no date) World Obesity Federation Global Obesity Observatory, 2024.
  • Palechor F. M, Manotas A. Estimation of obesity levels UCI dataset, Kaggle, 2021.
  • Quinlan J. R., “Induction of Decision Trees,” Machine Learning, cilt 1, pp. 81-106, 1986.
  • Breiman L., “Random Forests,” Machine Learning, vol. 45, pp. 5-32, 2001.
  • Tolles J. ve Meurer W. J., “Logistic Regression: Relating Patient Characteristics to Outcomes,” JAMA, cilt 316, p. 533, August 2016.
  • Hosmer D. W., Lemeshow S. ve Sturdivant R. X., “Applied Logistic Regression: Hosmer/Applied Logistic Regression,” 2005.
  • Silverman B. W. ve Jones M. C., “E. Fix and J.L. Hodges (1951): An Important Contribution to Nonparametric Discriminant Analysis and Density Estimation: Commentary on Fix and Hodges (1951),” International Statistical Review / Revue Internationale de Statistique, cilt 57, p. 233, December 1989.
  • Cover T. M. ve Hart P. E., “Nearest neighbor pattern classification,” IEEE Trans. Inf. Theory, cilt 13, pp. 21-27, 1967.
  • Doğan M., Orman A., Örkcü M. ve Örkcü H., “Çok gruplu sınıflandırma problemlerine regresyon analizi ve matematiksel programlama tabanlı yeni bir yaklaşım,” Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, June 2019.
  • Martinez A. M. ve Kak A. C., “PCA versus LDA,” IEEE Transactions on Pattern Analysis and Machine Intelligence, cilt 23, p. 228–233, 2001.
  • Hand D. J. ve Yu K., “Idiot’s Bayes: Not So Stupid after All?,” International Statistical Review / Revue Internationale de Statistique, cilt 69, p. 385, December 2001.
  • Caruana R. ve Niculescu-Mizil A., “An empirical comparison of supervised learning algorithms,” Proceedings of the 23rd International Conference on Machine Learning, New York, NY, USA, 2006.
  • Cortes C. ve Vapnik V., “Support-vector networks,” Machine Learning, cilt 20, p. 273–297, September 1995.
  • Madeh Piryonesi S. ve El-Diraby T. E., “Using Machine Learning to Examine Impact of Type of Performance Indicator on Flexible Pavement Deterioration Modeling,” Journal of Infrastructure Systems, cilt 27, June 2021.
  • Piryonesi S. M. ve El-Diraby T. E., “Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index,” Journal of Infrastructure Systems, cilt 26, p. 04019036, 2020.
  • Cybenko G., “Approximation by superpositions of a sigmoidal function,” Mathematics of Control, Signals, and Systems, cilt 2, p. 303–314, December 1989.
  • Freund Y. ve Schapire R. E., “A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting,” Journal of Computer and System Sciences, cilt 55, pp. 119-139, 1997.
  • Turan T., “Optimize Edilmiş Denetimli Öğrenme Algoritmaları ile Obezite Analizi ve Tahmini,” Mehmet Akif Ersoy Üniversitesi Fen Bilimleri Enstitüsü Dergisi, cilt 14, p. 301–312, 2023.
  • Cuhadar S. N., Karaduman G., Uyanik A. ve Durmaz H., “Performance Analysis Of Machine Learning-Based Models For Early Diagnosis Of Obesity Using Blood Test Parameters,” International Journal of Engineering Science and Application, cilt 7, p. 117–128, 2023.
  • Kabongo J., Luzolo M., CLEM’S ve D. R. Congo, “Five Machine Learning Supervised Algorithms for The Analysis and the Prediction of Obesity”.
  • Cui T., Chen Y., Wang J., Deng H. ve Huang Y., “Estimation of Obesity Levels Based on Decision Trees,” 2021 International Symposium on Artificial Intelligence and its Application on Media (ISAIAM), 2021.
  • Yagin F. H., Gülü M., Gormez Y., Castañeda-Babarro A., Colak C., Greco G., Fischetti F. ve Cataldi S., “Estimation of Obesity Levels with a Trained Neural Network Approach optimized by the Bayesian Technique,” Applied Sciences, cilt 13, p. 3875, March 2023.
  • Roy M., Das S. ve Protity A. T., OBESEYE: Interpretable Diet Recommender for Obesity Management using Machine Learning and Explainable AI, 2023.
  • Zheng Z. ve Ruggiero K., “Using machine learning to predict obesity in high school students,” 2017 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2017.
  • Singh B. ve Tawfik H., “Machine Learning Approach for the Early Prediction of the Risk of Overweight and Obesity in Young People,” Computational Science – ICCS 2020, Cham, 2020.
  • Montanez C. A. C., Fergus P., Hussain A., Al-Jumeily D., Abdulaimma B., Hind J. ve Radi N., “Machine learning approaches for the prediction of obesity using publicly available genetic profiles,” 2017 International Joint Conference on Neural Networks (IJCNN), 2017.
  • Kıvrak M., “Deep Learnıng-Based Predıctıon Of Obesıty Levels Accordıng To Eatıng Habıts And Physıcal Condıtıon,” The Journal of Cognitive Systems, cilt 6, p. 24–27, June 2021.
  • Daud N., Mohd Noor N. L., Aljunid S. A., Noordin N. ve Fahmi Teng N. I. M., “Predictive Analytics: The Application of J48 Algorithm on Grocery Data to Predict Obesity,” 2018 IEEE Conference on Big Data and Analytics (ICBDA), 2018.
  • Alqahtani A., Albuainin F., Alrayes R. ve Ark., “Obesity level prediction based on data mining techniques,” International journal of computer science and network security: IJCSNS, cilt 21, p. 103–111, 2021.
  • Jindal K., Baliyan N. ve Rana P. S., “Obesity Prediction Using Ensemble Machine Learning Approaches,” 2018.
  • Kitis S. ve Goker H., “Detection of Obesity Stages Using Machine Learning Algorithms,” Anbar Journal of Engineering Sciences, cilt 14, p. 80–88, April 2023.
  • Sançar B. ve Özcanarslan F., “Akademisyenlerin Obesite Farkındalıklarının Belirlenmesi: Toros Üniversitesi Örneği,” Uluslararası İktisadi ve İdari Bilimler Dergisi, cilt 7, December 2021.
  • Alebna P. L., Mehta A., Yehya A., daSilva-deAbreu A., Lavie C. J. ve Carbone S., “Update on obesity, the obesity paradox, and obesity management in heart failure,” Progress in Cardiovascular Diseases, cilt 82, pp. 34-42, 2024.
Toplam 37 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Bilgi Sistemleri Geliştirme Metodolojileri ve Uygulamaları
Bölüm Araştırma Makaleleri
Yazarlar

Ercan Ölçer 0000-0003-3786-6230

Erken Görünüm Tarihi 3 Aralık 2024
Yayımlanma Tarihi
Gönderilme Tarihi 17 Nisan 2024
Kabul Tarihi 9 Ağustos 2024
Yayımlandığı Sayı Yıl 2024 Cilt: 17 Sayı: 2

Kaynak Göster

IEEE E. Ölçer, “Makine Öğrenmesi Temelli Obezite Durum Tahminlemesi”, bbmd, c. 17, sy. 2, ss. 156–164, 2024, doi: 10.54525/bbmd.1469701.