Pneumoconiosis is a chronic, irreversible lung disease that develops as a result of occupational exposure to inorganic dust, though it is preventable. The diagnosis of pneumoconiosis is based on occupational exposure history, clinical evaluation, and radiological findings; pathological confirmation is rarely required. Today, data-driven approaches are gaining increasing importance for the purposes of early diagnosis and risk estimation. Objective: The aim of this study is to develop machine learning-based models based on clinical and occupational data to predict the diagnosis of pneumoconiosis and to compare the classification performances of these models. Methods: A dataset including various variables such as age, years of employment in the sector, smoking status, radiological imaging results, and previous disease history was utilized within the scope of the study. Classification models were established using Logistic Regression and Random Forest (RF) algorithms, and their performances were evaluated using metrics such as Area Under the ROC Curve (AUC), sensitivity, specificity, and F1-score. Results: According to the obtained results, the Random Forest model exhibited higher performance with a test accuracy of 77.7%, an AUC of 0.868, and an F1-score of 0.816. The Logistic Regression model produced results with 75% accuracy, an AUC of 0.811, and an F1-score of 0.80, which are lower but possess high interpretability. According to the variable importance coefficients; HRCT findings, age, occupational duration, smoking pack-years, dust including silica, dyspnea, cough, gender, and sputum emerged as the most effective predictors in forecasting the disease. Conclusion: Machine learning algorithms offer alternative tools for the early diagnosis and risk assessment of occupational lung diseases such as pneumoconiosis; specifically, the Random Forest model demonstrates high success in terms of classification.
Pnömokonyoz, özellikle inorganik tozlara mesleki maruziyet sonucu gelişen, önlenebilir ancak geri dönüşümsüz özellikte seyreden kronik bir akciğer hastalığıdır. Pnömokonyoz tanısı mesleki maruziyet öyküsü, klinik değerlendirme ve radyolojik bulgulara dayanarak konulmakta, patolojik doğrulama nadiren gerekmektedir. Günümüzde, erken tanı ve risk tahmini amacıyla veri temelli yaklaşımlar giderek daha fazla önem kazanmaktadır. Amaç: Pnömokonyoz tanısını öngörmeye yönelik olarak klinik ve mesleki verilere dayalı makine öğrenmesi tabanlı modeller geliştirmek ve bu modellerin sınıflandırma performanslarını karşılaştırmaktır. Yöntem: Çalışma kapsamında yaş, sektörde çalışma yılı, sigara kullanımı, radyolojik görüntüleme sonuçları ve önceki hastalık öyküsü gibi çeşitli değişkenlerin yer aldığı veri seti kullanılmıştır. Lojistik regresyon ve rastgele orman (RF) algoritmaları ile sınıflandırma modelleri kurulmuş ve performansları ROC eğrisi altındaki alan (AUC), duyarlılık, özgüllük ve F1 skoru gibi metriklerle değerlendirilmiştir. Bulgular: Elde edilen sonuçlara göre, rastgele orman modeli %77,7 test doğruluğu, 0,868 AUC ve 0,816 F1 skoru ile daha yüksek performans sergilemiştir. Lojistik regresyon modeli ise %75 doğruluk, 0,811 AUC ve 0,80 F1 skoru ile daha düşük ancak yorumlanabilirliği yüksek sonuçlar üretmiştir. Değişken önem katsayılarına göre HRCT bulguları, yaş ve sektörel çalışma süresi, sigara paket yıl, silika dâhil toz, dispne, öksürük, cinsiyet, balgam değişkenleri hastalığın öngörülmesinde en etkili belirteçler olarak öne çıkmıştır. Sonuç: Makine öğrenmesi algoritmaları, Pnömokonyoz gibi mesleki akciğer hastalıklarının erken tanısı ve risk değerlendirmesi için alternatif araçlar sunmakta; özellikle rastgele orman modeli sınıflandırma açısından yüksek başarı göstermektedir.
| Primary Language | Turkish |
|---|---|
| Subjects | Work and Occupational Diseases |
| Journal Section | Research Article |
| Authors | |
| Submission Date | July 16, 2025 |
| Acceptance Date | February 23, 2026 |
| Publication Date | March 31, 2026 |
| DOI | https://doi.org/10.55517/mrr.1743958 |
| IZ | https://izlik.org/JA68TB33RA |
| Published in Issue | Year 2026 Volume: 9 Issue: 1 |