Alcohol consumption has negative effects on individuals and societies in various areas, including health, economic, social and cultural aspects. Alcohol use prediction is a very important research topic to prevent the negative effects of alcohol. While dose-dependent alcohol use disorder is usually predicted in the literature, in this study, unlike the literature, dose-independent alcohol users are predicted. This prediction is made from electronic health record data using popular deep learning methods. The dataset used in the study consists of 24 different attributes including personal characteristics and health parameters of 991346 individuals collected from the National Health Insurance Service in Korea. The data were optimised after digitisation and normalisation preprocessing steps. A certain amount of training and test separation was applied to the dataset. Then, an alcohol user prediction model was developed using artificial neural networks, LSTM and CNN method. According to the results obtained, although the models achieved close prediction success, artificial neural networks achieved the best result. After artificial neural networks, CNN ranked second, and LSTM ranked last. By using more than one deep learning method together in the study, a conclusion about the general success of deep learning methods on the current problem has been made and a method that will make an important contribution to the solution of the problem has been put forward.
Alkol tüketiminin bireyler ve toplumlar üzerinde sağlıksal, ekonomik, sosyal ve kültürel yönler de dâhil olmak üzere çeşitli alanlarda olumsuz etkileri vardır. Alkol kullanımının öngörülmesi, alkolün olumsuz etkilerini önlemek için çok önemli bir araştırma konusudur. Literatürde genellikle doza bağlı alkol kullanım bozukluğu tahmin edilirken, bu çalışmada literatürden farklı olarak dozdan bağımsız alkol kullanıcısı tahmini yapılmaktadır. Bu tahmin popüler derin öğrenme yöntemleri kullanılarak elektronik sağlık kaydı verilerinden yapılmaktadır. Çalışmada kullanılan veri kümesi, Kore'deki Ulusal Sağlık Sigortası Hizmetinden toplanan 991346 bireye ait kişisel özellikler ve sağlık parametrelerini içeren 24 farklı öznitelikten oluşmaktadır. Veriler, sayısallaştırma ve normalizasyon ön işleme adımlarından sonra optimize edilmiştir. Veri kümesine belirli miktarda eğitim ve test ayrımı uygulanmıştır. Ardından, yapay sinir ağları, LSTM ve CNN yöntemi kullanılarak bir alkol kullanıcısı tahmin modeli geliştirilmiştir. Elde edilen sonuçlara göre modeller birbirine yakın tahmin başarısı elde etse de en iyi sonucu yapay sinir ağları elde etti. Yapay sinir ağlarından sonra CNN ikinci sırada, LSTM ise son sırada yer aldı. Çalışmada birden fazla derin öğrenme yöntemi bir arada kullanılarak derin öğrenme yöntemlerinin mevcut problem üzerindeki genel başarısı hakkında bir sonuca varılmış ve problemin çözümüne önemli katkı sağlayacak bir yöntem ortaya konulmuştur.
Birincil Dil | İngilizce |
---|---|
Konular | Yazılım Mühendisliği (Diğer) |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 30 Haziran 2025 |
Gönderilme Tarihi | 21 Mart 2025 |
Kabul Tarihi | 9 Mayıs 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 10 Sayı: 2 |