Aim: 150 patients which aged 30 years and over were exposed to possible hypertension; age, gender, lipid profile, body mass
index, triglyceride , cigarette use and uric acid data are collected and hypertension database are created. 65 people is healthy, and
the remaining one is suffering from hypertension. It is aimed to estimate the hypertension disease from this database using the
Principal Component Analysis.
Material and Method: Decision Table, Naive Bayes, C4.5 and Multilayer Perceptron Network(MLP) classification algorithms
are applied to this database, then the size of the hypertension database is reduced by applying Principal Component Analysis and
the same methods are applied again and the results are compared.
Results: The most successful result of the algorithms that were processed under the same conditions gave Naive Bayes classifier
with 88% accuracy. Naive Bayes classifier was followed by the Decision Table algorithm with success rate of 85.33%, and ÇKA
algorithms with success rate of 82.67%. If the TBA analysis is applied to the hypertension database and the same algorithms are
re-processed under the same conditions and the TBA is compared to the untreated results, the C4.5 algorithm is normally the
most successful algorithm with 4% more successful results. The Decision Table algorithm, which yielded C4.5 algorithm with
2.67% more success rate respectively, and ÇKA which has a more successful result than 1.33%.
Conclusion: Algorithms except the Naive Bayes algorithm, improved their classification accuracy rate
Hypertension principal component analysis data mining decision tree
Amaç: Otuz yaş ve üzerindeki 150 hastadan, hipertansiyona etki etmesi muhtemel bilgilerden; cinsiyet, yaş, lipid profili,
trigliserid, vücut kütle indeksi, ürik asit ve sigara kullanımı verileri toplanmış ve bir hipertansiyon veritabanı oluşturulmuştur. Bu
kişilerden 65’i sağlıklı, geriye kalan 85 kişi ise hipertansiyon hastasıdır. Bu veritabanından hipertansiyon hastalığının Temel
Bileşen Analizi kullanılarak tahmin edilmesi amaçlanmıştır.
Gereç ve Yöntem: Naive Bayes, Çok Katmanlı Algılayıcı Ağ (ÇKA), Karar Tablosu ve C4.5 sınıflandırma algoritmaları
uygulanmış, ardından Temel Bileşenler Analizi uygulanarak hipertansiyon veritabanının boyutu indirgenmiş ve aynı
sınıflandırma algoritmaları tekrar uygulanmış ve sonuçlar karşılaştırılmıştır.
Bulgular: Aynı şartlarda işleme sokulan algoritmalardan en başarılı sonucu %88 doğruluk oranıyla Naive Bayes sınıflandırıcısı
vermiştir. Naive Bayes sınıflandırıcısını sırasıyla %85,33 başarı oranıyla Karar Tablosu algoritması, %82,67 başarı oranıyla
ÇKA algoritmaları takip etmiştir. Hipertansiyon veritabanına TBA analizi uygulanıp, aynı şartlarda aynı algoritmalar tekrar
işleme sokulup, TBA uygulanmayan sonuçlarla kıyaslandığında ise, C4.5 algoritması normalden %4 daha başarılı sonuç vererek
en başarılı algoritma olmuştur. C4.5 algoritmasını sırasıyla %2,67 daha başarılı sonuç veren Karar Tablosu algoritması ve %1,33
daha başarılı sonuç veren ÇKA izlemiştir.
Sonuç: Naive Bayes sınıflandırıcı haricindeki tüm algoritmalarda Temel Bileşenler Analizi’nin sınıflandırma başarısını artırdığı
görülmüştür.
Hipertansiyon temel bileşen analizi veri madenciliği Karar ağacı
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Aralık 2020 |
Gönderilme Tarihi | 6 Şubat 2020 |
Yayımlandığı Sayı | Yıl 2020 Cilt: 12 Sayı: 3 |