TR
EN
Veri Madenciliği Yöntemleri İle İşveren Sektörünün Sınıflandırılması
Öz
Veri madenciliği algoritmalarının kullanımına hazır hale getirilmesi için, “Kaggle’da Veri Bilimi Anketi” isimli veri seti, veri madenciliği problem tanıma aşaması ile analiz edilmiştir. Analiz edilen veri seti ve karar verilen hedef doğrultusunda veri ön işleme aşaması da gerçekleştirilmiştir. Ön işleme aşaması çıktısı olarak elde edilen işlenmiş veri seti, veri madenciliği teknolojisi sınıflandırma yöntemine ait C4.5, Rastgele Orman ve K-En Yakın Komşu Algoritmaları ile modellenmiştir. Bu üç algoritmanın model başarı oranları hesaplanmıştır. Aralarındaki başarı oranı sapma değerleri analiz edilerek sapma değerlerine sebep olan durumlara değinilmiştir. Model başarı oranını etkileyen durumlara farklı bir açıdan daha bakılabilmesi için, bu üç algoritma ile yeni bir modelleme daha gerçekleştirilmiştir. İşlenmiş veri seti için karar verilen üç algoritma ve bu algoritmaların modelleme kriterleri ile gerçekleştirilen modelleme işlemi, orijinal veri seti kullanılarak da gerçekleştirilmiştir. İşlenmiş veri seti kullanılarak elde edilen modellerin başarı oranı hesaplamaları, orijinal veri seti için de hesaplanmış olup kıyaslamaları gerçekleştirilmiştir. Kullanılan veri seti, karar verilen yöntem, algoritma, algoritma kriter değerleri gibi model başarısını etkileyen etmenlerin kıyaslama işlemleri, gerçekleştirilen modelleme uygulamaları sayesinde somutlaştırılarak aktarılmıştır. Elde edilen bu kıyaslamalı örnekler referans alınarak, model başarı oranını etkileyen etmenler değerlendirilmiş olup, veri seti nitelik analizi ve Veri Madenciliği süreçleri hakkında sırasıyla çıkarımlar gerçekleştirilmiştir.
Anahtar Kelimeler
References
- Akpınar, H. (2000). Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği. İstanbul Üniversitesi İşletme Fakültesi Dergisi, C:29, Sayı:1, s:1-22.
- Altun, M. (2017). Veri Madenciliği ve Uygulama Alanları. Akdeniz Üniversitesi, Eğitim Bilimleri Bölümü, EYTEPE ABD Doktora Programı, Doktora Seminer Raporu.
- Awan, A. A. (2020). Data Science Survey on Kaggle. Kaggle: Your Machine Learning and Data Science Community. https://www.kaggle.com/kingabzpro/datascience-survey-on-kaggle
- Baykal, A. (2006). Veri Madenciliği Uygulama Alanları. Dicle Üniversitesi Ziya Gökalp Eğitim Fakültesi Dergisi.
- Breiman, L. (2001). Random Forest. Machine Learning, C:1, s:5-32.
- Coşlu, E. (2013). Veri Madenciliği. Akdeniz Üniversitesi, 15. Akademik Bilişim Konferansı.
- Çelik, M. (2009). Veri Madenciliğinde Kullanılan Sınıflandırma Yöntemleri ve Bir Uygulama. İstanbul Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri Anabilim Dalı, Yüksek Lisans Tezi.
- Esmer, S., Uçar, M. K., Çil, İ., & Bozkurt, M. R. (2020). Parkinson Hastalığı Teşhisi İçin Makine Öğrenmesi Tabanlı Yeni Bir Yöntem. Düzce Üniversitesi Bilim ve Teknoloji Dergisi, C:8, s:1877-1893.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
December 31, 2021
Submission Date
December 22, 2021
Acceptance Date
January 2, 2022
Published in Issue
Year 2021 Number: 32