Research Article

Veri Madenciliği Yöntemleri İle İşveren Sektörünün Sınıflandırılması

Number: 32 December 31, 2021
TR EN

Veri Madenciliği Yöntemleri İle İşveren Sektörünün Sınıflandırılması

Öz

Veri madenciliği algoritmalarının kullanımına hazır hale getirilmesi için, “Kaggle’da Veri Bilimi Anketi” isimli veri seti, veri madenciliği problem tanıma aşaması ile analiz edilmiştir. Analiz edilen veri seti ve karar verilen hedef doğrultusunda veri ön işleme aşaması da gerçekleştirilmiştir. Ön işleme aşaması çıktısı olarak elde edilen işlenmiş veri seti, veri madenciliği teknolojisi sınıflandırma yöntemine ait C4.5, Rastgele Orman ve K-En Yakın Komşu Algoritmaları ile modellenmiştir. Bu üç algoritmanın model başarı oranları hesaplanmıştır. Aralarındaki başarı oranı sapma değerleri analiz edilerek sapma değerlerine sebep olan durumlara değinilmiştir. Model başarı oranını etkileyen durumlara farklı bir açıdan daha bakılabilmesi için, bu üç algoritma ile yeni bir modelleme daha gerçekleştirilmiştir. İşlenmiş veri seti için karar verilen üç algoritma ve bu algoritmaların modelleme kriterleri ile gerçekleştirilen modelleme işlemi, orijinal veri seti kullanılarak da gerçekleştirilmiştir. İşlenmiş veri seti kullanılarak elde edilen modellerin başarı oranı hesaplamaları, orijinal veri seti için de hesaplanmış olup kıyaslamaları gerçekleştirilmiştir. Kullanılan veri seti, karar verilen yöntem, algoritma, algoritma kriter değerleri gibi model başarısını etkileyen etmenlerin kıyaslama işlemleri, gerçekleştirilen modelleme uygulamaları sayesinde somutlaştırılarak aktarılmıştır. Elde edilen bu kıyaslamalı örnekler referans alınarak, model başarı oranını etkileyen etmenler değerlendirilmiş olup, veri seti nitelik analizi ve Veri Madenciliği süreçleri hakkında sırasıyla çıkarımlar gerçekleştirilmiştir.

Anahtar Kelimeler

References

  1. Akpınar, H. (2000). Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği. İstanbul Üniversitesi İşletme Fakültesi Dergisi, C:29, Sayı:1, s:1-22.
  2. Altun, M. (2017). Veri Madenciliği ve Uygulama Alanları. Akdeniz Üniversitesi, Eğitim Bilimleri Bölümü, EYTEPE ABD Doktora Programı, Doktora Seminer Raporu.
  3. Awan, A. A. (2020). Data Science Survey on Kaggle. Kaggle: Your Machine Learning and Data Science Community. https://www.kaggle.com/kingabzpro/datascience-survey-on-kaggle
  4. Baykal, A. (2006). Veri Madenciliği Uygulama Alanları. Dicle Üniversitesi Ziya Gökalp Eğitim Fakültesi Dergisi.
  5. Breiman, L. (2001). Random Forest. Machine Learning, C:1, s:5-32.
  6. Coşlu, E. (2013). Veri Madenciliği. Akdeniz Üniversitesi, 15. Akademik Bilişim Konferansı.
  7. Çelik, M. (2009). Veri Madenciliğinde Kullanılan Sınıflandırma Yöntemleri ve Bir Uygulama. İstanbul Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri Anabilim Dalı, Yüksek Lisans Tezi.
  8. Esmer, S., Uçar, M. K., Çil, İ., & Bozkurt, M. R. (2020). Parkinson Hastalığı Teşhisi İçin Makine Öğrenmesi Tabanlı Yeni Bir Yöntem. Düzce Üniversitesi Bilim ve Teknoloji Dergisi, C:8, s:1877-1893.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

December 31, 2021

Submission Date

December 22, 2021

Acceptance Date

January 2, 2022

Published in Issue

Year 2021 Number: 32

APA
Doğan, E. K., & Şentürk, A. (2021). Veri Madenciliği Yöntemleri İle İşveren Sektörünün Sınıflandırılması. Avrupa Bilim Ve Teknoloji Dergisi, 32, 227-234. https://doi.org/10.31590/ejosat.1039844