İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması

Eyüp Akçetin1; Ufuk Çelik2

doi:10.5505/iuyd.2014.43531

TR EN

İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması

Abstract

Bu çalışmanın amacı istenmeyen elektronik postaların (spam) tespiti için veri madenciliği yöntemlerinden karar ağaçları algoritmalarının performanslarının kıyaslanarak doğruluk ve sınıflandırma modeli oluşum zamanı açısından en uygun olanının tespit edilmesidir. İstenmeyen elektronik postaların sınıflandırılması için gerekli olan veriler Kaliforniya Üniversitesi makine öğrenmesi veri setlerinden alınan 4601 adet elektronik posta ile sağlanmıştır. Veri madenciliği yöntemlerinden 12 farklı karar ağacı WEKA makine öğrenmesi yazılımı kullanılarak, 10 katlı çapraz doğrulama ile veri setinde istenmeyen elektronik postalar (spam) sınıflandırılmıştır. Bu sınıflandırmanın performansı, alıcı işlem karakteristiği analizi yapılarak belirlenmiştir. Bu çalışmada, istenmeyen elektronik postaların (spam) tespiti için karar ağaçlarının performansı incelendiğinde, 12 sınıflandırıcının doğruluk oranlarının %94.68 ile %91 arasında değiştiği tespit edilmiştir. Yapılan çalışmada, performans sonuçlarına göre rastgele orman algoritmasının %94.68 doğruluk oranı ile en iyi sınıflandırma başarısını elde ettiği tespit edilmiştir. Bu algoritmanın 4601 elektronik posta için sınıflandırma modeli oluşturma zamanı 2.11 saniye olup, yoğun bir elektronik posta alışverişi sisteminde istenmeyen elektronik postaları (spam) hızlı bir şekilde ayırt edebileceği anlaşılmıştır.

Keywords

Elektronik posta, spam, karar ağaçları, veri madenciliği, makine öğrenmesi

Details

Primary Language

Turkish

Subjects

Business Administration

Journal Section

Research Article

Authors

Eyüp Akçetin1 This is me

Ufuk Çelik2 This is me

Publication Date

October 1, 2014

Submission Date

October 1, 2014

Acceptance Date

-

Published in Issue

Year 2014 Volume: 5 Number: 2

DOI

https://doi.org/10.5505/iuyd.2014.43531

IZ

https://izlik.org/JA58FP42ML

Cite

RIS / Bibtex

APA

Akçetin1, E., & Çelik2, U. (2014). İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması. Journal of Internet Applications and Management, 5(2), 43-56. https://doi.org/10.5505/iuyd.2014.43531

AMA

1.Akçetin1 E, Çelik2 U. İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması. iuyd. 2014;5(2):43-56. doi:10.5505/iuyd.2014.43531

Chicago

Akçetin1, Eyüp, and Ufuk Çelik2. 2014. “İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması”. Journal of Internet Applications and Management 5 (2): 43-56. https://doi.org/10.5505/iuyd.2014.43531.

EndNote

Akçetin1 E, Çelik2 U (October 1, 2014) İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması. Journal of Internet Applications and Management 5 2 43–56.

IEEE

[1]E. Akçetin1 and U. Çelik2, “İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması”, iuyd, vol. 5, no. 2, pp. 43–56, Oct. 2014, doi: 10.5505/iuyd.2014.43531.

ISNAD

Akçetin1, Eyüp - Çelik2, Ufuk. “İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması”. Journal of Internet Applications and Management 5/2 (October 1, 2014): 43-56. https://doi.org/10.5505/iuyd.2014.43531.

JAMA

1.Akçetin1 E, Çelik2 U. İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması. iuyd. 2014;5:43–56.

MLA

Akçetin1, Eyüp, and Ufuk Çelik2. “İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması”. Journal of Internet Applications and Management, vol. 5, no. 2, Oct. 2014, pp. 43-56, doi:10.5505/iuyd.2014.43531.

Vancouver

1.Eyüp Akçetin1, Ufuk Çelik2. İstenmeyen Elektronik Posta (Spam) Tespitinde Karar Ağacı Algoritmalarının Performans Kıyaslaması. iuyd. 2014 Oct. 1;5(2):43-56. doi:10.5505/iuyd.2014.43531