Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması

G. Eryiğit; C. Tantuğ; E. Adalı

EN TR

Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması

Öz

Bu makalenin amacı, yaramaz (spam) epostaları, normal e-postalardan ayırma süreci için, karar destek makineleri (Support Vector Machines - SVM), bellek tabanlı öğrenme (Memory Based Learning - MBL) ve Naïve Bayes (NB) yöntemlerinin karşılaştırmalı değerlendirmesini yapmaktır. Yaramaz e-posta-ların süzülmesinde kullanılan yöntemleri karşılaştıran birçok çalışma olmasına karşın, bu çalışmaların büyük çoğunluğu, farklı veri kümeleri kullandıklarından karşılaştırılabilir nitelikte değildir. Bu çalışmada, SVM, MBL ve NB yöntemleri karşılaştırılırken, herkesin erişimine açık olan ortak bir derlem (corpus) olan LINGSPAM derlemi kullanılmıştır. MBL ve NB yöntemleri, önceki çalışmalarda bu veri kümesi üzerinde sınandığı için, önceki deneylerden elde edilen en iyi parametreler ufak değişikliklerle kullanılmıştır. Ancak SVM yönteminin en iyi sonucu vermesini sağlamak için çok sayıda deney yapılmıştır. Çalışmamızda bir e-postanın, yaramaz olarak tanınması durumunda, bu e-postaya nasıl davranılacağına ilişkin senaryo önerileri verilmiş ve gerçeklenen sınıflandırıcıların hatalı çalışması durumunda ilgili senaryolara göre ortaya çıkabilecek hataların bedeli göz önüne alınarak bu üç sınıflandırma yöntemi değerlendirilmiştir. Ortaya çıkan sonuçlarda, SVM yönteminin hata bedelinin sıfır olduğu ya da yüksek olduğu senaryolar için başarımının diğer yöntemlerden daha iyi olduğu görülmüştür. Ancak hata bedelinin çok yüksek olması durumunda ise NB yöntemi en iyi sonucu vermiştir.

Anahtar Kelimeler

Kaynakça

1 Horvitz. 1998. “A Bayesian Approach to Filtering Junk E-Mail”. Learning for Text Categorization – Papers from the AAAI Workshop, pages 55–62, Madison Wisconsin. AAAI Technical Report WS-98-05.
[2] Androutsopoulos I., Koutsias J., Chandrinos K.V., Paliouras G., Spyropoulos C.D., 2000. “An Evaluation of Naive Bayesian Anti-Spam Filtering“. Proceedings of the workshop on machine Learning in the New Information Age, 11th European Conference on Machine Learning (ECML 2000), Barcelona, Spain, pp. 9-17.
[3] Sakkis G., Androutsopoulos I., Paliouras G., Karkaletsis V., Spyropoulos C.D., Stamatopoulos P., 2003, “A Memory-Based Approach to Anti-Spam Filtering for Mailing Lists”, Information Retrieval 6(1), 49-73, Kluwer Publishing
[4] Xavier Carreras, Lluís Marquez, Boosting Trees for Anti-Spam Email Filtering (2001), Proceedings of RANLP-01, 4th International Conference on Recent Advances in Natural Language Processing
[5] Drucker H., Wu D., Vapnik V.N., 1999. “Support Vector Machines for Spam Categorization”, IEEE Transactions On Neural Networks, pages 1048-1054.
[6] Karl-Michael Schneider, A Comparison of Event Models for Naive Bayes Anti-Spam EMail Filtering, 10th Conference of the European Chapter of the Association for Computational Linguistics (EACL 03), pp. 207-314, 2003.
[7] Androutsopoulos I., Paliouras G., Karkaletsis V., Sakkis G., Spyropoulos C.D., Stamatopoulos P., 2000, “Learning to filter Spam E-Mail: AComparison of a Naïve Bayesian and a Memory-Based Approach ”, Proc. of the workshop on Machine Learning and Textual Information Access, 4th European Conference on Principles and Practice of Knowledge Discovery in Databases, France
[8] Duda, R.O. and P.E. Hart. 1973. “Bayes Decision Theory”. Chapter 2 in Pattern Classification and Scene Analysis, pages 10–43. John Wiley.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yazarlar

G. Eryiğit Bu kişi benim
İSTANBUL TEKNİK ÜNİVERSİTESİ, BİLGİSAYAR VE BİLİŞİM FAKÜLTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

C. Tantuğ Bu kişi benim
İSTANBUL TEKNİK ÜNİVERSİTESİ, BİLGİSAYAR VE BİLİŞİM FAKÜLTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

E. Adalı Bu kişi benim
İSTANBUL TEKNİK ÜNİVERSİTESİ, BİLGİSAYAR VE BİLİŞİM FAKÜLTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Yayımlanma Tarihi

24 Haziran 2016

Gönderilme Tarihi

24 Haziran 2016

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2005 Cilt: 1 Sayı: 1

IZ

https://izlik.org/JA72CH62XA

Kaynak Göster

RIS / Bibtex

APA

Eryiğit, G., Tantuğ, C., & Adalı, E. (2016). Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 1(1). https://izlik.org/JA72CH62XA

AMA

1.Eryiğit G, Tantuğ C, Adalı E. Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması. TBV-BBMD. 2016;1(1). https://izlik.org/JA72CH62XA

Chicago

Eryiğit, G., C. Tantuğ, ve E. Adalı. 2016. “Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 1 (1). https://izlik.org/JA72CH62XA.

EndNote

Eryiğit G, Tantuğ C, Adalı E (01 Haziran 2016) Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 1 1

IEEE

[1]G. Eryiğit, C. Tantuğ, ve E. Adalı, “Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması”, TBV-BBMD, c. 1, sy 1, Haz. 2016, [çevrimiçi]. Erişim adresi: https://izlik.org/JA72CH62XA

ISNAD

Eryiğit, G. - Tantuğ, C. - Adalı, E. “Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 1/1 (01 Haziran 2016). https://izlik.org/JA72CH62XA.

JAMA

1.Eryiğit G, Tantuğ C, Adalı E. Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması. TBV-BBMD. 2016;1. Available at https://izlik.org/JA72CH62XA.

MLA

Eryiğit, G., vd. “Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 1, sy 1, Haziran 2016, https://izlik.org/JA72CH62XA.

Vancouver

1.G. Eryiğit, C. Tantuğ, E. Adalı. Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması. TBV-BBMD [Internet]. 01 Haziran 2016;1(1). Erişim adresi: https://izlik.org/JA72CH62XA

Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması

Öz

Anahtar Kelimeler

Yaramaz E-Postaların Süzülmesinde, Karar Destek Makineleri, Naïve Bayes ve Bellek Tabanlı Öğrenme Yöntemlerinin Karşılaştırılması

Öz

Anahtar Kelimeler

Kaynakça

Ayrıntılar

Birincil Dil

Konular

Bölüm

Yazarlar

Yayımlanma Tarihi

Gönderilme Tarihi

Kabul Tarihi

Yayımlandığı Sayı

IZ

Kaynak Göster

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü