Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu
Abstract
Kısa
mesaj servisi en yaygın kullanılan iletişim kanallarından biridir. Kişisel,
reklam, promosyon, etkinlik bildirimi, satış onaylama vb. bir çok farklı amaç
için kullanılan kısa mesajların
sayısının her geçen gün artması takip edilebilirliklerini ve aranan
mesajın mesaj kutusunda hızlıca bulunmasını zorlaştırmaktadır. Öte yandan
istenmeyen mesajların mesaj kutusunu doldurması ve mesaj kirliliği yaratması
bir diğer önemli problemdir. Bu çalışmada Türkçe Kısa Mesajları sınıflandırmak
ve akıllı bir SMS kutusu oluşturmak amacıyla Çok Katmanlı Süzgeçleme Mimarisi
önerilmiştir. Ayrıca bu mimari bir Android uygulaması üzerinde gerçeklenmiştir.
Bu mimari yardımı ile telefona ulaşan mesajlar kişisel, ticari, otp kodları,
hatırlatıcı ve istenmeyen adı altında 5 farklı kategoriye ayrılmaktadır.
Önerilen mimari Kara Liste, Regex, Makine öğrenmesi, ve Beyaz Liste
süzgeçlerinden oluşmaktadır. Makine öğrenmesi süzgecinde Naive Bayes, Bayes
Net, J48 ve Random Forest algoritmalarının performansları incelenmiştir ve Random
Forest %87’lik başarısı nedeniyle uygulamada tercih edilmiştir. Önerilen çok
katmanlı yapı sayesinde mesaj sınıflandırma süresi azaltılırken sınıflandırma
başarısı %93’e yükseltilmiştir. Ayrıca başarının yükseltilmesinde seçilen
özellikler ve Zemberek kütüphanesinin kullanımı ile kelimelerin türlerinin ve köklerinin elde
edilmesi önemli rol oynamıştır.
Keywords
References
- 1. Zhu, S., Ji, X., Xu, W., & Gong, Y. (2005, August). Multi-labelled classification using maximum entropy method. In Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval (pp. 274-281). ACM. 2. Klimt, B., & Yang, Y. (2004, September). The enron corpus: A new dataset for email classification research. In European Conference on Machine Learning (pp. 217-226). Springer, Berlin, Heidelberg.
- 3. Healy, M., Delany, S. J., & Zamolotskikh, A. (2004). An assessment of case base reasoning for short text message classification
- 4. Najadat H., Abdulla, N., Abooraig, R. ve Nawasrah S. (2014). Mobile SMS Spam Filtering based on Mixing Classifiers. International Journal of Advanced Computing Research,1.
- 5. Joe, I., & Shim, H. (2010, December). An SMS spam filtering system using support vector machine. In International Conference on Future Generation Information Technology (pp. 577-584). Springer, Berlin, Heidelberg.
- 6. Mahmoud, T. M., & Mahfouz, A. M. (2012). SMS spam filtering technique based on artificial immune system. International Journal of Computer Science Issues (IJCSI), 9(2), 589.
- 7. Patel, F. N., & Soni, N. R. (2012). Text mining: A Brief survey. International Journal of Advanced Computer Research, 2(4), 243-248.
- 8. Al-Talib, G. A., & Hassan, H. S. (2013). A study on analysis of SMS classification using TF-IDF Weighting. International Journal of Computer Networks and Communications Security, 1(5), 189-194.
- 9. Parimala, R., & Nallaswamy, R. (2012). A Study on Analysis of SMS Classification Using Document Frequency Thresold. International Journal of Information Engineering and Electronic Business, 4(1), 44.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
March 31, 2019
Submission Date
August 6, 2018
Acceptance Date
February 3, 2019
Published in Issue
Year 2019 Volume: 31 Number: 1
Cited By
Öğretmenlerin E-Öğrenme Hazırbulunuşluk Düzeylerini Etkileyen Faktörlerin Rastgele Orman Algoritması Yöntemi İle İncelenmesi
Yuzunci Yil Universitesi Egitim Fakultesi Dergisi
https://doi.org/10.33711/yyuefd.1117068