Araştırma Makalesi
BibTex RIS Kaynak Göster

Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu

Yıl 2019, Cilt: 31 Sayı: 1, 17 - 28, 31.03.2019
https://doi.org/10.7240/jeps.451301

Öz

Kısa
mesaj servisi en yaygın kullanılan iletişim kanallarından biridir. Kişisel,
reklam, promosyon, etkinlik bildirimi, satış onaylama vb. bir çok farklı amaç
için kullanılan kısa mesajların 
sayısının her geçen gün artması takip edilebilirliklerini ve aranan
mesajın mesaj kutusunda hızlıca bulunmasını zorlaştırmaktadır. Öte yandan
istenmeyen mesajların mesaj kutusunu doldurması ve mesaj kirliliği yaratması
bir diğer önemli problemdir. Bu çalışmada Türkçe Kısa Mesajları sınıflandırmak
ve akıllı bir SMS kutusu oluşturmak amacıyla Çok Katmanlı Süzgeçleme Mimarisi
önerilmiştir. Ayrıca bu mimari bir Android uygulaması üzerinde gerçeklenmiştir.
Bu mimari yardımı ile telefona ulaşan mesajlar kişisel, ticari, otp  kodları,
hatırlatıcı ve istenmeyen
adı altında 5 farklı kategoriye ayrılmaktadır.
Önerilen mimari Kara Liste, Regex, Makine öğrenmesi, ve Beyaz Liste
süzgeçlerinden oluşmaktadır. Makine öğrenmesi süzgecinde Naive Bayes, Bayes
Net, J48 ve Random Forest algoritmalarının performansları incelenmiştir ve Random
Forest %87’lik başarısı nedeniyle uygulamada tercih edilmiştir. Önerilen çok
katmanlı yapı sayesinde mesaj sınıflandırma süresi azaltılırken sınıflandırma
başarısı %93’e yükseltilmiştir. Ayrıca başarının yükseltilmesinde seçilen
özellikler ve Zemberek kütüphanesinin kullanımı ile  kelimelerin türlerinin ve köklerinin elde
edilmesi önemli rol oynamıştır.

Kaynakça

  • 1. Zhu, S., Ji, X., Xu, W., & Gong, Y. (2005, August). Multi-labelled classification using maximum entropy method. In Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval (pp. 274-281). ACM. 2. Klimt, B., & Yang, Y. (2004, September). The enron corpus: A new dataset for email classification research. In European Conference on Machine Learning (pp. 217-226). Springer, Berlin, Heidelberg.
  • 3. Healy, M., Delany, S. J., & Zamolotskikh, A. (2004). An assessment of case base reasoning for short text message classification
  • 4. Najadat H., Abdulla, N., Abooraig, R. ve Nawasrah S. (2014). Mobile SMS Spam Filtering based on Mixing Classifiers. International Journal of Advanced Computing Research,1.
  • 5. Joe, I., & Shim, H. (2010, December). An SMS spam filtering system using support vector machine. In International Conference on Future Generation Information Technology (pp. 577-584). Springer, Berlin, Heidelberg.
  • 6. Mahmoud, T. M., & Mahfouz, A. M. (2012). SMS spam filtering technique based on artificial immune system. International Journal of Computer Science Issues (IJCSI), 9(2), 589.
  • 7. Patel, F. N., & Soni, N. R. (2012). Text mining: A Brief survey. International Journal of Advanced Computer Research, 2(4), 243-248.
  • 8. Al-Talib, G. A., & Hassan, H. S. (2013). A study on analysis of SMS classification using TF-IDF Weighting. International Journal of Computer Networks and Communications Security, 1(5), 189-194.
  • 9. Parimala, R., & Nallaswamy, R. (2012). A Study on Analysis of SMS Classification Using Document Frequency Thresold. International Journal of Information Engineering and Electronic Business, 4(1), 44.
  • 10. Deng, W. W., & Peng, H. (2006, August). Research on a naive bayesian based short message filtering system. In Machine learning and cybernetics, 2006 international conference on (pp. 1233-1237). IEEE.
  • 11. Kawade, D. R., & Oza, K. S. (2015). SMS spam classification using WEKA. International Journal of Electronics Communication and Computer Technology, 5, 43-7.
  • 12. Mathew, K., & Issac, B. (2011, December). Intelligent spam classification for mobile text message. In Computer Science and Network Technology (ICCSNT), 2011 International Conference on (Vol. 1, pp. 101-105). IEEE.
  • 13. Uysal, A. K., Günal, S., Ergin, S., & Günal, E. Ş. (2012, April). Detection of SMS spam messages on mobile phones. In Signal Processing and Communications Applications Conference (SIU), 2012 20th (pp. 1-4). IEEE.
  • 14. Kilic, E., Arslan, S. N., & Guvensan, M. A. (2014, April). 3-Tier hybrid approach for SMS filtering. In Signal Processing and Communications Applications Conference (SIU), 2014 22nd (pp. 1950-1953). IEEE.
  • 15. Weka.sourceforge.net. (2018). StringToWordVector. [online] Available at: http://weka.sourceforge.net/doc.stable/weka/filters/unsupervised/attribute/StringToWordVector.html [Accessed 23 Jul. 2018].
  • 16. Web.stanford.edu. (2018). Naive Bayes Sunumu. [online] Available at: https://web.stanford.edu/class/cs124/lec/naivebayes.pdf [Accessed 23 Jul. 2018].
  • 17. Cooper, G. F., & Herskovits, E. (1992). A Bayesian method for the induction of probabilistic networks from data. Machine learning, 9(4), 309-347. 18. Weka.sourceforge.net. (2018). J48. [online] Available at: http://weka.sourceforge.net/doc.dev/weka/classifiers/trees/J48.html [Accessed 23 Jul. 2018].
  • 19. Kaur, G., & Chhabra, A. (2014). Improved J48 classification algorithm for the prediction of diabetes. International Journal of Computer Applications, 98(22).
  • 20. Liaw, A., & Wiener, M. (2002). Classification and regression by randomForest. R news, 2(3), 18-22.
Yıl 2019, Cilt: 31 Sayı: 1, 17 - 28, 31.03.2019
https://doi.org/10.7240/jeps.451301

Öz

Kaynakça

  • 1. Zhu, S., Ji, X., Xu, W., & Gong, Y. (2005, August). Multi-labelled classification using maximum entropy method. In Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval (pp. 274-281). ACM. 2. Klimt, B., & Yang, Y. (2004, September). The enron corpus: A new dataset for email classification research. In European Conference on Machine Learning (pp. 217-226). Springer, Berlin, Heidelberg.
  • 3. Healy, M., Delany, S. J., & Zamolotskikh, A. (2004). An assessment of case base reasoning for short text message classification
  • 4. Najadat H., Abdulla, N., Abooraig, R. ve Nawasrah S. (2014). Mobile SMS Spam Filtering based on Mixing Classifiers. International Journal of Advanced Computing Research,1.
  • 5. Joe, I., & Shim, H. (2010, December). An SMS spam filtering system using support vector machine. In International Conference on Future Generation Information Technology (pp. 577-584). Springer, Berlin, Heidelberg.
  • 6. Mahmoud, T. M., & Mahfouz, A. M. (2012). SMS spam filtering technique based on artificial immune system. International Journal of Computer Science Issues (IJCSI), 9(2), 589.
  • 7. Patel, F. N., & Soni, N. R. (2012). Text mining: A Brief survey. International Journal of Advanced Computer Research, 2(4), 243-248.
  • 8. Al-Talib, G. A., & Hassan, H. S. (2013). A study on analysis of SMS classification using TF-IDF Weighting. International Journal of Computer Networks and Communications Security, 1(5), 189-194.
  • 9. Parimala, R., & Nallaswamy, R. (2012). A Study on Analysis of SMS Classification Using Document Frequency Thresold. International Journal of Information Engineering and Electronic Business, 4(1), 44.
  • 10. Deng, W. W., & Peng, H. (2006, August). Research on a naive bayesian based short message filtering system. In Machine learning and cybernetics, 2006 international conference on (pp. 1233-1237). IEEE.
  • 11. Kawade, D. R., & Oza, K. S. (2015). SMS spam classification using WEKA. International Journal of Electronics Communication and Computer Technology, 5, 43-7.
  • 12. Mathew, K., & Issac, B. (2011, December). Intelligent spam classification for mobile text message. In Computer Science and Network Technology (ICCSNT), 2011 International Conference on (Vol. 1, pp. 101-105). IEEE.
  • 13. Uysal, A. K., Günal, S., Ergin, S., & Günal, E. Ş. (2012, April). Detection of SMS spam messages on mobile phones. In Signal Processing and Communications Applications Conference (SIU), 2012 20th (pp. 1-4). IEEE.
  • 14. Kilic, E., Arslan, S. N., & Guvensan, M. A. (2014, April). 3-Tier hybrid approach for SMS filtering. In Signal Processing and Communications Applications Conference (SIU), 2014 22nd (pp. 1950-1953). IEEE.
  • 15. Weka.sourceforge.net. (2018). StringToWordVector. [online] Available at: http://weka.sourceforge.net/doc.stable/weka/filters/unsupervised/attribute/StringToWordVector.html [Accessed 23 Jul. 2018].
  • 16. Web.stanford.edu. (2018). Naive Bayes Sunumu. [online] Available at: https://web.stanford.edu/class/cs124/lec/naivebayes.pdf [Accessed 23 Jul. 2018].
  • 17. Cooper, G. F., & Herskovits, E. (1992). A Bayesian method for the induction of probabilistic networks from data. Machine learning, 9(4), 309-347. 18. Weka.sourceforge.net. (2018). J48. [online] Available at: http://weka.sourceforge.net/doc.dev/weka/classifiers/trees/J48.html [Accessed 23 Jul. 2018].
  • 19. Kaur, G., & Chhabra, A. (2014). Improved J48 classification algorithm for the prediction of diabetes. International Journal of Computer Applications, 98(22).
  • 20. Liaw, A., & Wiener, M. (2002). Classification and regression by randomForest. R news, 2(3), 18-22.
Toplam 18 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Araştırma Makaleleri
Yazarlar

H. İbrahim Bestil Bu kişi benim

M. Amaç Güvensan 0000-0002-2728-8900

Yayımlanma Tarihi 31 Mart 2019
Yayımlandığı Sayı Yıl 2019 Cilt: 31 Sayı: 1

Kaynak Göster

APA Bestil, H. İ., & Güvensan, M. A. (2019). Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu. International Journal of Advances in Engineering and Pure Sciences, 31(1), 17-28. https://doi.org/10.7240/jeps.451301
AMA Bestil Hİ, Güvensan MA. Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu. JEPS. Mart 2019;31(1):17-28. doi:10.7240/jeps.451301
Chicago Bestil, H. İbrahim, ve M. Amaç Güvensan. “Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi Ve Akıllı SMS Kutusu”. International Journal of Advances in Engineering and Pure Sciences 31, sy. 1 (Mart 2019): 17-28. https://doi.org/10.7240/jeps.451301.
EndNote Bestil Hİ, Güvensan MA (01 Mart 2019) Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu. International Journal of Advances in Engineering and Pure Sciences 31 1 17–28.
IEEE H. İ. Bestil ve M. A. Güvensan, “Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu”, JEPS, c. 31, sy. 1, ss. 17–28, 2019, doi: 10.7240/jeps.451301.
ISNAD Bestil, H. İbrahim - Güvensan, M. Amaç. “Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi Ve Akıllı SMS Kutusu”. International Journal of Advances in Engineering and Pure Sciences 31/1 (Mart 2019), 17-28. https://doi.org/10.7240/jeps.451301.
JAMA Bestil Hİ, Güvensan MA. Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu. JEPS. 2019;31:17–28.
MLA Bestil, H. İbrahim ve M. Amaç Güvensan. “Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi Ve Akıllı SMS Kutusu”. International Journal of Advances in Engineering and Pure Sciences, c. 31, sy. 1, 2019, ss. 17-28, doi:10.7240/jeps.451301.
Vancouver Bestil Hİ, Güvensan MA. Türkçe Kısa Mesajları Sınıflandıran Çok Katmanlı Süzgeçleme Mimarisi ve Akıllı SMS Kutusu. JEPS. 2019;31(1):17-28.