TR
EN
Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması
Öz
Dijital içerikteki artış, özellikle haber sınıflandırma gibi metin odaklı görevlerde otomatik sınıflandırma yöntemlerine duyulan ihtiyacı büyük ölçüde artırmıştır. Bu noktada Doğal Dil İşleme (DDİ) teknikleri, büyük veri setlerinde insan müdahalesi olmaksızın verimli sonuçlar üretebilme potansiyeline sahiptir. Bu çalışma, haber başlıklarını kategorilere ayırmayı amaçlayan, Python ile geliştirilmiş bir Naive Bayes (NB) tabanlı sınıflandırma sistemini tanıtmaktadır. NB algoritmaları, basitlikleri ve hızlı hesaplama özellikleri nedeniyle metin sınıflandırma problemlerinde öne çıkmaktadır. BBC News başlıklarından oluşan veri kümesi; teknoloji, iş dünyası, spor, eğlence ve siyaset gibi farklı kategorileri kapsamaktadır. Veri ön işleme sürecinde metin temizleme, durdurma kelimelerin çıkarılması ve Sayım Vektörleştirme ile metnin sayısal verilere dönüştürülmesi gibi adımlar yer almıştır. Bu süreç, doğru ve etkili sınıflandırma için kritik bir rol oynamaktadır. Çalışma kapsamında beş farklı NB varyantı incelenmiştir: Gaussian, Multinomial, Complement, Bernoulli ve TAN. Sonuçlar, Multinomial NB’nin %98.53 doğruluk oranıyla en iyi performansı sergilediğini ortaya koymuştur. Complement NB %98.31, TAN %98.20, Bernoulli %96.74, Gaussian NB ise %91.79 ile %92.92 arasında değişen doğruluk oranlarına sahiptir. Bunun yanı sıra NB algoritmaları, Lojistik Regresyon, Rastgele Orman, Doğrusal Destek Vektör Sınıflandırıcısı ve Çok Katmanlı Algılayıcı gibi gelişmiş makine öğrenimi algoritmalarıyla karşılaştırılmıştır. Çok Katmanlı Algılayıcı, %98.31 doğruluk oranı ile öne çıkarken, diğer algoritmalar da %97’nin üzerinde başarı elde etmiştir. Bu çalışma, NB algoritmalarının haber sınıflandırma problemlerinde güçlü, güvenilir ve etkili bir çözüm sunduğunu göstermektedir. Özellikle Multinomial ve Complement NB varyantları, yüksek doğruluk oranları ile dikkat çekmektedir. Gelecekteki araştırmalar, daha geniş veri setleri ve yeni yaklaşımlar ile bu algoritmaların performanslarını daha da geliştirmeyi hedeflemektedir.
Anahtar Kelimeler
Kaynakça
- Albahr, A., & Albahar, M. (2020). An empirical comparison of fake news detection using different machine learning algorithms. International Journal of Advanced Computer Science and Applications, 11(9).
- Bracewell, D. B., Yan, J., Ren, F., & Kuroiwa, S. (2009). Category classification and topic discovery of japanese and english news articles. Electronic Notes in Theoretical Computer Science, 225, 51-65.
- Chen, S., Webb, G. I., Liu, L., & Ma, X. (2020). A novel selective naïve Bayes algorithm. Knowledge-Based Systems, 192, 105361.D. M. Powers, "Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation," arXiv preprint arXiv:2010.16061, 2020.
- Granik, M., & Mesyura, V. (2017, May). Fake news detection using naive Bayes classifier. In 2017 IEEE first Ukraine conference on electrical and computer engineering (UKRCON) (pp. 900-903). IEEE.
- Greene, D., & Cunningham, P. "BBC Datasets," 2006. [Online]. Available: http://mlg. ucd.ie/datasets/ bbc.html.
- Mahesh, B. (2020). Machine learning algorithms-a review. International Journal of Science and Research (IJSR).[Internet], 9(1), 381-386.M. I. Rana, S. Khalid, and M. U. Akbar, "News classification based on their headlines: A review," in 17th IEEE International Multi Topic Conference 2014, Karachi, Pakistan, 2014: IEEE, pp. 211-216.
- Patel, A., & Meehan, K. (2021, June). Fake news detection on reddit utilising countvectorizer and term frequency-inverse document frequency with logistic regression, multinominalnb and support vector machine. In 2021 32nd Irish signals and systems conference (ISSC) (pp. 1-6). IEEE.M. M. Saritas and A. Yasar, "Performance analysis of ANN and Naive Bayes classification algorithm for data classification," International journal of intelligent systems and applications in engineering, vol. 7, no. 2, pp. 88-91, 2019.
- Shahi, T. B., & Pant, A. K. (2018, February). Nepali news classification using Naive Bayes, support vector machines and neural networks. In 2018 international conference on communication information and computing technology (iccict) (pp. 1-5). IEEE.A. N. Chy, M. H. Seddiqui, and S. Das, "Bangla news classification using naive Bayes classifier," in 16th Int'l Conf. Computer and Information Technology, Khulna, Bangladesh, 2014: IEEE, pp. 366-371.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Bilgisayar Yazılımı, Yazılım Mühendisliği (Diğer)
Bölüm
Araştırma Makalesi
Erken Görünüm Tarihi
20 Şubat 2025
Yayımlanma Tarihi
1 Mart 2025
Gönderilme Tarihi
24 Ağustos 2024
Kabul Tarihi
19 Ekim 2024
Yayımlandığı Sayı
Yıl 2025 Cilt: 15 Sayı: 1
APA
Veziroğlu, M., & Bucak, İ. (2025). Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Journal of the Institute of Science and Technology, 15(1), 57-70. https://doi.org/10.21597/jist.1537627
AMA
1.Veziroğlu M, Bucak İ. Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Iğdır Üniv. Fen Bil Enst. Der. 2025;15(1):57-70. doi:10.21597/jist.1537627
Chicago
Veziroğlu, Merve, ve İhsan Bucak. 2025. “Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması”. Journal of the Institute of Science and Technology 15 (1): 57-70. https://doi.org/10.21597/jist.1537627.
EndNote
Veziroğlu M, Bucak İ (01 Mart 2025) Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Journal of the Institute of Science and Technology 15 1 57–70.
IEEE
[1]M. Veziroğlu ve İ. Bucak, “Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması”, Iğdır Üniv. Fen Bil Enst. Der., c. 15, sy 1, ss. 57–70, Mar. 2025, doi: 10.21597/jist.1537627.
ISNAD
Veziroğlu, Merve - Bucak, İhsan. “Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması”. Journal of the Institute of Science and Technology 15/1 (01 Mart 2025): 57-70. https://doi.org/10.21597/jist.1537627.
JAMA
1.Veziroğlu M, Bucak İ. Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Iğdır Üniv. Fen Bil Enst. Der. 2025;15:57–70.
MLA
Veziroğlu, Merve, ve İhsan Bucak. “Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması”. Journal of the Institute of Science and Technology, c. 15, sy 1, Mart 2025, ss. 57-70, doi:10.21597/jist.1537627.
Vancouver
1.Merve Veziroğlu, İhsan Bucak. Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Iğdır Üniv. Fen Bil Enst. Der. 01 Mart 2025;15(1):57-70. doi:10.21597/jist.1537627