Conference Paper

Classification of News Web Pages using Binary Grey Wolf and Binary Harris Hawk Optimizations

Number: 26 July 31, 2021
TR EN

İkili Gri Kurt ve İkili Harris Şahin Optimizasyonları ile Web Haber Sayfalarının Sınıflandırılması

Öz

İnternetin hızlı gelişmesi ile başta haber kaynakları, e-ticaret ve sosyal ağ uygulamaları olmak üzere çok sayıda web hizmeti ve sayfaları kullanıma sunuldu. Bu uygulamaların kullanımı ile inanılmaz büyüklükte video, ses ve metin gibi içerikler oluştu. Oluşan bu verilerin doğru olarak sınıflandırılması, web uygulamasından faydalanan kullanıcıların istedikleri verilere daha hızlı ve kolay erişmesini sağlar. Çok sayıda öznitelikten oluşan bu veriler metin sınıflandırması için yüksek hesaplama sürelerine neden olur. Yüksek boyutlara sahip veriler için daha az öznitelik ve düşük hesaplama süresi ile yüksek doğrulukta metin sınıflandırma başarısını öznitelik seçimi metotları kullanımı ile sağlamak mümkündür. Literatürde metin sınıflandırmasında kullanılan öznitelik seçim metotları filtreleme, sarma, gömülü ve hibrit yöntemler olarak sınıflandırılmaktadır. Bu çalışmada, metin sınıflandırılmasında öznitelik seçimi için İkili Gri Kurt Optimizasyonu (IGKO) ve İkili Harris Şahin Optimizasyonu (IHSO) algoritmaları ReliefF ile beraber kullanılmıştır. Çalışmada algoritmaların sonuçlarını değerlendirmek için 2 farklı özelliğe sahip veri kümesi kullanılmıştır. Birincisi,100 web belgesinden oluşan 2 kategoriye sahip bir veri kümesi, ikincisi ise 9 kategoriden oluşan (fizik, biyoloji, genetik vs) bilim haberleriyle ilgili web sayfalarından çıkarılan 450 web belgesini içeren veri kümesidir. Sonuçlara göre, IHSO amaç fonksiyonu ve öznitelik sayısına göre karşılaştırma yapılan diğer öznitelik seçim metotlarından daha performanslı olduğu görülmüştür.

Anahtar Kelimeler

References

  1. Aggarwal, C. C. ve Zhai, C. (2012). A survey of text classification algorithms. In Mining text data (pp. 163-222). Springer, Boston, MA.
  2. Aktaş, M. ve Kılıç, F. (2021) Binary Grey Wolf Optimizer using Archeology and Astronomy News for Text Classification, II. International Conference on Innovative Engineering Applications (CIEA' 2021). Asgarnezhad, R., Monadjemi, S. A. ve Soltanaghaei, M. (2020) An application of MOGW optimization for feature selection in text classification. The Journal of Supercomputing, 1-34.
  3. Chantar, H., Mafarja, M., Alsawalqah, H., Heidari, A. A., Aljarah, I. ve Faris, H. (2020) Feature selection using binary grey wolf optimizer with elite-based crossover for Arabic text classification. Neural Computing and Applications, 32(16), 12201-12220.
  4. Chen, H., Jiang, W., Li, C. ve Li, R. (2013) A heuristic feature selection approach for text categorization by using chaos optimization and genetic algorithm. Mathematical problems in Engineering.
  5. Das, S. (2001)Filters, wrappers and a boosting-based hybrid for feature selection. In Icml, 1, 74-81.
  6. Deng, X., Li, Y., Weng, J. ve Zhang, J. (2019) Feature selection for text classification: A review. Multimedia Tools and Applications, 78(3), 3797-3816.
  7. Günal, S. (2012) Hybrid feature selection for text classification. Turkish Journal of Electrical Engineering and Computer Science, 20(Sup. 2); 1296-1311.
  8. Heidari, A. A., Mirjalili, S., Faris, H., Aljarah, I., Mafarja, M. ve Chen, H. (2019). Harris hawks optimization: Algorithm and applications. Future generation computer systems, 97, 849-872.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Conference Paper

Publication Date

July 31, 2021

Submission Date

June 10, 2021

Acceptance Date

June 26, 2021

Published in Issue

Year 1970 Number: 26

APA
Aktaş, M., & Kılıç, F. (2021). İkili Gri Kurt ve İkili Harris Şahin Optimizasyonları ile Web Haber Sayfalarının Sınıflandırılması. Avrupa Bilim Ve Teknoloji Dergisi, 26, 234-241. https://doi.org/10.31590/ejosat.950497