TR
EN
İkili Gri Kurt ve İkili Harris Şahin Optimizasyonları ile Web Haber Sayfalarının Sınıflandırılması
Öz
İnternetin hızlı gelişmesi ile başta haber kaynakları, e-ticaret ve sosyal ağ uygulamaları olmak üzere çok sayıda web hizmeti ve sayfaları kullanıma sunuldu. Bu uygulamaların kullanımı ile inanılmaz büyüklükte video, ses ve metin gibi içerikler oluştu. Oluşan bu verilerin doğru olarak sınıflandırılması, web uygulamasından faydalanan kullanıcıların istedikleri verilere daha hızlı ve kolay erişmesini sağlar. Çok sayıda öznitelikten oluşan bu veriler metin sınıflandırması için yüksek hesaplama sürelerine neden olur. Yüksek boyutlara sahip veriler için daha az öznitelik ve düşük hesaplama süresi ile yüksek doğrulukta metin sınıflandırma başarısını öznitelik seçimi metotları kullanımı ile sağlamak mümkündür. Literatürde metin sınıflandırmasında kullanılan öznitelik seçim metotları filtreleme, sarma, gömülü ve hibrit yöntemler olarak sınıflandırılmaktadır. Bu çalışmada, metin sınıflandırılmasında öznitelik seçimi için İkili Gri Kurt Optimizasyonu (IGKO) ve İkili Harris Şahin Optimizasyonu (IHSO) algoritmaları ReliefF ile beraber kullanılmıştır. Çalışmada algoritmaların sonuçlarını değerlendirmek için 2 farklı özelliğe sahip veri kümesi kullanılmıştır. Birincisi,100 web belgesinden oluşan 2 kategoriye sahip bir veri kümesi, ikincisi ise 9 kategoriden oluşan (fizik, biyoloji, genetik vs) bilim haberleriyle ilgili web sayfalarından çıkarılan 450 web belgesini içeren veri kümesidir. Sonuçlara göre, IHSO amaç fonksiyonu ve öznitelik sayısına göre karşılaştırma yapılan diğer öznitelik seçim metotlarından daha performanslı olduğu görülmüştür.
Anahtar Kelimeler
References
- Aggarwal, C. C. ve Zhai, C. (2012). A survey of text classification algorithms. In Mining text data (pp. 163-222). Springer, Boston, MA.
- Aktaş, M. ve Kılıç, F. (2021) Binary Grey Wolf Optimizer using Archeology and Astronomy News for Text Classification, II. International Conference on Innovative Engineering Applications (CIEA' 2021). Asgarnezhad, R., Monadjemi, S. A. ve Soltanaghaei, M. (2020) An application of MOGW optimization for feature selection in text classification. The Journal of Supercomputing, 1-34.
- Chantar, H., Mafarja, M., Alsawalqah, H., Heidari, A. A., Aljarah, I. ve Faris, H. (2020) Feature selection using binary grey wolf optimizer with elite-based crossover for Arabic text classification. Neural Computing and Applications, 32(16), 12201-12220.
- Chen, H., Jiang, W., Li, C. ve Li, R. (2013) A heuristic feature selection approach for text categorization by using chaos optimization and genetic algorithm. Mathematical problems in Engineering.
- Das, S. (2001)Filters, wrappers and a boosting-based hybrid for feature selection. In Icml, 1, 74-81.
- Deng, X., Li, Y., Weng, J. ve Zhang, J. (2019) Feature selection for text classification: A review. Multimedia Tools and Applications, 78(3), 3797-3816.
- Günal, S. (2012) Hybrid feature selection for text classification. Turkish Journal of Electrical Engineering and Computer Science, 20(Sup. 2); 1296-1311.
- Heidari, A. A., Mirjalili, S., Faris, H., Aljarah, I., Mafarja, M. ve Chen, H. (2019). Harris hawks optimization: Algorithm and applications. Future generation computer systems, 97, 849-872.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Conference Paper
Publication Date
July 31, 2021
Submission Date
June 10, 2021
Acceptance Date
June 26, 2021
Published in Issue
Year 1970 Number: 26