EN
TR
Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web
Öz
Bu çalışmada, web sitelerinin sınıflandırılması için metin ve görsel içerikleri işleyen hibrit bir derin öğrenme modeli önerilmektedir. İnternette erişilebilen bilgi hizmetlerinin miktarı her geçen gün artmakta olup, yoğun veri akışı içinde web sitelerinin içeriğe göre doğru sınıflandırılması önem arz etmektedir. Kullanıcılar için bu işlemi yapabilecek bir derin öğrenme modeli oluşturmak amacıyla, Université Toulouse tarafından yayınlanan UT1 Blacklist içerisinden 430 web adresi seçilmiş ve bu adresler alışveriş, haber ve oyun olmak üzere üç kategoriye ayrılmıştır. Önerilen model, web sitelerinin metin içeriklerini işlemek için Uzun Kısa Süreli Bellek (LSTM) kullanırken, görüntü verilerini analiz etmek için Evrişimli Sinir Ağı (CNN) kullanmaktadır. LSTM ve CNN modellerinin çıktısını birleştiren bir Yapay Sinir Ağı (ANN) nihai sınıflandırmayı gerçekleştirmektedir. CNN ile görsel, LSTM ile metin işleyerek ANN ile nihai karar veren, önerilen web sitesi sınıflandırma modelinin (DeepCLA-Web) başarımı, sadece görsel verileri kullanan CNN modeli ve sadece metin verileri kullanan LSTM modeli ile literatürde sık kullanılan metrikler üzerinden kıyaslanmıştır. CNN modeli %59,22, LSTM modeli %75,85 doğruluk oranına ulaşırken, önerilen DeepCLA-Web %80,89 doğruluk oranına ulaşmıştır.
Anahtar Kelimeler
Kaynakça
- [1] M. S. Kurt and E. Yücel, "Web page classification with deep learning methods," Bursa Uludağ University Journal of The Faculty of Engineering, vol. 27, no. 1, pp. 191–202, 2022, doi: 10.17482/uumfd.891038.
- [2] Y. Yu, "Web page classification algorithm based on deep learning," Computational Intelligence and Neuroscience, vol. 2022, Art. no. 9534918, 2022, doi: 10.1155/2022/9534918.
- [3] D. López-Sánchez, A. González Arrieta, and J. M. Corchado, "Visual content-based web page categorization with deep transfer learning and metric learning," Neurocomputing, vol. 338, pp. 418–431, 2019, doi: 10.1016/j.neucom.2018.08.086.
- [4] M. Hashemi, "Web page classification: A survey of perspectives, gaps, and future directions," Multimedia Tools and Applications, vol. 79, pp. 11921–11945, 2020, doi: 10.1007/s11042-019-08373-8.
- [5] R. Bruni and G. Bianchi, "Web site categorization: A formal approach and robustness analysis in the case of e-commerce detection" Expert Systems with Applications, vol. 142, p. 113001, 2020, doi: 10.1016/j.eswa.2019.113001.
- [6] D. Cohen, O. Naim, E. Toch, and I. Ben-Gal, "Web site categorization via design attribute learning," Computers & Security, vol. 107, p. 102312, 2021, doi: 10.1016/j.cose.2021.102312.
- [7] V. K. Bhalla and N. Kumar, "An efficient scheme for automatic web pages categorization using the support vector machine," New Review of Hypermedia and Multimedia, vol. 22, no. 3, pp. 223–242, 2016, doi: 10.1080/13614568.2016.1152316.
- [8] E. Buber and B. Diri, "Web page classification using RNN," Procedia Computer Science, vol. 154, pp. 62–72, 2019, doi: 10.1016/j.procs.2019.06.011.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Derin Öğrenme
Bölüm
Araştırma Makalesi
Erken Görünüm Tarihi
26 Ağustos 2025
Yayımlanma Tarihi
31 Ağustos 2025
Gönderilme Tarihi
13 Şubat 2025
Kabul Tarihi
4 Mayıs 2025
Yayımlandığı Sayı
Yıl 2025 Cilt: 7 Sayı: 2
APA
Şeker, H., & Çubukçu, B. (2025). Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi, 7(2), 66-79. https://doi.org/10.46740/alku.1639372
AMA
1.Şeker H, Çubukçu B. Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi. 2025;7(2):66-79. doi:10.46740/alku.1639372
Chicago
Şeker, Harun, ve Burakhan Çubukçu. 2025. “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”. ALKÜ Fen Bilimleri Dergisi 7 (2): 66-79. https://doi.org/10.46740/alku.1639372.
EndNote
Şeker H, Çubukçu B (01 Ağustos 2025) Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi 7 2 66–79.
IEEE
[1]H. Şeker ve B. Çubukçu, “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”, ALKÜ Fen Bilimleri Dergisi, c. 7, sy 2, ss. 66–79, Ağu. 2025, doi: 10.46740/alku.1639372.
ISNAD
Şeker, Harun - Çubukçu, Burakhan. “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”. ALKÜ Fen Bilimleri Dergisi 7/2 (01 Ağustos 2025): 66-79. https://doi.org/10.46740/alku.1639372.
JAMA
1.Şeker H, Çubukçu B. Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi. 2025;7:66–79.
MLA
Şeker, Harun, ve Burakhan Çubukçu. “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”. ALKÜ Fen Bilimleri Dergisi, c. 7, sy 2, Ağustos 2025, ss. 66-79, doi:10.46740/alku.1639372.
Vancouver
1.Harun Şeker, Burakhan Çubukçu. Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi. 01 Ağustos 2025;7(2):66-79. doi:10.46740/alku.1639372