Araştırma Makalesi

Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web

Cilt: 7 Sayı: 2 31 Ağustos 2025
PDF İndir
EN TR

Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web

Öz

Bu çalışmada, web sitelerinin sınıflandırılması için metin ve görsel içerikleri işleyen hibrit bir derin öğrenme modeli önerilmektedir. İnternette erişilebilen bilgi hizmetlerinin miktarı her geçen gün artmakta olup, yoğun veri akışı içinde web sitelerinin içeriğe göre doğru sınıflandırılması önem arz etmektedir. Kullanıcılar için bu işlemi yapabilecek bir derin öğrenme modeli oluşturmak amacıyla, Université Toulouse tarafından yayınlanan UT1 Blacklist içerisinden 430 web adresi seçilmiş ve bu adresler alışveriş, haber ve oyun olmak üzere üç kategoriye ayrılmıştır. Önerilen model, web sitelerinin metin içeriklerini işlemek için Uzun Kısa Süreli Bellek (LSTM) kullanırken, görüntü verilerini analiz etmek için Evrişimli Sinir Ağı (CNN) kullanmaktadır. LSTM ve CNN modellerinin çıktısını birleştiren bir Yapay Sinir Ağı (ANN) nihai sınıflandırmayı gerçekleştirmektedir. CNN ile görsel, LSTM ile metin işleyerek ANN ile nihai karar veren, önerilen web sitesi sınıflandırma modelinin (DeepCLA-Web) başarımı, sadece görsel verileri kullanan CNN modeli ve sadece metin verileri kullanan LSTM modeli ile literatürde sık kullanılan metrikler üzerinden kıyaslanmıştır. CNN modeli %59,22, LSTM modeli %75,85 doğruluk oranına ulaşırken, önerilen DeepCLA-Web %80,89 doğruluk oranına ulaşmıştır.

Anahtar Kelimeler

Kaynakça

  1. [1] M. S. Kurt and E. Yücel, "Web page classification with deep learning methods," Bursa Uludağ University Journal of The Faculty of Engineering, vol. 27, no. 1, pp. 191–202, 2022, doi: 10.17482/uumfd.891038.
  2. [2] Y. Yu, "Web page classification algorithm based on deep learning," Computational Intelligence and Neuroscience, vol. 2022, Art. no. 9534918, 2022, doi: 10.1155/2022/9534918.
  3. [3] D. López-Sánchez, A. González Arrieta, and J. M. Corchado, "Visual content-based web page categorization with deep transfer learning and metric learning," Neurocomputing, vol. 338, pp. 418–431, 2019, doi: 10.1016/j.neucom.2018.08.086.
  4. [4] M. Hashemi, "Web page classification: A survey of perspectives, gaps, and future directions," Multimedia Tools and Applications, vol. 79, pp. 11921–11945, 2020, doi: 10.1007/s11042-019-08373-8.
  5. [5] R. Bruni and G. Bianchi, "Web site categorization: A formal approach and robustness analysis in the case of e-commerce detection" Expert Systems with Applications, vol. 142, p. 113001, 2020, doi: 10.1016/j.eswa.2019.113001.
  6. [6] D. Cohen, O. Naim, E. Toch, and I. Ben-Gal, "Web site categorization via design attribute learning," Computers & Security, vol. 107, p. 102312, 2021, doi: 10.1016/j.cose.2021.102312.
  7. [7] V. K. Bhalla and N. Kumar, "An efficient scheme for automatic web pages categorization using the support vector machine," New Review of Hypermedia and Multimedia, vol. 22, no. 3, pp. 223–242, 2016, doi: 10.1080/13614568.2016.1152316.
  8. [8] E. Buber and B. Diri, "Web page classification using RNN," Procedia Computer Science, vol. 154, pp. 62–72, 2019, doi: 10.1016/j.procs.2019.06.011.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Derin Öğrenme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

26 Ağustos 2025

Yayımlanma Tarihi

31 Ağustos 2025

Gönderilme Tarihi

13 Şubat 2025

Kabul Tarihi

4 Mayıs 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 7 Sayı: 2

Kaynak Göster

APA
Şeker, H., & Çubukçu, B. (2025). Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi, 7(2), 66-79. https://doi.org/10.46740/alku.1639372
AMA
1.Şeker H, Çubukçu B. Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi. 2025;7(2):66-79. doi:10.46740/alku.1639372
Chicago
Şeker, Harun, ve Burakhan Çubukçu. 2025. “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”. ALKÜ Fen Bilimleri Dergisi 7 (2): 66-79. https://doi.org/10.46740/alku.1639372.
EndNote
Şeker H, Çubukçu B (01 Ağustos 2025) Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi 7 2 66–79.
IEEE
[1]H. Şeker ve B. Çubukçu, “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”, ALKÜ Fen Bilimleri Dergisi, c. 7, sy 2, ss. 66–79, Ağu. 2025, doi: 10.46740/alku.1639372.
ISNAD
Şeker, Harun - Çubukçu, Burakhan. “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”. ALKÜ Fen Bilimleri Dergisi 7/2 (01 Ağustos 2025): 66-79. https://doi.org/10.46740/alku.1639372.
JAMA
1.Şeker H, Çubukçu B. Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi. 2025;7:66–79.
MLA
Şeker, Harun, ve Burakhan Çubukçu. “Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web”. ALKÜ Fen Bilimleri Dergisi, c. 7, sy 2, Ağustos 2025, ss. 66-79, doi:10.46740/alku.1639372.
Vancouver
1.Harun Şeker, Burakhan Çubukçu. Hibrit Derin Öğrenme Modeli ile Web Sitelerinin Görsel ve Metinsel Verilere Dayalı Sınıflandırılması: DeepCLA-Web. ALKÜ Fen Bilimleri Dergisi. 01 Ağustos 2025;7(2):66-79. doi:10.46740/alku.1639372