Araştırma Makalesi

Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi

Cilt: 3 Sayı: 2 15 Aralık 2020
PDF İndir
EN TR

Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi

Öz

Web ortamı bilginin doğduğu, yayıldığı ve yaşadığı bir formata sahiptir. Gün geçtikte bilgi morfolojik olarak değişim geçirmekte ve bu değişimle birlikte avantajlar yanında istenilen anlamlı bilgiye ulaşmada zorluklar artmaktadır. Zaman, depolama, iletişim ve veri işleme maliyetleri açısından istenilen bilgiye en verimli şekilde ulaşmak kritik bir görevdir. Bunun yanında verinin yaşam süreci boyunca kullanılabilirliğini de artırabilir. Web sayfalarının “layout” adı verilen bölümlerinin sınıflandırılması bu sorunların çözümüne önemli katkılar sağlayabilir. Özellikle bu bölümlerdeki gereksiz içeriğin bilinmesi faydalı ve anlamlı bilgiye ulaşmayı kolaylaştırıcı ve maliyetleri düşürücü etki sağlayabilir. Bu çalışma makine öğrenmesi yöntemleri ile web sayfası bölümlerinin sınıflandırılması sürecini iyileştirmek amacıyla farklı algoritmalara odaklanmış ve bu algoritmaların iyileştirici sonuçlarını ortaya koymaktadır. Elde edilen sonuçlara göre Random Forest ve KStar algoritmalarının süreci iyileştirici çözümleri olduğu görülmüştür. Random Forest algoritması %98.4602 doğru sınıflandırma oranı sunarken, KStar hız faktörüyle öne çıkmıştır. Çalışmada ayrıca özellikle ağaç ve entropi tabanlı algoritmaların başarımları da karşılaştırılmış ve bulgular hesaplama zamanlarıyla birlikte sunulmuştur.

Anahtar Kelimeler

Web bilgi çıkarımı, Makine öğrenmesi, Sınıflandırma, Veri madenciliği

Teşekkür

Bu araştırmada kullanılan verileri sağlayan ve açık erişim şekilde yayınlayarak paylaşan Tekirdağ Namık Kemal Üniversitesi, Çorlu Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü öğretim üyesi Doç. Dr. Erdinç Uzun a teşekkürlerimi sunarım.

Kaynakça

  1. Uzun, E., Agun, H.V., Yerlikaya, T., 2013. A hybrid approach for extracting informative content from web pages. Inf. Process. Manag. 49, 928–944. https://doi.org/https://doi.org/10.1016/j.ipm.2013.02.005
  2. Uzun, E., Serdar Güner, E., Kılıçaslan, Y., Yerlikaya, T., Agun, H.V., 2014. An effective and efficient Web content extractor for optimizing the crawling process. Softw. Pract. Exp. 44, 1181–1199. https://doi.org/10.1002/spe.2195

Kaynak Göster

APA
Özhan, E. (2020). Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi. Afyon Kocatepe Üniversitesi Uluslararası Mühendislik Teknolojileri ve Uygulamalı Bilimler Dergisi, 3(2), 52-59. https://izlik.org/JA57YP66BM
AMA
1.Özhan E. Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi. AKU IJETAS. 2020;3(2):52-59. https://izlik.org/JA57YP66BM
Chicago
Özhan, Erkan. 2020. “Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi”. Afyon Kocatepe Üniversitesi Uluslararası Mühendislik Teknolojileri ve Uygulamalı Bilimler Dergisi 3 (2): 52-59. https://izlik.org/JA57YP66BM.
EndNote
Özhan E (01 Aralık 2020) Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi. Afyon Kocatepe Üniversitesi Uluslararası Mühendislik Teknolojileri ve Uygulamalı Bilimler Dergisi 3 2 52–59.
IEEE
[1]E. Özhan, “Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi”, AKU IJETAS, c. 3, sy 2, ss. 52–59, Ara. 2020, [çevrimiçi]. Erişim adresi: https://izlik.org/JA57YP66BM
ISNAD
Özhan, Erkan. “Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi”. Afyon Kocatepe Üniversitesi Uluslararası Mühendislik Teknolojileri ve Uygulamalı Bilimler Dergisi 3/2 (01 Aralık 2020): 52-59. https://izlik.org/JA57YP66BM.
JAMA
1.Özhan E. Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi. AKU IJETAS. 2020;3:52–59.
MLA
Özhan, Erkan. “Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi”. Afyon Kocatepe Üniversitesi Uluslararası Mühendislik Teknolojileri ve Uygulamalı Bilimler Dergisi, c. 3, sy 2, Aralık 2020, ss. 52-59, https://izlik.org/JA57YP66BM.
Vancouver
1.Erkan Özhan. Makine Öğrenmesi Yöntemleri ile Web’den Bilgi Çıkarımı Sürecinin İyileştirilmesi. AKU IJETAS [Internet]. 01 Aralık 2020;3(2):52-9. Erişim adresi: https://izlik.org/JA57YP66BM