Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması

Cilt: 20 Sayı: 1 25 Kasım 2011
  • Meltem Işık
  • Ali Yılmaz Çamurcu
PDF İndir
EN TR

Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması

Öz

İnternetteki web sayfalarının boyutları her geçen gün artmaktadır. Bu sayfalar içerisinde bulunan belgelere erişimde ya da bir belgeyi getirmede yeni teknikler geliştirilmektedir. Bu tekniklerden birisi de web belgelerini kümelemedir. Bu çalışmada, web sayfaları kümelemede belgelerin benzerliklerini bulan tekniklerden Öklid, Kosinüs, Pearson ve Genişletilmiş Jaccard iki ayrı veri setinde test edildi ve başarıları araştırıldı. Web belgelerini kümelemede yapılan testlerde, Öklid uzaklığının yüksek hata oranlarına neden olduğu gözlenmiştir. Benzerlik ölçütlerinde en iyi performansı sağlayan Kosinüs ve Genişletilmiş Jaccard benzerlikleridir. Yapılan deneylerin sonuçlarına göre, web belgeleri kümelemede Kosinüs benzerlik ölçütünün kullanılmasının uygun olduğu bulunmuştur.

Anahtar Kelimeler

Kaynakça

  1. Steinbach, M.; Karypis, G.; Kumar, V.: “A Comparison of Document Clustering Techniques”. In KDD Workshop on Text Mining, 2000.
  2. Zamir, O.; Etzioni, O.: “Web Document Clustering: A Feasibility Demonstration,” Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 46-54, 1998.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

-

Yazarlar

Meltem Işık Bu kişi benim

Ali Yılmaz Çamurcu Bu kişi benim

Yayımlanma Tarihi

25 Kasım 2011

Gönderilme Tarihi

25 Kasım 2011

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2008 Cilt: 20 Sayı: 1

Kaynak Göster

APA
Işık, M., & Çamurcu, A. Y. (2011). Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. Marmara Fen Bilimleri Dergisi, 20(1), 35-49. https://doi.org/10.7240/mufbed.60306
AMA
1.Işık M, Çamurcu AY. Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. MFBD. 2011;20(1):35-49. doi:10.7240/mufbed.60306
Chicago
Işık, Meltem, ve Ali Yılmaz Çamurcu. 2011. “Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması”. Marmara Fen Bilimleri Dergisi 20 (1): 35-49. https://doi.org/10.7240/mufbed.60306.
EndNote
Işık M, Çamurcu AY (01 Kasım 2011) Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. Marmara Fen Bilimleri Dergisi 20 1 35–49.
IEEE
[1]M. Işık ve A. Y. Çamurcu, “Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması”, MFBD, c. 20, sy 1, ss. 35–49, Kas. 2011, doi: 10.7240/mufbed.60306.
ISNAD
Işık, Meltem - Çamurcu, Ali Yılmaz. “Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması”. Marmara Fen Bilimleri Dergisi 20/1 (01 Kasım 2011): 35-49. https://doi.org/10.7240/mufbed.60306.
JAMA
1.Işık M, Çamurcu AY. Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. MFBD. 2011;20:35–49.
MLA
Işık, Meltem, ve Ali Yılmaz Çamurcu. “Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması”. Marmara Fen Bilimleri Dergisi, c. 20, sy 1, Kasım 2011, ss. 35-49, doi:10.7240/mufbed.60306.
Vancouver
1.Meltem Işık, Ali Yılmaz Çamurcu. Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. MFBD. 01 Kasım 2011;20(1):35-49. doi:10.7240/mufbed.60306

Marmara Fen Bilimleri Dergisi

e-ISSN : 2146-5150

 

 

MU Fen Bilimleri Enstitüsü

Göztepe Yerleşkesi, 34722 Kadıköy, İstanbul
E-posta: fbedergi@marmara.edu.tr