Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması

Volume: 20 Number: 1 November 25, 2011
  • Meltem Işık
  • Ali Yılmaz Çamurcu
EN TR

Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması

Abstract

İnternetteki web sayfalarının boyutları her geçen gün artmaktadır. Bu sayfalar içerisinde bulunan belgelere erişimde ya da bir belgeyi getirmede yeni teknikler geliştirilmektedir. Bu tekniklerden birisi de web belgelerini kümelemedir. Bu çalışmada, web sayfaları kümelemede belgelerin benzerliklerini bulan tekniklerden Öklid, Kosinüs, Pearson ve Genişletilmiş Jaccard iki ayrı veri setinde test edildi ve başarıları araştırıldı. Web belgelerini kümelemede yapılan testlerde, Öklid uzaklığının yüksek hata oranlarına neden olduğu gözlenmiştir. Benzerlik ölçütlerinde en iyi performansı sağlayan Kosinüs ve Genişletilmiş Jaccard benzerlikleridir. Yapılan deneylerin sonuçlarına göre, web belgeleri kümelemede Kosinüs benzerlik ölçütünün kullanılmasının uygun olduğu bulunmuştur.

Keywords

References

  1. Steinbach, M.; Karypis, G.; Kumar, V.: “A Comparison of Document Clustering Techniques”. In KDD Workshop on Text Mining, 2000.
  2. Zamir, O.; Etzioni, O.: “Web Document Clustering: A Feasibility Demonstration,” Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 46-54, 1998.

Details

Primary Language

Turkish

Subjects

-

Journal Section

-

Authors

Meltem Işık This is me

Ali Yılmaz Çamurcu This is me

Publication Date

November 25, 2011

Submission Date

November 25, 2011

Acceptance Date

-

Published in Issue

Year 2008 Volume: 20 Number: 1

APA
Işık, M., & Çamurcu, A. Y. (2011). Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. Marmara Fen Bilimleri Dergisi, 20(1), 35-49. https://doi.org/10.7240/mufbed.60306
AMA
1.Işık M, Çamurcu AY. Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. MAJPAS. 2011;20(1):35-49. doi:10.7240/mufbed.60306
Chicago
Işık, Meltem, and Ali Yılmaz Çamurcu. 2011. “Web Belgeleri Kümelemede Benzerlik Ve Uzaklık ölçütleri Başarılarının Karşılaştırılması”. Marmara Fen Bilimleri Dergisi 20 (1): 35-49. https://doi.org/10.7240/mufbed.60306.
EndNote
Işık M, Çamurcu AY (November 1, 2011) Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. Marmara Fen Bilimleri Dergisi 20 1 35–49.
IEEE
[1]M. Işık and A. Y. Çamurcu, “Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması”, MAJPAS, vol. 20, no. 1, pp. 35–49, Nov. 2011, doi: 10.7240/mufbed.60306.
ISNAD
Işık, Meltem - Çamurcu, Ali Yılmaz. “Web Belgeleri Kümelemede Benzerlik Ve Uzaklık ölçütleri Başarılarının Karşılaştırılması”. Marmara Fen Bilimleri Dergisi 20/1 (November 1, 2011): 35-49. https://doi.org/10.7240/mufbed.60306.
JAMA
1.Işık M, Çamurcu AY. Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. MAJPAS. 2011;20:35–49.
MLA
Işık, Meltem, and Ali Yılmaz Çamurcu. “Web Belgeleri Kümelemede Benzerlik Ve Uzaklık ölçütleri Başarılarının Karşılaştırılması”. Marmara Fen Bilimleri Dergisi, vol. 20, no. 1, Nov. 2011, pp. 35-49, doi:10.7240/mufbed.60306.
Vancouver
1.Meltem Işık, Ali Yılmaz Çamurcu. Web belgeleri kümelemede benzerlik ve uzaklık ölçütleri başarılarının karşılaştırılması. MAJPAS. 2011 Nov. 1;20(1):35-49. doi:10.7240/mufbed.60306

Marmara Journal of Pure and Applied Sciences

e-ISSN : 2146-5150