BibTex RIS Kaynak Göster

DOCUMENT CLUSTERING USING K-MEANS AND HYPERSPHERICAL FUZZY C-MEANS ALGORITHMS

Yıl 2010, Cilt: 22 Sayı: 1, 1 - 18, 26.11.2011

Öz

Web pages have became a big data repository, with rapid grow in Internet. For these reason, interest to data mining in the field of searching in web pages and analyzing user profile is increased. Document mining is preferred to get necessary knowledge from documents on web pages.  In this study, k-means and hyperspherical fuzzy c-means algorithms were applied to web documents and clustering performances were investigated comparatively using three data sets which have web documents. Our results show that clustering feature of hyperspherical fuzzy c-means algorithm is better than k-means algorithm.

Kaynakça

  • Fayyad, U.M.; Piatetsky-Shapiro, G.; Smyth, R.; Uthurusamy, R.: “Advances in Knowledge Discovery and Data Mining”, AAAI/MIT Pres, CA, 1996.
  • Han, J.; Kamber, M.: “Data Mining Concepts and Techniques”, Morgan Kauffmann Publishers Inc., 2006.
  • Pang-Ning Tan, P.N.; Steinbach, M.; Kumar, V.: “Introduction to Data Mining”, Addison Wesley, Mart 2006.
  • Jain, A.K.; Murty, M.N.; Flynn, P.J.: “Data Clustering: A Review”, ACM Computing Surveys, Vol. 31, No 3, September 1999.
  • Gerçek veri setlerinin kaynağı : Işık, D.; Dolu, O.; Özbek, U.: “Web Sayfalarının Özelliklerini Elde Eden ve Web Sayfaları Benzerlik Ölçütlerini Karşılaştıran Uygulama”, Lisans Tezi, İstanbul Teknik Üniversitesi, (2006)
  • Robertson, S.E.; Jones, K. Sparck: “Simple, proven approachesto text retrieval”, Technical Report Number 356, Computer Laboratory, UCAM-CL-TR-356, 1994.
  • Kaufman, L.; Rousseeuw, P. J.: “Finding Groups in Data: an Introduction to Cluster Analysis”, John Wiley and Sons, 1990.

K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ

Yıl 2010, Cilt: 22 Sayı: 1, 1 - 18, 26.11.2011

Öz

İnternetin gittikçe yaygınlaşması ve boyutlarının çok genişlemesi web sayfalarının büyük bir veri deposu haline gelmesine ve karmaşıklığının artmasına neden olmuştur. Bu nedenlerle web’de arama yapma ve kullanıcı profili çıkarma alanlarında veri madenciliğine ilgi artmıştır. Web sayfalarında bulunan belgeler içinde gerekli bilgiyi elde etmede kullanılan veri madenciliği yöntemlerinden birisi de belge madenciliğidir. Bu çalışmada, web belgesi içeren üç ayrı veri seti kullanılarak k-means ve aşırı küresel bulanık c-means algoritmalarının kümeleme başarıları karşılaştırılmalı olarak incelendi. Aşırı küresel bulanık c-means algoritmasının kümeleme başarısı, k-means algoritmasından daha iyi çıkmıştır.

Kaynakça

  • Fayyad, U.M.; Piatetsky-Shapiro, G.; Smyth, R.; Uthurusamy, R.: “Advances in Knowledge Discovery and Data Mining”, AAAI/MIT Pres, CA, 1996.
  • Han, J.; Kamber, M.: “Data Mining Concepts and Techniques”, Morgan Kauffmann Publishers Inc., 2006.
  • Pang-Ning Tan, P.N.; Steinbach, M.; Kumar, V.: “Introduction to Data Mining”, Addison Wesley, Mart 2006.
  • Jain, A.K.; Murty, M.N.; Flynn, P.J.: “Data Clustering: A Review”, ACM Computing Surveys, Vol. 31, No 3, September 1999.
  • Gerçek veri setlerinin kaynağı : Işık, D.; Dolu, O.; Özbek, U.: “Web Sayfalarının Özelliklerini Elde Eden ve Web Sayfaları Benzerlik Ölçütlerini Karşılaştıran Uygulama”, Lisans Tezi, İstanbul Teknik Üniversitesi, (2006)
  • Robertson, S.E.; Jones, K. Sparck: “Simple, proven approachesto text retrieval”, Technical Report Number 356, Computer Laboratory, UCAM-CL-TR-356, 1994.
  • Kaufman, L.; Rousseeuw, P. J.: “Finding Groups in Data: an Introduction to Cluster Analysis”, John Wiley and Sons, 1990.
Toplam 7 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Bölüm Araştırma Makaleleri
Yazarlar

Meltem Işık Bu kişi benim

Ali Yılmaz Çamurcu Bu kişi benim

Yayımlanma Tarihi 26 Kasım 2011
Yayımlandığı Sayı Yıl 2010 Cilt: 22 Sayı: 1

Kaynak Göster

APA Işık, M., & Çamurcu, A. Y. (2011). K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ. Marmara Fen Bilimleri Dergisi, 22(1), 1-18. https://doi.org/10.7240/mufbed.69983
AMA Işık M, Çamurcu AY. K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ. MFBD. Kasım 2011;22(1):1-18. doi:10.7240/mufbed.69983
Chicago Işık, Meltem, ve Ali Yılmaz Çamurcu. “K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ”. Marmara Fen Bilimleri Dergisi 22, sy. 1 (Kasım 2011): 1-18. https://doi.org/10.7240/mufbed.69983.
EndNote Işık M, Çamurcu AY (01 Kasım 2011) K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ. Marmara Fen Bilimleri Dergisi 22 1 1–18.
IEEE M. Işık ve A. Y. Çamurcu, “K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ”, MFBD, c. 22, sy. 1, ss. 1–18, 2011, doi: 10.7240/mufbed.69983.
ISNAD Işık, Meltem - Çamurcu, Ali Yılmaz. “K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ”. Marmara Fen Bilimleri Dergisi 22/1 (Kasım 2011), 1-18. https://doi.org/10.7240/mufbed.69983.
JAMA Işık M, Çamurcu AY. K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ. MFBD. 2011;22:1–18.
MLA Işık, Meltem ve Ali Yılmaz Çamurcu. “K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ”. Marmara Fen Bilimleri Dergisi, c. 22, sy. 1, 2011, ss. 1-18, doi:10.7240/mufbed.69983.
Vancouver Işık M, Çamurcu AY. K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ. MFBD. 2011;22(1):1-18.

Marmara Fen Bilimleri Dergisi

e-ISSN : 2146-5150

 

 

MU Fen Bilimleri Enstitüsü

Göztepe Yerleşkesi, 34722 Kadıköy, İstanbul
E-posta: fbedergi@marmara.edu.tr