VERİ MADENCİLİĞİNDE NESNE YÖNELİMLİ BİRLEŞTİRİCİ HİYERARŞİK KÜMELEME MODELİ
Yıl 2011,
Cilt: 26 Sayı: 1, 0 - , 20.02.2013
Mehmet Yeşilbudak
Hamdi Kahraman
Hacer Karacan
Öz
Veri madenciliği alanında farklı kullanım amacına sahip çok sayıda teknik mevcuttur. Son yıllarda sıklıkla kullanılan tekniklerden biri de birleştirici hiyerarşik kümeleme analizidir. Bu çalışmada nesne yönelimli birleştirici hiyerarşik kümeleme modeli geliştirilmiştir. Geliştirilen modelin interaktifliği sayesinde kullanıcıların sistem arayüzünü rahatlıkla kullanabilmesi ve nesne yönelimli programlama sayesinde de kullanıcı taleplerinin hızlı bir şekilde karşılanması sağlanmıştır. Geliştirilen model bu sayede optimum performansa sahip olmuştur. Modelin test aşamasında, Türkiye’deki 44 ile ait aylık ortalama rüzgâr hızı verileri hiyerarşik olarak kümelenmiştir. Kümeleme sonuçları Microsoft Visual Studio.NET platformunda oluşturulan arayüzde metinsel formatta sunulurken; Matlab’da ise dendrogramlar aracılığıyla görselleştirilmiştir. Kümeleme sonuçları sayesinde, önceden gizli olan fakat model sayesinde ortaya çıkarılan pek çok çıkarım elde edilmiş ve model analizi etkin bir şekilde yapılmıştır.
Kaynakça
- Akpınar, H., “Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği”, İstanbul Üniversitesi İşletme Fakültesi Dergisi, Cilt 29, No 1, 1-22, 2000.
- Luo, Q., “Advancing Knowledge Discovery and Data Mining”, The First International Workshop on Knowledge Discovery and Data Mining (WKDD’08), Adelaide, SA, 3-5, 23-24 Ocak 2008.
- Essid, S., Richard, G. ve David, B., “Inferring Efficient Hierarchical Taxonomies for MIR Tasks: Application to Musical Instruments”, The 6th International Conference on Music Information Retrieval (ISMIR’05), London, UK, 324-328, 11-15 Eylül 2005.
- Choi, Y. S., Kim, S. J. ve Lee, S., “Hierarchical Shot Clustering for Video Summarization”, The Seventh European Conference on European Interactive Television (EuroITV’09), New York, USA, 1100-1107, 3-5 Haziran 2009.
- Fung, B. K., Wang, K. ve Ester, M., “Hierarchical Document Clustering”, Encyclopedia of Data Warehousing and Mining, Idea Group Reference, Cilt 1, A-H, 555-559, 2004.
- Doherty, K. J., Adams, R. G., Davey, N. ve Pensuwon, W., “Hierarchical Topological Clustering Learns Stock Market Sectors”, Congress on Computational Intelligence Methods and Applications, İstanbul, Türkiye, 11-17 Aralık 2005.
- Beaver, S. ve Palazoglu, A., “Cluster Analysis of Hourly Wind Measurements to Reveal Synoptic Regimes Affecting Air Quality”, Journal of Applied Meteorology and Climatology, Cilt 45, No 12, 1710-1726, 2006.
- Karabulut, M., Gürbüz, M. ve Sandal, E. K., “Hiyerarşik Küme Tekniği Kullanılarak Türkiye’deki İllerin Sosyo-ekonomik Benzerliklerinin Analizi”, SDÜ Sosyal Bilimler Enstitüsü Dergisi, Cilt 3, No 5, 65-78, 2008.
- Sandal, E. K., “Sosyo-ekonomik Kriterler Bakımından Türkiye, Doğu Avrupa ve Kafkas Ülkelerinin Karşılaştırılması”, Doğu Coğrafya Dergisi, Cilt 22, No 1, 89-105, 2009.
- Ersöz, F.,“Savunma Yeteneklerinin Geliştirilmesinde Bilgi&Arge ve Inovasyonun Rolü ile Inovasyon Göstergelerine Göre Türkiye’nin Yeri”, TÜBAV Bilim Dergisi, Cilt 2, No 3, 664-371, 2009.
- Sever, H. ve Oğuz, B., “Veri Tabanlarında Bilgi Keşfine Formel Bir Yaklaşım: Eşleştirme Sorguları ve Algoritmalar”, Bilgi Dünyası, Cilt 3, No 2, 173-204, 2002.
- Fayyad, U., Shapiro, G. P. ve Symth, P., “The KDD Process for Extracting Useful Knowledge From Volumes of Data”, Communications of the ACM, Cilt 39, No 11, 27-34, 1996.
- Han, J. ve Kamber, M., “Introduction”, Data Mining Concepts and Techniques, Elsevier Inc., San Francisco, USA, 21-27, 2006.
- Kohavi, R., “Data Mining and Visualization”, The Sixth Annual Symposium on Frontiers of Engineering, , Irvine, California, 14-16 Eylül 2000.
- Berry, M. J. A. ve Linoff, G. S., “Data MiningApplications”, Data Mining Techniques For Marketing Sales And Customer Relationship Management, Wiley Publishing,
- Canada, 87-120,2004.
- Özkan, Y., “Kümeleme”, Veri Madenciliği Yöntemleri, Papatya Yayıncılık, İstanbul, 131-148, 2008.
- Tan, P. N., Steinbach, M. ve Kumar, V., “Cluster Analysis: Basic Concepts and Algorithms”, Introduction to Data Mining, Addison-Wesley, Boston, USA, 487-495, 2006.
- Witten, I. H. ve Frank, E., “Implementations: Real machine learning schemes”, Data Mining Practical Machine Learning Tools and Techniques, Morgan Kaufmann Publishers, San Francisco, 235-242, 2005.
- Internet:http://www.lrde.epita.fr/dload//20080702-Seminar/folio-dt.pdf
- Merigó, J. ve Gil-Lafuente, A., “Using the OWA operator in the minkowski distance”, International Journal of Computer Science, Cilt 3, No 3, 149-157, 2008.
- Larose, D. T., “Hierarchical and k-Means Clustering”, Discovering Knowledge in Data: An Introduction to Data Mining, John Wiley & Sons Inc., Hoboken, NJ, 147-162, 2005.
- Agarwal, P., Alam, M. A. ve R. Biswas, “Analysing the Agglomerative Hierarchical Clustering Algorithm for Categorical Attributes”, International Journal of Innovation, Management and Technology, Cilt 1, No. 2, 186-190, 2010.
- Internet: http://ceng.gazi.edu.tr/~hkaracan/NYP
- H6.pdf
- Larman, C., “More UML Notation”, Applying UML and Patterns: An Introduction to Object Oriented Analysis and Design and Unified Process, Prentice Hall, Upper Saddle River, NJ, 607-608, 2002.
Yıl 2011,
Cilt: 26 Sayı: 1, 0 - , 20.02.2013
Mehmet Yeşilbudak
Hamdi Kahraman
Hacer Karacan
Kaynakça
- Akpınar, H., “Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği”, İstanbul Üniversitesi İşletme Fakültesi Dergisi, Cilt 29, No 1, 1-22, 2000.
- Luo, Q., “Advancing Knowledge Discovery and Data Mining”, The First International Workshop on Knowledge Discovery and Data Mining (WKDD’08), Adelaide, SA, 3-5, 23-24 Ocak 2008.
- Essid, S., Richard, G. ve David, B., “Inferring Efficient Hierarchical Taxonomies for MIR Tasks: Application to Musical Instruments”, The 6th International Conference on Music Information Retrieval (ISMIR’05), London, UK, 324-328, 11-15 Eylül 2005.
- Choi, Y. S., Kim, S. J. ve Lee, S., “Hierarchical Shot Clustering for Video Summarization”, The Seventh European Conference on European Interactive Television (EuroITV’09), New York, USA, 1100-1107, 3-5 Haziran 2009.
- Fung, B. K., Wang, K. ve Ester, M., “Hierarchical Document Clustering”, Encyclopedia of Data Warehousing and Mining, Idea Group Reference, Cilt 1, A-H, 555-559, 2004.
- Doherty, K. J., Adams, R. G., Davey, N. ve Pensuwon, W., “Hierarchical Topological Clustering Learns Stock Market Sectors”, Congress on Computational Intelligence Methods and Applications, İstanbul, Türkiye, 11-17 Aralık 2005.
- Beaver, S. ve Palazoglu, A., “Cluster Analysis of Hourly Wind Measurements to Reveal Synoptic Regimes Affecting Air Quality”, Journal of Applied Meteorology and Climatology, Cilt 45, No 12, 1710-1726, 2006.
- Karabulut, M., Gürbüz, M. ve Sandal, E. K., “Hiyerarşik Küme Tekniği Kullanılarak Türkiye’deki İllerin Sosyo-ekonomik Benzerliklerinin Analizi”, SDÜ Sosyal Bilimler Enstitüsü Dergisi, Cilt 3, No 5, 65-78, 2008.
- Sandal, E. K., “Sosyo-ekonomik Kriterler Bakımından Türkiye, Doğu Avrupa ve Kafkas Ülkelerinin Karşılaştırılması”, Doğu Coğrafya Dergisi, Cilt 22, No 1, 89-105, 2009.
- Ersöz, F.,“Savunma Yeteneklerinin Geliştirilmesinde Bilgi&Arge ve Inovasyonun Rolü ile Inovasyon Göstergelerine Göre Türkiye’nin Yeri”, TÜBAV Bilim Dergisi, Cilt 2, No 3, 664-371, 2009.
- Sever, H. ve Oğuz, B., “Veri Tabanlarında Bilgi Keşfine Formel Bir Yaklaşım: Eşleştirme Sorguları ve Algoritmalar”, Bilgi Dünyası, Cilt 3, No 2, 173-204, 2002.
- Fayyad, U., Shapiro, G. P. ve Symth, P., “The KDD Process for Extracting Useful Knowledge From Volumes of Data”, Communications of the ACM, Cilt 39, No 11, 27-34, 1996.
- Han, J. ve Kamber, M., “Introduction”, Data Mining Concepts and Techniques, Elsevier Inc., San Francisco, USA, 21-27, 2006.
- Kohavi, R., “Data Mining and Visualization”, The Sixth Annual Symposium on Frontiers of Engineering, , Irvine, California, 14-16 Eylül 2000.
- Berry, M. J. A. ve Linoff, G. S., “Data MiningApplications”, Data Mining Techniques For Marketing Sales And Customer Relationship Management, Wiley Publishing,
- Canada, 87-120,2004.
- Özkan, Y., “Kümeleme”, Veri Madenciliği Yöntemleri, Papatya Yayıncılık, İstanbul, 131-148, 2008.
- Tan, P. N., Steinbach, M. ve Kumar, V., “Cluster Analysis: Basic Concepts and Algorithms”, Introduction to Data Mining, Addison-Wesley, Boston, USA, 487-495, 2006.
- Witten, I. H. ve Frank, E., “Implementations: Real machine learning schemes”, Data Mining Practical Machine Learning Tools and Techniques, Morgan Kaufmann Publishers, San Francisco, 235-242, 2005.
- Internet:http://www.lrde.epita.fr/dload//20080702-Seminar/folio-dt.pdf
- Merigó, J. ve Gil-Lafuente, A., “Using the OWA operator in the minkowski distance”, International Journal of Computer Science, Cilt 3, No 3, 149-157, 2008.
- Larose, D. T., “Hierarchical and k-Means Clustering”, Discovering Knowledge in Data: An Introduction to Data Mining, John Wiley & Sons Inc., Hoboken, NJ, 147-162, 2005.
- Agarwal, P., Alam, M. A. ve R. Biswas, “Analysing the Agglomerative Hierarchical Clustering Algorithm for Categorical Attributes”, International Journal of Innovation, Management and Technology, Cilt 1, No. 2, 186-190, 2010.
- Internet: http://ceng.gazi.edu.tr/~hkaracan/NYP
- H6.pdf
- Larman, C., “More UML Notation”, Applying UML and Patterns: An Introduction to Object Oriented Analysis and Design and Unified Process, Prentice Hall, Upper Saddle River, NJ, 607-608, 2002.