FATİH Projesine Yönelik Görüşlerin Metin Madenciliği Yöntemleri İle Otomatik Değerlendirilmesi
Yıl 2017,
, 291 - 299, 31.07.2017
Hanife Göker
,
Hakan Tekedere
Öz
Bu çalışmada, FATİH projesine
yönelik internet ortamında yer alan görüşlerin metin madenciliği yöntemleri ile
otomatik tespitinin yapılması amaçlanmaktadır. Çalışma iki temel kısımdan
meydana gelmektedir. İlk basamakta, internet ortamındaki yapısal olmayan veri
kümelerinin yapısal veri haline dönüştürülmesini sağlamak amacıyla metin
madenciliği veri önişleme yazılımı geliştirilmiştir. İkinci basamakta ise
geliştirilen metin madenciliği veri önişleme yazılımı ile yapısal veri kümesine
dönüştürülen veriler üzerinde makine öğrenmesi algoritmaları uygulanarak
yorumlar otomatik sınıflandırılmaktadır. Geliştirilen metin madenciliği veri
önişleme yazılımının en önemli ayırt edici özelliği, yazılımın sadece FATİH
projesine yönelik görüşlerinin veri önişleme basamağında değil, istenilen amaca
yönelik metin sınıflandırma işleminin veri önişleme basamağında konudan
bağımsız bir şekilde kullanılabilir olmasıdır. Çalışmada FATİH projesine
yönelik 444 görüş içeren metin dosyasındaki metinler tf-idf ağırlıklandırma
yöntemi ile vektörel olarak temsil edilerek sınıflandırma algoritmalarının
model başarım ölçütleri karşılaştırılmıştır. Performansı karşılaştırılan
algoritmalardan en yüksek başarımın Ardışık Minimal Optimizasyon Algoritmasına
ait olduğu (%88,73) gözlemlenmiştir.
Kaynakça
- [1] K. Doğan, S. Arslantekin, “Büyük Veri: Önemi, Yapısı ve Günümüzdeki Durum”, DTCF Dergisi, 56 (1), 15-36, 2016.
[2] M. Ö. Dolgun, T. G. Özdemir, D. Oğuz, “Veri Madenciliğinde Yapısal Olmayan Verinin Analizi: Metin ve Web Madenciliği”, İstatikçiler Dergisi, 2(2), 48-58, 2009.
[3] A. Karadağ, H. Takçı, “Metin Madenciliği ile Benzer Haber Tespiti”, Akademik Bilişim Konferansı Bildirileri, Muğla Üniversitesi, 10-12 Şubat, 2010.
[4] M. F. Amasyalı, B. Diri, F. Türkoğlu, “Farklı Özellik Vektörleri ile Türkçe Dokümanların Yazarlarının Belirlenmesi”, 15. Türkiye Yapay Sinir Ağları Sempozyumu, Muğla, 21- 24 Haziran, 2006.
[5] A. C. Tantuğ, “Metin Sınıflandırma (Text Classification)”, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2), 2012.
[6] Aşlıyan, R., Günal, K., “Metin İçerikli Türkçe Doküman Sınıflandırılması”, Akademik Bilişim Konferansı Bildirileri, Muğla Üniversitesi, 10-12 Şubat, 659-665, 2010.
[7] L. Kuzucu, Müşteri memnuniyeti belirlemek için metin madenciliği tabanlı bir yazılım aracı, Yüksek Lisans Tezi, Maltepe Üniversitesi, Fen Bilimleri Enstitüsü, 2015.
[8] H. Núñez, E. Ramos, “Automatic Classification of Academic Documents Using Text Mining Techniques”, In Informatica (CLEI) XXXVIII Conferencia Latinoamericana, Medelin-Colombia, 1-5 October, 1-7, 2012.
[9] P. Sobkowicz, M. Kaschesky, G. Bouchard, “Opinion Mining in Social Media: Modeling, Simulating, and Forecasting Political Opinions in the Web”, Government Information Quarterly, 29, 470-479, 2012.
[10] V. Levent, B. Diri, “Türkçe Dokümanlarda Yapay Sinir Ağları İle Yazar Tanıma”, Akademik Bilişim’14 Konferansı Bildirileri, Mersin Üniversitesi, 5-7 Şubat, 735-741, 2014.
[11] M. M. Mostafa, “More Than Words: Social Networks’ Text Mining For Consumer Brand Sentiments”, Expert Systems with Applications, 40(10), 4241-4251,2013.
[12] A. Visa, “Technology of text mining”, In International Workshop on Machine Learning and Data Mining in Pattern Recognition, Springer-Verlag London, July 25-27, 1–11, 2001.
[13] F. Erten, Metin madenciliği tabanlı bir web sitesi sınıflandırma aracı tasarımı, Yüksek Lisans Tezi, Maltepe üniversitesi, Fen bilimleri Enstitüsü, 2015.
[14] D. Kılınç, E. Borandağ, F. Yücalar, V. Tunalı, M. Şimşek, A. Özçift, “KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”, Marmara Fen Bilimleri Dergisi, 28(3), 89-94. 2016.
[15] V. Tunalı, Metin madenciliği için iyileştirilmiş bir kümeleme yapısının tasarımı ve uygulaması”, Doktora Tezi, Marmara Üniversitesi, Fen Bilimleri Enstitüsü, 2011.
[16] M. Çetin, M. F. Amasyalı, “Active Learning for Turkish Sentiment Analysis”, IEEE International Symposium on Innovations in Intelligent Systems and Applications (INISTA), Albena-Bulgaria, 19-21 June, 1–4, 2013.
[17] D. Kılınç, F. Bozyiğit, A. Özçift, F. Yucalar, E. Borandağ, “Metin Madenciliği Kullanılarak Yazılım Kullanımına Dair Bulguların Elde Edilmesi”, 9. Ulusal Yazılım Mühendisliği Sempozyumu, Yaşar Üniversitesi, 9-11 Eylül, 2015.
[18] K. Ergün, Metin madenciliği yöntemleri ile ürün yorumlarının otomatik değerlendirilmesi, Doktora Tezi, Sakarya Üniversitesi, Fen Bilimleri Enstitüsü, 2012.
[19] H. Göker, H. I. Bülbül, “Improving an Early Warning System to Prediction of Student Examination Achievement”, 13th International Conference on Machine Learning and Applications (ICMLA'13), Detroit-USA, 3-5 December, 568-573, 2014.
[20] A. Haltaş, A. Alkan, M. Karabulut, “Metin Sınıflandırmada Sezgisel Arama Algoritmalarının Performans Analizi”, Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 30(3), 417-427, 2015.
[21] Y. Argüden, B. Erşahin, Veri Madenciliği: Veriden Bilgiye, Masraftan Değere, ARGE Danışmanlık Yayınları, İstanbul, 2008.
[22] A. Güven, Türkçe belgelerin anlam tabanlı yöntemlerle madenciliği, Doktora Tezi, Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2007.
[23] T. Kaşıkçı, H. Gökçen, “Metin Madenciliği İle E-Ticaret Sitelerinin Belirlenmesi”, Bilişim Teknolojileri Dergisi, 7(1), 25-32, 2014.
[24] E. Alpaydın, Introduction to Machine Learning, The MIT Press, London, 2004.
[25] A. Tunç, İ. Ülger, “Veri Madenciliği Uygulamalarında Özellik Seçimi İçin Finansal Değerlere Binning ve Five Number Summary Metotları İle Normalizasyon İşleminin Uygulanması”, XVIII. Akademik Bilişim Konferansı, Adnan Menderes Üniversitesi, 30 Ocak- 5 Şubat, 2016.
[26] H. Almuallim, T. G. Dietterich, Learning with many Irrelevant Features, AAAI Pres, California, 1991.
[27] S. İlhan, N. Duru, Ş. Karagöz, M. Sağır, “Metin Madenciliği ile Soru Cevaplama Sistemi”, Elektronik ve Bilgisayar Mühendisliği Sempozyumu (ELECO), Bursa, 26-30 Kasım, 356-359, 2008.
[28] K. Çalış, O. Gazdağı, O. Yıldız, “Reklam İçerikli Epostaların Metin Madenciliği Yöntemleri ile Otomatik Tespiti”, Bilişim Teknolojileri Dergisi, 6(1), 1-7, 2013.
[29] P. Soucy, W. Mineau, “Beyond TFIDF Weighting for Text Categorization in the Vector Space Model”, IEEE International Conference,Edinburgh-Scotland, July 30- August 05, 1130-1135, 2005.
[30] J. Han, M. Kamber, J. Pei, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, USA, 2011.
[31] C. Zhang, S. Zhang, Association Rule Mining, Models and Algoritms, Springer, USA, 2002.
[32] Y. Özkan, Veri Madenciliği Yöntemleri, Papatya Yayıncılık Eğitim, İstanbul, 2008.
[33] E. Ardıl, Esnek hesaplama yaklaşımı ile yazılım hata kestirimi, Yüksek Lisans Tezi, Trakya Üniversitesi, Fen Bilimleri Enstitüsü, 2009.
[34] M. Elmas, Destek vektör makineleri ile fiyat tahminleri ve kuyumculuk sektöründe bir uygulama, Yüksek Lisans Tezi, İstanbul Üniversitesi, Fen Bilimleri Enstitüsü, 2012.
[35] J. C. Platt, 12 fast training of support vector machines using sequential minimal optimization. Advances in kernel methods, 185-208, 1999.
[36] H. Akpınar, “Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği”, İstanbul Üniversitesi İşletme Fakültesi Dergisi, 29(1), 1-22, 2000.
[37] X. Wu, V. Kumar, J. R. Quinlan, J. Ghosh,Q. Yang, H. Motoda, G. J. McLachlan, A. Ng, B. Liu, P. S. Yu, Z. Zhou, M. Steinbach, D. J. Hand, D. Steinberg, “Top 10 Algorithms in Data Mining”, Knowledge and Information Systems, 14(1), 1-37, 2008.
[38] H. Göker, Üniversite giriş sınavında öğrencilerin başarılarının veri madenciliği yöntemleri ile tahmin edilmesi, Yüksek Lisans Tezi, Gazi Üniversitesi, Bilişim Enstitüsü, 2012.
[39] H. K. Mohamed, “Automatic documents classification”, Computer Engineering & Systems, ICCES'07. International Conference on IEEE, 27- 29 November, 33-37, 2007.
[40] W. He, “Examining Students’ Online Interaction In A Live Video Streaming Environment Using Data Mining and Text Mining”. Computers in Human Behavior, 29(1), 90-102, 2013.
[41] F. S. Gharehchopogh, Z. A. Khalifelu, “Analysis and Evaluation of Unstructured Data: Text Mining Versus Natural Language Processing”, 5th International Conference on Application of Information and Communication Technologies (AICT), Baku-Azerbaijan, 12-14 October, 1-4, 2011
[42] S. Savaş, N. Topaloğlu, M. Yılmaz, “Veri Madenciliği ve Türkiye’deki Uygulama Örnekleri”, İstanbul. Ticaret Üniversitesi Fen Bilimleri Dergisi, 11(21), 1–23, 2012