Araştırma Makalesi
BibTex RIS Kaynak Göster

KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi

Yıl 2016, Cilt: 28 Sayı: 3, 89 - 94, 31.12.2016
https://doi.org/10.7240/mufbed.69674

Öz

Metin tabanlı veri setleri üzerinde analiz işlemi gerçekleştirebilmek için Veri Madenciliğinin alt alanı olan Metin Madenciliği (MM) alanındaki

teknik ve yöntemler kullanılmaktadır. Bu çalışmada, akademik yayınlar üzerinde metin madenciliği yöntemleri kullanılarak akademik

makalelerin sınıflara ayrılarak tasnif edilme başarısı ölçülmüştür. Bu amaçla bir akademik bilgi paylaşım ağı olan Research Gate üzerindeki

belirli akademik yayınların özetleri, geliştirilen yazılım araçları kullanılarak elde edilmiş ve bu özetlerden bir veri seti oluşturulmuştur. Veri

seti içerisindeki yayınlar “Materials Science & Engineering” ve “Social Sciences & Humanities” olmak üzere iki ayrı kategoride yer almaktadırlar.

Veri seti üzerinde R dili ve R Studio araçlarından yararlanılarak sınıflandırma amacıyla K-En Yakın Komşu (KNN) algoritması

kullanılmıştır. Çalışma sonucunda %96,67 oranında doğruluk (ACC) değeri bulunarak yayınların hangi sınıfa ait olduğu tespit edilmiştir.

Kaynakça

  • Korhonen, A., Séaghdha, D. Ó., Silins, I., Sun, L., Högberg, J., Stenius, U. (2012). “Text mining for literature review and knowledge discovery in cancer risk assessment and research”. PLoS One. 7(4)
  • Acun, G., Bilgin, T. T. (2015). “Yazılım hata logları kullanılarak veri madenciliği uygulaması gerçekleştirilmesi”. Marmara Fen Bilimleri Dergisi, 27(1).
  • Ananiadou, S., McNaught, J. (2006). “Text mining for biology and biomedicine”. Boston and London: Artech House. 33(1). 135-140.
  • Zweigenbaum, P., Demner-Fushman, D., Yu, H., Cohen, K.B. (2007). “Frontiers of biomedical text mining: current progress”. Briefings in Bioinformatics. 8(5). 358-375.
  • Cohen, K. B., Yu, H., Bourne, P. E., Hirschman, L. (2008). “Translating biology: Text mining tools that work”. Proceedings of the Pacific Symposium on Biocomputing (PSB-08). (13). 551-555.
  • Onan A., Korukoğlu S. (2016) “Makine öğrenmesi yöntemlerinin görüş madenciliğinde kullanılması üzerine bir literatür araştırması” Pamukkale Univ Muhendislik Bilimleri Dergisi, 22 (2), 111-122

Classification of Scientific Articles Using Text Mining with KNN Algorithm and R Language

Yıl 2016, Cilt: 28 Sayı: 3, 89 - 94, 31.12.2016
https://doi.org/10.7240/mufbed.69674

Öz

In order to perform analysis on text-based datasets, the techniques and methods in Text Mining (TM) which is a subdomain of Data Mining

are used. In this study, it is aimed to evaluate the classification accuracy of academic articles which are produced in academic domain.

In accordance with this purpose, the abstracts of the academic articles are obtained and a dataset is created from an academic knowledge

sharing network named Research Gate by using self-developed software tools. The academic articles in the dataset fall into two categories

as “Materials Science & Engineering” and “Social Sciences & Humanities”. KNN (k-nearest neighbors) classification algorithm is performed

by utilizing R language

Kaynakça

  • Korhonen, A., Séaghdha, D. Ó., Silins, I., Sun, L., Högberg, J., Stenius, U. (2012). “Text mining for literature review and knowledge discovery in cancer risk assessment and research”. PLoS One. 7(4)
  • Acun, G., Bilgin, T. T. (2015). “Yazılım hata logları kullanılarak veri madenciliği uygulaması gerçekleştirilmesi”. Marmara Fen Bilimleri Dergisi, 27(1).
  • Ananiadou, S., McNaught, J. (2006). “Text mining for biology and biomedicine”. Boston and London: Artech House. 33(1). 135-140.
  • Zweigenbaum, P., Demner-Fushman, D., Yu, H., Cohen, K.B. (2007). “Frontiers of biomedical text mining: current progress”. Briefings in Bioinformatics. 8(5). 358-375.
  • Cohen, K. B., Yu, H., Bourne, P. E., Hirschman, L. (2008). “Translating biology: Text mining tools that work”. Proceedings of the Pacific Symposium on Biocomputing (PSB-08). (13). 551-555.
  • Onan A., Korukoğlu S. (2016) “Makine öğrenmesi yöntemlerinin görüş madenciliğinde kullanılması üzerine bir literatür araştırması” Pamukkale Univ Muhendislik Bilimleri Dergisi, 22 (2), 111-122
Toplam 6 adet kaynakça vardır.

Ayrıntılar

Konular Mühendislik
Bölüm Araştırma Makaleleri
Yazarlar

Deniz Kılınç Bu kişi benim

Emin Borandağ Bu kişi benim

Fatih Yücalar Bu kişi benim

Volkan Tunalı

Macit Şimşek Bu kişi benim

Akın Özçift Bu kişi benim

Yayımlanma Tarihi 31 Aralık 2016
Kabul Tarihi 27 Temmuz 2016
Yayımlandığı Sayı Yıl 2016 Cilt: 28 Sayı: 3

Kaynak Göster

APA Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., vd. (2016). KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. Marmara Fen Bilimleri Dergisi, 28(3), 89-94. https://doi.org/10.7240/mufbed.69674
AMA Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A. KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. MFBD. Aralık 2016;28(3):89-94. doi:10.7240/mufbed.69674
Chicago Kılınç, Deniz, Emin Borandağ, Fatih Yücalar, Volkan Tunalı, Macit Şimşek, ve Akın Özçift. “KNN Algoritması Ve R Dili Ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”. Marmara Fen Bilimleri Dergisi 28, sy. 3 (Aralık 2016): 89-94. https://doi.org/10.7240/mufbed.69674.
EndNote Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A (01 Aralık 2016) KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. Marmara Fen Bilimleri Dergisi 28 3 89–94.
IEEE D. Kılınç, E. Borandağ, F. Yücalar, V. Tunalı, M. Şimşek, ve A. Özçift, “KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”, MFBD, c. 28, sy. 3, ss. 89–94, 2016, doi: 10.7240/mufbed.69674.
ISNAD Kılınç, Deniz vd. “KNN Algoritması Ve R Dili Ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”. Marmara Fen Bilimleri Dergisi 28/3 (Aralık 2016), 89-94. https://doi.org/10.7240/mufbed.69674.
JAMA Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A. KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. MFBD. 2016;28:89–94.
MLA Kılınç, Deniz vd. “KNN Algoritması Ve R Dili Ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”. Marmara Fen Bilimleri Dergisi, c. 28, sy. 3, 2016, ss. 89-94, doi:10.7240/mufbed.69674.
Vancouver Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A. KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. MFBD. 2016;28(3):89-94.

Cited By

















R ile Sosyal Ağ Madenciliği
Marmara Fen Bilimleri Dergisi
Buket Doğan
https://doi.org/10.7240/marufbd.330585


METİN MADENCİLİĞİ: İMKÂNLAR, YÖNTEMLER VE KISITLAR
Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi
Suat ATAN
https://doi.org/10.20875/makusobed.476524

Marmara Fen Bilimleri Dergisi

e-ISSN : 2146-5150

 

 

MU Fen Bilimleri Enstitüsü

Göztepe Yerleşkesi, 34722 Kadıköy, İstanbul
E-posta: fbedergi@marmara.edu.tr