Research Article
BibTex RIS Cite

KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi

Year 2016, Volume: 28 Issue: 3, 89 - 94, 31.12.2016
https://doi.org/10.7240/mufbed.69674

Abstract

Metin tabanlı veri setleri üzerinde analiz işlemi gerçekleştirebilmek için Veri Madenciliğinin alt alanı olan Metin Madenciliği (MM) alanındaki

teknik ve yöntemler kullanılmaktadır. Bu çalışmada, akademik yayınlar üzerinde metin madenciliği yöntemleri kullanılarak akademik

makalelerin sınıflara ayrılarak tasnif edilme başarısı ölçülmüştür. Bu amaçla bir akademik bilgi paylaşım ağı olan Research Gate üzerindeki

belirli akademik yayınların özetleri, geliştirilen yazılım araçları kullanılarak elde edilmiş ve bu özetlerden bir veri seti oluşturulmuştur. Veri

seti içerisindeki yayınlar “Materials Science & Engineering” ve “Social Sciences & Humanities” olmak üzere iki ayrı kategoride yer almaktadırlar.

Veri seti üzerinde R dili ve R Studio araçlarından yararlanılarak sınıflandırma amacıyla K-En Yakın Komşu (KNN) algoritması

kullanılmıştır. Çalışma sonucunda %96,67 oranında doğruluk (ACC) değeri bulunarak yayınların hangi sınıfa ait olduğu tespit edilmiştir.

References

  • Korhonen, A., Séaghdha, D. Ó., Silins, I., Sun, L., Högberg, J., Stenius, U. (2012). “Text mining for literature review and knowledge discovery in cancer risk assessment and research”. PLoS One. 7(4)
  • Acun, G., Bilgin, T. T. (2015). “Yazılım hata logları kullanılarak veri madenciliği uygulaması gerçekleştirilmesi”. Marmara Fen Bilimleri Dergisi, 27(1).
  • Ananiadou, S., McNaught, J. (2006). “Text mining for biology and biomedicine”. Boston and London: Artech House. 33(1). 135-140.
  • Zweigenbaum, P., Demner-Fushman, D., Yu, H., Cohen, K.B. (2007). “Frontiers of biomedical text mining: current progress”. Briefings in Bioinformatics. 8(5). 358-375.
  • Cohen, K. B., Yu, H., Bourne, P. E., Hirschman, L. (2008). “Translating biology: Text mining tools that work”. Proceedings of the Pacific Symposium on Biocomputing (PSB-08). (13). 551-555.
  • Onan A., Korukoğlu S. (2016) “Makine öğrenmesi yöntemlerinin görüş madenciliğinde kullanılması üzerine bir literatür araştırması” Pamukkale Univ Muhendislik Bilimleri Dergisi, 22 (2), 111-122

Classification of Scientific Articles Using Text Mining with KNN Algorithm and R Language

Year 2016, Volume: 28 Issue: 3, 89 - 94, 31.12.2016
https://doi.org/10.7240/mufbed.69674

Abstract

In order to perform analysis on text-based datasets, the techniques and methods in Text Mining (TM) which is a subdomain of Data Mining

are used. In this study, it is aimed to evaluate the classification accuracy of academic articles which are produced in academic domain.

In accordance with this purpose, the abstracts of the academic articles are obtained and a dataset is created from an academic knowledge

sharing network named Research Gate by using self-developed software tools. The academic articles in the dataset fall into two categories

as “Materials Science & Engineering” and “Social Sciences & Humanities”. KNN (k-nearest neighbors) classification algorithm is performed

by utilizing R language

References

  • Korhonen, A., Séaghdha, D. Ó., Silins, I., Sun, L., Högberg, J., Stenius, U. (2012). “Text mining for literature review and knowledge discovery in cancer risk assessment and research”. PLoS One. 7(4)
  • Acun, G., Bilgin, T. T. (2015). “Yazılım hata logları kullanılarak veri madenciliği uygulaması gerçekleştirilmesi”. Marmara Fen Bilimleri Dergisi, 27(1).
  • Ananiadou, S., McNaught, J. (2006). “Text mining for biology and biomedicine”. Boston and London: Artech House. 33(1). 135-140.
  • Zweigenbaum, P., Demner-Fushman, D., Yu, H., Cohen, K.B. (2007). “Frontiers of biomedical text mining: current progress”. Briefings in Bioinformatics. 8(5). 358-375.
  • Cohen, K. B., Yu, H., Bourne, P. E., Hirschman, L. (2008). “Translating biology: Text mining tools that work”. Proceedings of the Pacific Symposium on Biocomputing (PSB-08). (13). 551-555.
  • Onan A., Korukoğlu S. (2016) “Makine öğrenmesi yöntemlerinin görüş madenciliğinde kullanılması üzerine bir literatür araştırması” Pamukkale Univ Muhendislik Bilimleri Dergisi, 22 (2), 111-122
There are 6 citations in total.

Details

Subjects Engineering
Journal Section Research Articles
Authors

Deniz Kılınç This is me

Emin Borandağ This is me

Fatih Yücalar This is me

Volkan Tunalı

Macit Şimşek This is me

Akın Özçift This is me

Publication Date December 31, 2016
Acceptance Date July 27, 2016
Published in Issue Year 2016 Volume: 28 Issue: 3

Cite

APA Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., et al. (2016). KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. Marmara Fen Bilimleri Dergisi, 28(3), 89-94. https://doi.org/10.7240/mufbed.69674
AMA Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A. KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. MAJPAS. December 2016;28(3):89-94. doi:10.7240/mufbed.69674
Chicago Kılınç, Deniz, Emin Borandağ, Fatih Yücalar, Volkan Tunalı, Macit Şimşek, and Akın Özçift. “KNN Algoritması Ve R Dili Ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”. Marmara Fen Bilimleri Dergisi 28, no. 3 (December 2016): 89-94. https://doi.org/10.7240/mufbed.69674.
EndNote Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A (December 1, 2016) KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. Marmara Fen Bilimleri Dergisi 28 3 89–94.
IEEE D. Kılınç, E. Borandağ, F. Yücalar, V. Tunalı, M. Şimşek, and A. Özçift, “KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”, MAJPAS, vol. 28, no. 3, pp. 89–94, 2016, doi: 10.7240/mufbed.69674.
ISNAD Kılınç, Deniz et al. “KNN Algoritması Ve R Dili Ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”. Marmara Fen Bilimleri Dergisi 28/3 (December 2016), 89-94. https://doi.org/10.7240/mufbed.69674.
JAMA Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A. KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. MAJPAS. 2016;28:89–94.
MLA Kılınç, Deniz et al. “KNN Algoritması Ve R Dili Ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi”. Marmara Fen Bilimleri Dergisi, vol. 28, no. 3, 2016, pp. 89-94, doi:10.7240/mufbed.69674.
Vancouver Kılınç D, Borandağ E, Yücalar F, Tunalı V, Şimşek M, Özçift A. KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. MAJPAS. 2016;28(3):89-94.

Cited By

















R ile Sosyal Ağ Madenciliği
Marmara Fen Bilimleri Dergisi
Buket Doğan
https://doi.org/10.7240/marufbd.330585


METİN MADENCİLİĞİ: İMKÂNLAR, YÖNTEMLER VE KISITLAR
Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi
Suat ATAN
https://doi.org/10.20875/makusobed.476524

Marmara Journal of Pure and Applied Sciences

e-ISSN : 2146-5150