Araştırma Makalesi

Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem

Cilt: 38 Sayı: 3 6 Ocak 2023
PDF İndir

Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem

Öz

Birçok farklı sektörde metin halinde bulunan verilerden istenilen bilgilerin elde edilmesi için doğal dil işleme, metin madenciliği ve derin öğrenme yöntemleri kullanılmaktadır. Son zamanlarda artan Ar-Ge proje sayıları ve farklılaşan proje faaliyet alanları ile birlikte Ar-Ge projelerinin ait olduğu araştırma alanlarının belirlenmesi ve bu araştırma alanlarına uygun hakemlerin tespitinde yaşanan sıkıntılar nedeniyle projelerin desteklenme süreçleri olumsuz etkilenebilmektedir. Bu makalede, Ar-Ge projelerinin sınıflandırılması amacıyla öncelikli olarak çalışmanın gerçekleştirildiği veri tabanındaki veriler temizlenmiş ve doğal dil tekniklerinden biri olan “Word2Vec” kelime temsili yöntemi ile otomatik özellik öğrenme yaklaşımı kullanılarak özelliklerin sınıflandırılması amacıyla Evrişimsel Sinir Ağları (CNN-Convolutional Neural Network) modelleri oluşturulmaya çalışılmıştır. TUBİTAK Dergipark sitesinden seçilen ve sınıfları belli olan Ar-Ge projeleri ve Ar-Ge proje içeriğine sahip makalelerden oluşan veri kümesi üzerinde yapılan deneysel çalışmalardan elde edilen değerlendirme sonuçları ile diğer klasik algoritmalar karşılaştırılmış ve özellikle Word2Vec modellerine sahip CNN’lerin daha etkili sonuçları ürettiği birçok performans parametresi ile gösterilmiştir.

Anahtar Kelimeler

Kaynakça

  1. Türkiye Bilimsel Ve Teknolojik Araştırma Kurumu (TÜBİTAK) Faaliyet Raporları (2019), https://www.tubitak.gov.tr/sites/default/files/18842/tubitak_2019_yili_faaliyet_raporu.pdf sayfasından erişilmiştir, 2019.
  2. Kowsari K., Meimandi K.J., Heidarysafa M., Mendu S., Barnes L.E., Brown D.E., Text Classification Algorithms: A Survey, Information, 10, 2019.
  3. LeCun Y., Bengio Y., Hinton G., Deep learning, Nature 2015, 521, 436–444, 2015.
  4. Szczepaniak P.S., Tomczyk A., Pryczek M., Supervised Web Document Classification using Discrete Transforms, Active Hypercontours and Expert Knowledge, Lecture notes in Computer Science, 305–323, 1982.
  5. Sharma A.K., Chaurasia S., Srivastava D.K., Sentimental Short Sentences Classification by Using CNN Deep Learning Model with Fine Tuned Word2Vec, Procedia Computer Science 167, 1139–1147, 2020.
  6. Mikolov T., Chen K., Corrado G., Dean J. Efficient Estimation of Word Representations in Vector Space, ArXiv Prepr ArXiv13013781, 2013.
  7. Kim Y., Convolutional Neural Networks for Sentence Classification, Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), Association for Computational Linguistics, 2014.
  8. Tian Q., Ma J., Liu O., A Hybrid Knowledge and Model System for R&D Project Selection, Expert Systems with Applications, 23 (3), 265-271, 2002.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

6 Ocak 2023

Gönderilme Tarihi

2 Mart 2021

Kabul Tarihi

7 Haziran 2022

Yayımlandığı Sayı

Yıl 2023 Cilt: 38 Sayı: 3

Kaynak Göster

APA
Kocak, S., İç, Y. T., Sert, M., & Dengiz, B. (2023). Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38(3), 1375-1388. https://doi.org/10.17341/gazimmfd.889395
AMA
1.Kocak S, İç YT, Sert M, Dengiz B. Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem. GUMMFD. 2023;38(3):1375-1388. doi:10.17341/gazimmfd.889395
Chicago
Kocak, Serdar, Yusuf Tansel İç, Mustafa Sert, ve Berna Dengiz. 2023. “Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38 (3): 1375-88. https://doi.org/10.17341/gazimmfd.889395.
EndNote
Kocak S, İç YT, Sert M, Dengiz B (01 Ocak 2023) Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38 3 1375–1388.
IEEE
[1]S. Kocak, Y. T. İç, M. Sert, ve B. Dengiz, “Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem”, GUMMFD, c. 38, sy 3, ss. 1375–1388, Oca. 2023, doi: 10.17341/gazimmfd.889395.
ISNAD
Kocak, Serdar - İç, Yusuf Tansel - Sert, Mustafa - Dengiz, Berna. “Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38/3 (01 Ocak 2023): 1375-1388. https://doi.org/10.17341/gazimmfd.889395.
JAMA
1.Kocak S, İç YT, Sert M, Dengiz B. Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem. GUMMFD. 2023;38:1375–1388.
MLA
Kocak, Serdar, vd. “Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 38, sy 3, Ocak 2023, ss. 1375-88, doi:10.17341/gazimmfd.889395.
Vancouver
1.Serdar Kocak, Yusuf Tansel İç, Mustafa Sert, Berna Dengiz. Ar-Ge projelerinin sınıflandırılması için doğal Türkçe dil işleme tabanlı yöntem. GUMMFD. 01 Ocak 2023;38(3):1375-88. doi:10.17341/gazimmfd.889395

Cited By