Research Article

Bilimsel Makalelerin Atıf Sayısı Tahmini

April 1, 2020
TR EN

Bilimsel Makalelerin Atıf Sayısı Tahmini

Öz

Bilimsel makalelerin etkisini ölçmek kolay ya da tekdüze bir süreç değildir. Makalelerin atıf sayıları, etkilerinin ölçümünde önemli bir rol oynamaktadır. Öte yandan, bir makalenin atıf sayısı, makale yayınlandığı anda elde edilebilen bir veri değildir. Atıf sayısının elde edilebilmesi için makalenin yayınlanması ve toplulukta fark edilerek atıf(lar) alması, yani uzun sayılabilecek bir süre geçmesi gerekmektedir. Bu çalışmada, atıf sayısının erişilebilir olmaması problemini basitleştirdik ve bir makalenin yayınlanmasından sonraki bir yıl içerisinde en az bir atıf alıp almayacağını tahmin eden bir derin öğrenme modeli oluşturduk. Modelimizde kelime dizileri arasındaki ilişkiyi bulabilmek adına Uzun Kısa Süreli Bellek (UKSB) kullanılmaktadır. Bunun yanı sıra, bu çalışmada modelimizin makale tam metni yerine sadece özetini kullandığımızda bu durumun performans üzerindeki etkisini de analiz ediyoruz. Deneylerimizde herkese açık veri kümelerini kullanılmıştır. Makalelerin tam metni Kaggle’da bulunan bir veri kümesinde mevcuttur. Özet, üstveri öznitelikleri ve ilk yıl atıf sayıları ise Microsoft Academic Graph’tan çıkarılmıştır. Elde edilen sonuçlar, tam metin kullanımının daha yüksek doğrulukla sonuçlandığını göstermektedir. Fakat tam metin kullanıldığında modelin eğitim süresi, özet kullanıldığındaki eğitim süresine göre çok yüksek çıkmaktadır. Ayrıca, tam metinlere kıyasla makale özetleri daha kolay erişilebilir durumdadır. Son olarak, eğittiğimiz model bu makalenin ilk yayın yılında en az bir atıf alacağını öngörmektedir.

Anahtar Kelimeler

References

  1. J. Beel and B. Gipp, “Google Scholar’s ranking algorithm: an introductory overview,” in Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09), 2009, vol. 1, pp. 230–241.
  2. M. Jacobson. (2017) How Far Down the Search Engine Results Page Will Most People Go? [Online]. Available: https://www.theleverageway.com/blog/how-far-down-the-search-engine-results-page-will-most-people-go/
  3. R. K. Merton, “The Matthew effect in science: The reward and communication systems of science are considered,” Science, vol. 159 (3810), pp. 58–63, 1968, American Association for the Advancement of Science.
  4. J. Gehrke, P. Ginsparg, and J. Kleinberg, “Overview of the 2003 KDD Cup,” ACM SIGKDD Explorations Newsletter, vol. 5 (2), pp. 149–151, 2003, ACM.
  5. K. McKeown, H. Daume III, S. Chaturvedi, J. Paparrizos, K. Thadani, P. Barrio, O. Biran, S. Bothe, M. Collins, K. R. Fleischmann, and others, “Predicting the impact of scientific concepts using full-text features,” Journal of the Association for Information Science and Technology, vol. 67 (11), pp. 2684–2696, 2016, Wiley Online Library.
  6. R. Yan, J. Tang, X. Liu, D. Shan, and X. Li, “Citation count prediction: learning to estimate future citations for literature,” in Proceedings of the 20th ACM international conference on Information and knowledge management, 2011, pp. 1247–1252, ACM.
  7. R. Yan, C. Huang, J. Tang, Y. Zhang, and X. Li, “To better stand on the shoulder of giants,” in Proceedings of the 12th ACM/IEEE-CS joint conference on Digital Libraries, 2012, pp. 51–60, ACM.
  8. J. Chen and C. Zhang, “Predicting citation counts of papers,” in IEEE 14th International Conference on Cognitive Informatics & Cognitive Computing (ICCI* CC), 2015, pp. 434–440, IEEE.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

April 1, 2020

Submission Date

March 15, 2020

Acceptance Date

March 28, 2020

Published in Issue

Year 2020

APA
Kızılöz, H. E. (2020). Bilimsel Makalelerin Atıf Sayısı Tahmini. Avrupa Bilim Ve Teknoloji Dergisi, 370-375. https://doi.org/10.31590/ejosat.araconf48

Cited By