Research Article

İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli

Volume: 6 Number: 4 August 1, 2018
EN TR

İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli

Abstract

Bu makalede dokümanlarda tema ve alt kavram tespiti konusunda bir model önerilmiş ve deneysel bulgular değerlendirilmiştir. Dokümanlarda tema ve alt kavramların tespiti için kullanılabilecek anlamlı sözcüklerin belirlenmesi amacıyla Helmholtz prensibi temelli Gestalt teorisi kullanılmıştır. Bu sözcüklerin girdi olduğu bir Yapay Sinir Ağı (YSA) modeli oluşturulmuş, eğitim dokümanları (140 adet) ile bu ağ eğitilmiştir. Eğitim ve sınama doküman veri seti spor ve eğitim temalarında olup, toplam 14 alt kavram seçilmiştir. YSA’nın çıktısı tema ve alt-kavram bilgilerini vermektedir. 70 adet sınama dokümanı ile farklı sayıda (5, 10, 20) anlamlı kelime seçilerek deneyler yapılmış, başarı oranının konularda yaklaşık olarak %95, alt kavramlarda ise %80 olduğu gözlemlenmiştir.

Keywords

References

  1. [1] Y. H. Li A. K. Jain, “Classification of Text Documents,” The Computer Journal,” c. 41, s. 8, ss. 537–546, 1998.
  2. [2] Yu, E.S. ve E.D Liddy, “Feature selection in text categorization using the Baldwin effect,” IJCNN '99. International Joint Conference on Neural Networks, Washington, ABD, 1999
  3. [3] Bekkerman R., Ran El-Yaniv, Naftali T., Yoad W., “Distributional Word Clusters vs. Words for Text Categorization ,” Journal of Machine Learning Research, ss. 1-48, 2002.
  4. [4] Song, F., Liu, S., Yang, J., “A comparative study on text representation schemes in text categorization,” Pattern Analysis and Applications, c.8, s.1-2, 199-209, 2005
  5. [5] Amasyalı M.F, Diri, B., “Automatic Turkish Text Categorization in Terms of Author, Genre and Gender,” 11th International Caonferance on Applications of Natural Language to Information Systems-NLDB2006, ss.221-226, 2006
  6. [6] Türkoğlu, F., Diri, B., Amasyalı, M. F., “Author Attribution of Turkish Texts by Feature Mining,” International Conference on Intelligent Computing, Qingdao, Çin, ss. 1086-1093, 2007.
  7. [7] Çiltik, A. ve Güngör, T., “Time-Efficient Spam E-mail Filtering Using N-gram Models,” Pattern Recognition Letters, c. 29,s. 1, ss.19-33, 2008.
  8. [8] Helen Balinsky, Alexander Balinsky, Steven Simske, “Document sentences as a small world,” 2011 IEEE International Conference on Systems, Man, and Cybernetics (SMC), Anchorage, ABD, 2011

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

August 1, 2018

Submission Date

May 1, 2018

Acceptance Date

July 4, 2018

Published in Issue

Year 2018 Volume: 6 Number: 4

APA
Turan, M., & Ögtelik, S. (2018). İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Duzce University Journal of Science and Technology, 6(4), 754-764. https://doi.org/10.29130/dubited.420104
AMA
1.Turan M, Ögtelik S. İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. DUBİTED. 2018;6(4):754-764. doi:10.29130/dubited.420104
Chicago
Turan, Metin, and Sena Ögtelik. 2018. “İngilizce Dokümanlarda Tema Ve Alt Kavramlar Tespit Modeli”. Duzce University Journal of Science and Technology 6 (4): 754-64. https://doi.org/10.29130/dubited.420104.
EndNote
Turan M, Ögtelik S (August 1, 2018) İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Duzce University Journal of Science and Technology 6 4 754–764.
IEEE
[1]M. Turan and S. Ögtelik, “İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli”, DUBİTED, vol. 6, no. 4, pp. 754–764, Aug. 2018, doi: 10.29130/dubited.420104.
ISNAD
Turan, Metin - Ögtelik, Sena. “İngilizce Dokümanlarda Tema Ve Alt Kavramlar Tespit Modeli”. Duzce University Journal of Science and Technology 6/4 (August 1, 2018): 754-764. https://doi.org/10.29130/dubited.420104.
JAMA
1.Turan M, Ögtelik S. İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. DUBİTED. 2018;6:754–764.
MLA
Turan, Metin, and Sena Ögtelik. “İngilizce Dokümanlarda Tema Ve Alt Kavramlar Tespit Modeli”. Duzce University Journal of Science and Technology, vol. 6, no. 4, Aug. 2018, pp. 754-6, doi:10.29130/dubited.420104.
Vancouver
1.Metin Turan, Sena Ögtelik. İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. DUBİTED. 2018 Aug. 1;6(4):754-6. doi:10.29130/dubited.420104