TY - JOUR T1 - A NAMED ENTITY RECOGNITION MODEL FOR TURKISH LECTURE NOTES IN HISTORY AND GEOGRAPHY DOMAINS TT - TARİH VE COĞRAFYA ALANINDAKİ TÜRKÇE DERS METİNLERİ İÇİN BİR VARLIK İSMİ TANIMA MODELİ AU - Sarı, Önder Can AU - Aktaş, Özlem PY - 2019 DA - September Y2 - 2019 DO - 10.21923/jesd.448251 JF - Mühendislik Bilimleri ve Tasarım Dergisi JO - MBTD PB - Süleyman Demirel Üniversitesi WT - DergiPark SN - 1308-6693 SP - 539 EP - 551 VL - 7 IS - 3 LA - en AB - Named entity recognition(NER) is an information extraction (IE) task that is in the scope of naturallanguage processing (NLP) and text mining. Its extent and methods may differbetween studies, but basically, it aims to detect expressions that indicates aperson, location, organization etc. In this study, a NER structure is developedfor Turkish lecture notes (for history and geography courses). Separately, thisstructure is a project that is specialized for an information extraction task.Besides, it also has an educational value, as the projected outcome from itsexecution is meaningful words or word groups from the content of input lecturenotes, which can be used to construct glossary of terms structures forindividual courses or course subjects. With these glossary of terms structures,it is aimed to detect expressions in the content of a lecture note that can beused for questions and support a test preparation process. In this document,general information about NER task and its scope is given; previous studies onthe field are mentioned; the system developed in line with this study isintroduced; success of the system is evaluated through experiment results andsome thoughts for enhancement are shared. KW - Computational linguistics KW - Named entity recognition KW - Natural language processing KW - Information extraction KW - Educational technology N2 - Varlıkismi tanıma; doğal dil işleme ve metin madenciliği alanlarının kapsamında yeralan bir bilgi çıkarımı görevidir. Kapsam ve kullanılan metotlar açısından,çalışmalar arasında farklılıklar görülse de temel olarak, bir metiniçerisindeki kişi, yer, kurum-kuruluş vb. belirten ifadelerin doğru şekildetespit edilmesini hedefler. Bu çalışmada, Türkçe yazılmış ders metinleri (tarihve coğrafya alanlarında) için bir varlık ismi tanıma yapısı geliştirilmiştir.Tek başına ele aldığımızda bu yapı, bir bilgi çıkarımı görevi doğrultusundaözelleştirilmiş bir projedir. Bunun yanı sıra çalışmanın eğitimsel bir değeride vardır; çünkü sistemden beklenen sonuç, verilen ders metninin içeriğindenanlamlı kelime ya da kelime grupları bulunmasıdır ki; bu da farklı dersler yada ders konuları için terimler sözlüğü yapıları oluşturmak için kullanılabilir.Oluşturulan sözlüklerin, bir ders metninin içeriğindeki soru değeritaşıyabilecek ifadelerin tespitine ve sınav hazırlama sürecine yardımcı olmasıhedeflenmektedir. Bu dokümanda, varlık ismi tanıma görevi ve görevin kapsamıhakkında genel bilgi verilmiş; alanda yapılmış önceki çalışmalardanbahsedilmiş; bu çalışma doğrultusunda geliştirilen sistem tanıtılmış; sisteminbaşarısı, yapılan deney sonuçları üzerinden değerlendirilmiş vegeliştirme-iyileştirme olanakları hakkında yorumlar paylaşılmıştır. CR - Alfonseca, E., Manandhar S. (2002). “An unsupervised method for general named entity recognition and automated concept discovery”. In 1st International Conference on General WordNet. CR - Cucerzan, S., Yarowsky, D. (1999). “Language independent named entity recognition combining morphological and contextual evidence”. Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. New Brunswick, NJ: Association for Computational Linguistics. CR - Ertopçu, B., Kanburoğlu, A., Topsakal, O., Açıkgöz, O., Gürkan, A., Özenç, B., Çam, İ., Avar, B., Ercan, G., Yıldız, O. (2017). “A new approach for named entity recognition”. In: International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey, 2017. CR - Grishman, A., Sundheim, B. (1996). “Message Understanding Conference-6: a brief history”. In Proceedings of the 16th conference on Computational linguistics - Volume 1 (COLING '96), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 466-471. CR - Jurafsky, D., Martin, J.H. (2009). “Speech and language processing (2nd Edition)”. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. CR - Küçük, D., Jacquet, G., Steinberger, R. (2014). “Named entity recognition on Turkish tweets”. In: Language Resources and Evaluation Conference, 2014. CR - Küçük, D., Küçük, D., Arıcı, N. (2016). “A named entity recognition dataset for Turkish”. In: 24th Signal Processing and Communications Applications Conference (SIU), Zonguldak, Turkey, 2016. CR - Küçük, D., Yazıcı, A. (2009). “Named entity recognition experiments on Turkish texts”. In Proceedings of the 8th International Conference on Flexible Query Answering Systems, FQAS ’09, pages 524–535, Berlin, Heidelberg. Springer-Verlag. CR - Küçük, D., Yazıcı, A. (2009). “Rule-based named entity recognition from Turkish texts”. In Proceedings of the International Symposium on Innovations in Intelligent Systems and Applications, Trabzon, Turkey. pages 456–460. CR - Küçük, D., Yazıcı, A. (2012). “A hybrid named entity recognizer for Turkish with applications to different text genres”. In: Gelenbe E., Lent R., Sakellari G., Sacan A., Toroslu H., Yazici A. (eds) Computer and Information Sciences. Lecture Notes in Electrical Engineering, vol 62. Springer, Dordrecht. CR - Sang, E., Meulder F. (2003). “Introduction to the CoNLL-2003 shared task: language-independent named entity recognition”. In Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003 - Volume 4 (CONLL '03), Vol. 4. Association for Computational Linguistics, Stroudsburg, PA, USA, 142-147 CR - Şeker, G. A., Eryiğit, G. (2012). “Initial explorations on using CRFs for Turkish named entity recognition”. In Proceedings of COLING 2012, Mumbai, India, 8-15 December. CR - Şeker, G., Eryiğit, G. (2016). “State of the art in Turkish named entity recognition”. May 2018. Retrieved from https://pdfs.semanticscholar.org/7e7f/ed9d21a3e3a36c4eb3c7df1ee8116e8ec2ce.pdf CR - Tatar, S., Çiçekli, İ. (2011). “Automatic rule learning exploiting morphological features for named entity recognition in Turkish”. Journal of Information Science, 37 (2), April 2011, 137-151. CR - Tür, G., Hakkani-Tür G., Oflazer K. (2003). “A statistical information extraction system for Turkish”. Natural Language Engineering, vol. 9 (2), pp. 181-210. CR - Wentland, W., Knopp, J., Silberer, C., Hartung, M. (2008). “Building a multilingual lexical resource for named entity disambiguation, translation and transliteration”. in Proceedings of the 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco, 26 May–1 June 2008. UR - https://doi.org/10.21923/jesd.448251 L1 - https://dergipark.org.tr/tr/download/article-file/805886 ER -