Research Article
BibTex RIS Cite

Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı

Year 2018, Volume: 11 Issue: 2, 52 - 68, 15.11.2018

Abstract

Varlık ismi tanıma; doğal dil işleme ve metin madenciliği alanlarının kapsamında yer alan bir bilgi çıkarımı görevidir. Kapsam ve kullanılan metotlar açısından, çalışmalar arasında farklılıklar görülse de temel olarak, bir metin içerisindeki kişi, yer, kurum-kuruluş vb. belirten ifadelerin doğru şekilde tespit edilmesini hedefler. Bu çalışmada, Türkçe yazılmış ders metinleri (tarih ve coğrafya alanlarında) için bir varlık ismi tanıma yapısı geliştirilmiştir. Tek başına ele aldığımızda bu yapı, bir bilgi çıkarımı görevi doğrultusunda özelleştirilmiş bir projedir. Bunun yanı sıra çalışmanın eğitimsel bir değeri de vardır; çünkü sistemden beklenen sonuç, verilen ders metninin içeriğinden anlamlı kelime ya da kelime grupları bulunmasıdır ki; bu da farklı dersler ya da ders konuları için terimler sözlüğü yapıları oluşturmak için kullanılabilir. Oluşturulan sözlüklerin, bir ders metninin içeriğindeki soru değeri taşıyabilecek ifadelerin tespitine ve sınav hazırlama sürecine yardımcı olması hedeflenmektedir. Bu makalede, varlık ismi tanıma görevi ve görevin kapsamı hakkında genel bilgi verilmiş; alanda yapılmış önceki çalışmalardan bahsedilmiş; bu çalışma doğrultusunda geliştirilen sistem tanıtılmış; sistemin başarısı, yapılan deney sonuçları üzerinden değerlendirilmiş ve geliştirme-iyileştirme olanakları hakkında yorumlar paylaşılmıştır.

References

  • [1] Jurafsky, D., Martin, J.H. “Speech and language processing (2nd Edition)”. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. (2009)
  • [2] Grishman, A., Sundheim, B. “Message Understanding Conference-6: a brief history”. In Proceedings of the 16th conference on Computational linguistics - Volume 1 (COLING '96), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 466-471. (1996)
  • [3] Cucerzan, S., Yarowsky, D. “Language independent named entity recognition combining morphological and contextual evidence”. Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. New Brunswick, NJ: Association for Computational Linguistics. (1999)
  • [4] Alfonseca, E., Manandhar S. “An unsupervised method for general named entity recognition and automated concept discovery”. In 1st International Conference on General WordNet. (2002)
  • [5] Tür, G., Hakkani-Tür G., Oflazer K. “A statistical information extraction system for Turkish”. Natural Language Engineering, vol. 9 (2), pp. 181-210 (2003)
  • [6] Sang, E., Meulder F. “Introduction to the CoNLL-2003 shared task: language-independent named entity recognition”. In Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003 - Volume 4 (CONLL '03), Vol. 4. Association for Computational Linguistics, Stroudsburg, PA, USA, 142-147 (2003)
  • [7] Wentland, W., Knopp, J., Silberer, C., Hartung, M. “Building a multilingual lexical resource for named entity disambiguation, translation and transliteration”. in Proceedings of the 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco. (2008)
  • [8] Küçük, D., Yazıcı, A. “Rule-based named entity recognition from Turkish texts”. In Proceedings of the International Symposium on Innovations in Intelligent Systems and Applications, Trabzon, Turkey. pages 456–460. (2009)
  • [9] Küçük, D., Yazıcı, A. “Named entity recognition experiments on Turkish texts”. In Proceedings of the 8th International Conference on Flexible Query Answering Systems, FQAS ’09, pages 524–535, Berlin, Heidelberg. Springer-Verlag. (2009)
  • [10] Tatar, S., Çiçekli, İ. “Automatic rule learning exploiting morphological features for named entity recognition in Turkish”. Journal of Information Science, 37 (2), 137-151. (2011)
  • [11] Küçük, D., Yazıcı, A. “A hybrid named entity recognizer for Turkish with applications to different text genres”. In: Gelenbe E., Lent R., Sakellari G., Sacan A., Toroslu H., Yazici A. (eds) Computer and Information Sciences. Lecture Notes in Electrical Engineering, vol 62. Springer, Dordrecht. (2012)
  • [12] Şeker, G. A., Eryiğit, G. “Initial explorations on using CRFs for Turkish named entity recognition”. In Proceedings of COLING 2012, Mumbai, India. (2012)
  • [13] Küçük, D., Jacquet, G., Steinberger, R. “Named entity recognition on Turkish tweets”. In: Language Resources and Evaluation Conference. (2014)
  • [14] Küçük, D., Küçük, D., Arıcı, N. “A named entity recognition dataset for Turkish”. In: 24th Signal Processing and Communications Applications Conference (SIU), Zonguldak, Turkey. (2016)
  • [15] Şeker, G., Eryiğit, G. “State of the art in Turkish named entity recognition”. https://pdfs.semanticscholar.org/7e7f/ed9d21a3e3a36c4eb3c7df1ee8116e8ec2ce.pdf (2016)
  • [16] Ertopçu, B., Kanburoğlu, A., Topsakal, O., Açıkgöz, O., Gürkan, A., Özenç, B., Çam, İ., Avar, B., Ercan, G., Yıldız, O. “A new approach for named entity recognition”. In: International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey. (2017)
  • [17] H. B. Şahin, C. Tirkaz, E. Yildiz, M. T. Eren, and O. Sonmez, “Automatically annotated turkish corpus for named entity recognition and text categorization using large-scale gazetteers”. arXiv preprint arXiv:1702.02363, (2017)
  • [18] Güneş, A., Tantuğ, A. C., “Turkish named entity recognition with deep learning”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404500(2018)
  • [19] Güngor, O., Üsküdarlı, S., Güngor, T., “Recurrent neural networks for Turkish named entity recognition”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404788(2018)
Year 2018, Volume: 11 Issue: 2, 52 - 68, 15.11.2018

Abstract

References

  • [1] Jurafsky, D., Martin, J.H. “Speech and language processing (2nd Edition)”. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. (2009)
  • [2] Grishman, A., Sundheim, B. “Message Understanding Conference-6: a brief history”. In Proceedings of the 16th conference on Computational linguistics - Volume 1 (COLING '96), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 466-471. (1996)
  • [3] Cucerzan, S., Yarowsky, D. “Language independent named entity recognition combining morphological and contextual evidence”. Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. New Brunswick, NJ: Association for Computational Linguistics. (1999)
  • [4] Alfonseca, E., Manandhar S. “An unsupervised method for general named entity recognition and automated concept discovery”. In 1st International Conference on General WordNet. (2002)
  • [5] Tür, G., Hakkani-Tür G., Oflazer K. “A statistical information extraction system for Turkish”. Natural Language Engineering, vol. 9 (2), pp. 181-210 (2003)
  • [6] Sang, E., Meulder F. “Introduction to the CoNLL-2003 shared task: language-independent named entity recognition”. In Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003 - Volume 4 (CONLL '03), Vol. 4. Association for Computational Linguistics, Stroudsburg, PA, USA, 142-147 (2003)
  • [7] Wentland, W., Knopp, J., Silberer, C., Hartung, M. “Building a multilingual lexical resource for named entity disambiguation, translation and transliteration”. in Proceedings of the 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco. (2008)
  • [8] Küçük, D., Yazıcı, A. “Rule-based named entity recognition from Turkish texts”. In Proceedings of the International Symposium on Innovations in Intelligent Systems and Applications, Trabzon, Turkey. pages 456–460. (2009)
  • [9] Küçük, D., Yazıcı, A. “Named entity recognition experiments on Turkish texts”. In Proceedings of the 8th International Conference on Flexible Query Answering Systems, FQAS ’09, pages 524–535, Berlin, Heidelberg. Springer-Verlag. (2009)
  • [10] Tatar, S., Çiçekli, İ. “Automatic rule learning exploiting morphological features for named entity recognition in Turkish”. Journal of Information Science, 37 (2), 137-151. (2011)
  • [11] Küçük, D., Yazıcı, A. “A hybrid named entity recognizer for Turkish with applications to different text genres”. In: Gelenbe E., Lent R., Sakellari G., Sacan A., Toroslu H., Yazici A. (eds) Computer and Information Sciences. Lecture Notes in Electrical Engineering, vol 62. Springer, Dordrecht. (2012)
  • [12] Şeker, G. A., Eryiğit, G. “Initial explorations on using CRFs for Turkish named entity recognition”. In Proceedings of COLING 2012, Mumbai, India. (2012)
  • [13] Küçük, D., Jacquet, G., Steinberger, R. “Named entity recognition on Turkish tweets”. In: Language Resources and Evaluation Conference. (2014)
  • [14] Küçük, D., Küçük, D., Arıcı, N. “A named entity recognition dataset for Turkish”. In: 24th Signal Processing and Communications Applications Conference (SIU), Zonguldak, Turkey. (2016)
  • [15] Şeker, G., Eryiğit, G. “State of the art in Turkish named entity recognition”. https://pdfs.semanticscholar.org/7e7f/ed9d21a3e3a36c4eb3c7df1ee8116e8ec2ce.pdf (2016)
  • [16] Ertopçu, B., Kanburoğlu, A., Topsakal, O., Açıkgöz, O., Gürkan, A., Özenç, B., Çam, İ., Avar, B., Ercan, G., Yıldız, O. “A new approach for named entity recognition”. In: International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey. (2017)
  • [17] H. B. Şahin, C. Tirkaz, E. Yildiz, M. T. Eren, and O. Sonmez, “Automatically annotated turkish corpus for named entity recognition and text categorization using large-scale gazetteers”. arXiv preprint arXiv:1702.02363, (2017)
  • [18] Güneş, A., Tantuğ, A. C., “Turkish named entity recognition with deep learning”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404500(2018)
  • [19] Güngor, O., Üsküdarlı, S., Güngor, T., “Recurrent neural networks for Turkish named entity recognition”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404788(2018)
There are 19 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Makaleler(Araştırma)
Authors

Önder Can Sarı 0000-0003-4226-9633

Özlem Aktaş 0000-0001-6415-0698

Publication Date November 15, 2018
Published in Issue Year 2018 Volume: 11 Issue: 2

Cite

APA Sarı, Ö. C., & Aktaş, Ö. (2018). Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 11(2), 52-68.
AMA Sarı ÖC, Aktaş Ö. Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. TBV-BBMD. November 2018;11(2):52-68.
Chicago Sarı, Önder Can, and Özlem Aktaş. “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi 11, no. 2 (November 2018): 52-68.
EndNote Sarı ÖC, Aktaş Ö (November 1, 2018) Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 11 2 52–68.
IEEE Ö. C. Sarı and Ö. Aktaş, “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”, TBV-BBMD, vol. 11, no. 2, pp. 52–68, 2018.
ISNAD Sarı, Önder Can - Aktaş, Özlem. “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 11/2 (November 2018), 52-68.
JAMA Sarı ÖC, Aktaş Ö. Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. TBV-BBMD. 2018;11:52–68.
MLA Sarı, Önder Can and Özlem Aktaş. “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, vol. 11, no. 2, 2018, pp. 52-68.
Vancouver Sarı ÖC, Aktaş Ö. Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. TBV-BBMD. 2018;11(2):52-68.

Article Acceptance

Use user registration/login to upload articles online.

The acceptance process of the articles sent to the journal consists of the following stages:

1. Each submitted article is sent to at least two referees at the first stage.

2. Referee appointments are made by the journal editors. There are approximately 200 referees in the referee pool of the journal and these referees are classified according to their areas of interest. Each referee is sent an article on the subject he is interested in. The selection of the arbitrator is done in a way that does not cause any conflict of interest.

3. In the articles sent to the referees, the names of the authors are closed.

4. Referees are explained how to evaluate an article and are asked to fill in the evaluation form shown below.

5. The articles in which two referees give positive opinion are subjected to similarity review by the editors. The similarity in the articles is expected to be less than 25%.

6. A paper that has passed all stages is reviewed by the editor in terms of language and presentation, and necessary corrections and improvements are made. If necessary, the authors are notified of the situation.

0

.   This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.