Araştırma Makalesi
BibTex RIS Kaynak Göster

Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı

Yıl 2018, Cilt: 11 Sayı: 2, 52 - 68, 15.11.2018

Öz

Varlık ismi tanıma; doğal dil işleme ve metin madenciliği alanlarının kapsamında yer alan bir bilgi çıkarımı görevidir. Kapsam ve kullanılan metotlar açısından, çalışmalar arasında farklılıklar görülse de temel olarak, bir metin içerisindeki kişi, yer, kurum-kuruluş vb. belirten ifadelerin doğru şekilde tespit edilmesini hedefler. Bu çalışmada, Türkçe yazılmış ders metinleri (tarih ve coğrafya alanlarında) için bir varlık ismi tanıma yapısı geliştirilmiştir. Tek başına ele aldığımızda bu yapı, bir bilgi çıkarımı görevi doğrultusunda özelleştirilmiş bir projedir. Bunun yanı sıra çalışmanın eğitimsel bir değeri de vardır; çünkü sistemden beklenen sonuç, verilen ders metninin içeriğinden anlamlı kelime ya da kelime grupları bulunmasıdır ki; bu da farklı dersler ya da ders konuları için terimler sözlüğü yapıları oluşturmak için kullanılabilir. Oluşturulan sözlüklerin, bir ders metninin içeriğindeki soru değeri taşıyabilecek ifadelerin tespitine ve sınav hazırlama sürecine yardımcı olması hedeflenmektedir. Bu makalede, varlık ismi tanıma görevi ve görevin kapsamı hakkında genel bilgi verilmiş; alanda yapılmış önceki çalışmalardan bahsedilmiş; bu çalışma doğrultusunda geliştirilen sistem tanıtılmış; sistemin başarısı, yapılan deney sonuçları üzerinden değerlendirilmiş ve geliştirme-iyileştirme olanakları hakkında yorumlar paylaşılmıştır.

Kaynakça

  • [1] Jurafsky, D., Martin, J.H. “Speech and language processing (2nd Edition)”. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. (2009)
  • [2] Grishman, A., Sundheim, B. “Message Understanding Conference-6: a brief history”. In Proceedings of the 16th conference on Computational linguistics - Volume 1 (COLING '96), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 466-471. (1996)
  • [3] Cucerzan, S., Yarowsky, D. “Language independent named entity recognition combining morphological and contextual evidence”. Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. New Brunswick, NJ: Association for Computational Linguistics. (1999)
  • [4] Alfonseca, E., Manandhar S. “An unsupervised method for general named entity recognition and automated concept discovery”. In 1st International Conference on General WordNet. (2002)
  • [5] Tür, G., Hakkani-Tür G., Oflazer K. “A statistical information extraction system for Turkish”. Natural Language Engineering, vol. 9 (2), pp. 181-210 (2003)
  • [6] Sang, E., Meulder F. “Introduction to the CoNLL-2003 shared task: language-independent named entity recognition”. In Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003 - Volume 4 (CONLL '03), Vol. 4. Association for Computational Linguistics, Stroudsburg, PA, USA, 142-147 (2003)
  • [7] Wentland, W., Knopp, J., Silberer, C., Hartung, M. “Building a multilingual lexical resource for named entity disambiguation, translation and transliteration”. in Proceedings of the 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco. (2008)
  • [8] Küçük, D., Yazıcı, A. “Rule-based named entity recognition from Turkish texts”. In Proceedings of the International Symposium on Innovations in Intelligent Systems and Applications, Trabzon, Turkey. pages 456–460. (2009)
  • [9] Küçük, D., Yazıcı, A. “Named entity recognition experiments on Turkish texts”. In Proceedings of the 8th International Conference on Flexible Query Answering Systems, FQAS ’09, pages 524–535, Berlin, Heidelberg. Springer-Verlag. (2009)
  • [10] Tatar, S., Çiçekli, İ. “Automatic rule learning exploiting morphological features for named entity recognition in Turkish”. Journal of Information Science, 37 (2), 137-151. (2011)
  • [11] Küçük, D., Yazıcı, A. “A hybrid named entity recognizer for Turkish with applications to different text genres”. In: Gelenbe E., Lent R., Sakellari G., Sacan A., Toroslu H., Yazici A. (eds) Computer and Information Sciences. Lecture Notes in Electrical Engineering, vol 62. Springer, Dordrecht. (2012)
  • [12] Şeker, G. A., Eryiğit, G. “Initial explorations on using CRFs for Turkish named entity recognition”. In Proceedings of COLING 2012, Mumbai, India. (2012)
  • [13] Küçük, D., Jacquet, G., Steinberger, R. “Named entity recognition on Turkish tweets”. In: Language Resources and Evaluation Conference. (2014)
  • [14] Küçük, D., Küçük, D., Arıcı, N. “A named entity recognition dataset for Turkish”. In: 24th Signal Processing and Communications Applications Conference (SIU), Zonguldak, Turkey. (2016)
  • [15] Şeker, G., Eryiğit, G. “State of the art in Turkish named entity recognition”. https://pdfs.semanticscholar.org/7e7f/ed9d21a3e3a36c4eb3c7df1ee8116e8ec2ce.pdf (2016)
  • [16] Ertopçu, B., Kanburoğlu, A., Topsakal, O., Açıkgöz, O., Gürkan, A., Özenç, B., Çam, İ., Avar, B., Ercan, G., Yıldız, O. “A new approach for named entity recognition”. In: International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey. (2017)
  • [17] H. B. Şahin, C. Tirkaz, E. Yildiz, M. T. Eren, and O. Sonmez, “Automatically annotated turkish corpus for named entity recognition and text categorization using large-scale gazetteers”. arXiv preprint arXiv:1702.02363, (2017)
  • [18] Güneş, A., Tantuğ, A. C., “Turkish named entity recognition with deep learning”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404500(2018)
  • [19] Güngor, O., Üsküdarlı, S., Güngor, T., “Recurrent neural networks for Turkish named entity recognition”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404788(2018)
Yıl 2018, Cilt: 11 Sayı: 2, 52 - 68, 15.11.2018

Öz

Kaynakça

  • [1] Jurafsky, D., Martin, J.H. “Speech and language processing (2nd Edition)”. Prentice-Hall, Inc., Upper Saddle River, NJ, USA. (2009)
  • [2] Grishman, A., Sundheim, B. “Message Understanding Conference-6: a brief history”. In Proceedings of the 16th conference on Computational linguistics - Volume 1 (COLING '96), Vol. 1. Association for Computational Linguistics, Stroudsburg, PA, USA, 466-471. (1996)
  • [3] Cucerzan, S., Yarowsky, D. “Language independent named entity recognition combining morphological and contextual evidence”. Proceedings of the Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. New Brunswick, NJ: Association for Computational Linguistics. (1999)
  • [4] Alfonseca, E., Manandhar S. “An unsupervised method for general named entity recognition and automated concept discovery”. In 1st International Conference on General WordNet. (2002)
  • [5] Tür, G., Hakkani-Tür G., Oflazer K. “A statistical information extraction system for Turkish”. Natural Language Engineering, vol. 9 (2), pp. 181-210 (2003)
  • [6] Sang, E., Meulder F. “Introduction to the CoNLL-2003 shared task: language-independent named entity recognition”. In Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003 - Volume 4 (CONLL '03), Vol. 4. Association for Computational Linguistics, Stroudsburg, PA, USA, 142-147 (2003)
  • [7] Wentland, W., Knopp, J., Silberer, C., Hartung, M. “Building a multilingual lexical resource for named entity disambiguation, translation and transliteration”. in Proceedings of the 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco. (2008)
  • [8] Küçük, D., Yazıcı, A. “Rule-based named entity recognition from Turkish texts”. In Proceedings of the International Symposium on Innovations in Intelligent Systems and Applications, Trabzon, Turkey. pages 456–460. (2009)
  • [9] Küçük, D., Yazıcı, A. “Named entity recognition experiments on Turkish texts”. In Proceedings of the 8th International Conference on Flexible Query Answering Systems, FQAS ’09, pages 524–535, Berlin, Heidelberg. Springer-Verlag. (2009)
  • [10] Tatar, S., Çiçekli, İ. “Automatic rule learning exploiting morphological features for named entity recognition in Turkish”. Journal of Information Science, 37 (2), 137-151. (2011)
  • [11] Küçük, D., Yazıcı, A. “A hybrid named entity recognizer for Turkish with applications to different text genres”. In: Gelenbe E., Lent R., Sakellari G., Sacan A., Toroslu H., Yazici A. (eds) Computer and Information Sciences. Lecture Notes in Electrical Engineering, vol 62. Springer, Dordrecht. (2012)
  • [12] Şeker, G. A., Eryiğit, G. “Initial explorations on using CRFs for Turkish named entity recognition”. In Proceedings of COLING 2012, Mumbai, India. (2012)
  • [13] Küçük, D., Jacquet, G., Steinberger, R. “Named entity recognition on Turkish tweets”. In: Language Resources and Evaluation Conference. (2014)
  • [14] Küçük, D., Küçük, D., Arıcı, N. “A named entity recognition dataset for Turkish”. In: 24th Signal Processing and Communications Applications Conference (SIU), Zonguldak, Turkey. (2016)
  • [15] Şeker, G., Eryiğit, G. “State of the art in Turkish named entity recognition”. https://pdfs.semanticscholar.org/7e7f/ed9d21a3e3a36c4eb3c7df1ee8116e8ec2ce.pdf (2016)
  • [16] Ertopçu, B., Kanburoğlu, A., Topsakal, O., Açıkgöz, O., Gürkan, A., Özenç, B., Çam, İ., Avar, B., Ercan, G., Yıldız, O. “A new approach for named entity recognition”. In: International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey. (2017)
  • [17] H. B. Şahin, C. Tirkaz, E. Yildiz, M. T. Eren, and O. Sonmez, “Automatically annotated turkish corpus for named entity recognition and text categorization using large-scale gazetteers”. arXiv preprint arXiv:1702.02363, (2017)
  • [18] Güneş, A., Tantuğ, A. C., “Turkish named entity recognition with deep learning”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404500(2018)
  • [19] Güngor, O., Üsküdarlı, S., Güngor, T., “Recurrent neural networks for Turkish named entity recognition”. 26th Signal Processing and Communications Applications Conference (SIU). doi:10.1109/siu.2018.8404788(2018)
Toplam 19 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Makaleler(Araştırma)
Yazarlar

Önder Can Sarı 0000-0003-4226-9633

Özlem Aktaş 0000-0001-6415-0698

Yayımlanma Tarihi 15 Kasım 2018
Yayımlandığı Sayı Yıl 2018 Cilt: 11 Sayı: 2

Kaynak Göster

APA Sarı, Ö. C., & Aktaş, Ö. (2018). Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 11(2), 52-68.
AMA Sarı ÖC, Aktaş Ö. Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. TBV-BBMD. Kasım 2018;11(2):52-68.
Chicago Sarı, Önder Can, ve Özlem Aktaş. “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi 11, sy. 2 (Kasım 2018): 52-68.
EndNote Sarı ÖC, Aktaş Ö (01 Kasım 2018) Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 11 2 52–68.
IEEE Ö. C. Sarı ve Ö. Aktaş, “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”, TBV-BBMD, c. 11, sy. 2, ss. 52–68, 2018.
ISNAD Sarı, Önder Can - Aktaş, Özlem. “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 11/2 (Kasım 2018), 52-68.
JAMA Sarı ÖC, Aktaş Ö. Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. TBV-BBMD. 2018;11:52–68.
MLA Sarı, Önder Can ve Özlem Aktaş. “Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, c. 11, sy. 2, 2018, ss. 52-68.
Vancouver Sarı ÖC, Aktaş Ö. Türkçe Ders Metinleri İçin Özelleştirilmiş Bir Varlık İsmi Tanıma Yapısı. TBV-BBMD. 2018;11(2):52-68.

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.