Research Article
BibTex RIS Cite

A MORPHEME BASED CONSTITUENCY GRAMMAR APPROACH FOR TURKISH

Year 2024, Volume: 12 Issue: 2, 172 - 197, 26.12.2024
https://doi.org/10.14514/beykozad.1508348

Abstract

Language modelling is an important foundation in linguistic studies. Although different modelling methods can be ported for different languages, these ports may not always be sufficient. Morphologically rich languages are affected the most by this issue. During the model construction, it is required to focus on the unique features of the language as well as the universally common feature. In this article, we presented a constituency grammar considering Turkish, a morpheme-rich language. The grammar model that we detailed is based on traditional constituency grammar. However, our grammar method differs from the traditional constituency grammar in that it handles morphemes as syntactic elements, together with traditional syntactic elements, their effects on syntax, and the specific set of components. Unlike the traditional method, we started sentence analysis from morphological elements such as word stems, morphemes, and similar elements. Additionally, we propose a set of constituents which is constructed considering the syntactic and morphological features of Turkish. The set of components we proposed includes traditional syntactic constituents such as a sentence, noun phrase, verb phrase, adverb phrase, an intermediate structure we call a phrase stem, and constituents that represent morphemes or morpheme groups, such as plural suffix, case suffix, tense suffix.

References

  • Bozşahin, C. (2002). The combinatory morphemic lexicon. Computational Linguistics, 28(2) 145-186. https://doi.org/10.1162/089120102760173634
  • Carnie, A. (2012). Syntax: A Generative Introduction. Wiley-Blackwell.
  • Chomsky, N. (1956). Three models for the description of language. IRE Transactions on information theory, 2(3), 113-124. https://doi.org/10.1109/TIT.1956.1056813
  • Chomsky, N. (1957). Syntactic structures. Hague: Mouton.
  • Chomsky, N. (1995). The Minimalist Program. Cambridge: MIT Press.
  • Culicover, P. W., & Jackendoff, R. (2005). Simpler syntax. Oxford: Oxford University Press.
  • Çetinoğlu, Ö., & Oflazer, K. (2006). Altsözcüksel birimlerle Türkçe için sözcüksel işlevsel gramer geliştirilmesi. Turkish Symposium on Artificial Intelligence and Neural Networks, Akyaka, Muğla, Türkiye
  • Çetinoğlu, Ö., & Oflazer, K. (2018). Deep Parsing of Turkish with Lexical-Functional Grammar. In: Oflazer, K., & Saraçlar, M. (eds) Turkish Natural Language Processing (s. 175-206). Springer International Publishing. https://doi.org/10.1007/978-3-319-90165-7_9
  • De Marneffe, M.-C., & Nivre, J. (2019). Dependency grammar. Annual Review of Linguistics, 5(1), 197-218. https://doi.org/10.1146/annurev-linguistics-011718-011842
  • Dönmez, İ., & Adalı, E. (2018). Contex free grammer for Turkish. Journal of Natural and Applied Sciences, 22(2), 552-561.
  • Erguvanlı, E. E., & Erguvanlı Taylan, E. (1984). The Function of Word Order in Turkish Grammar. University of California Press.
  • Erkman-Akerson, F. (1994). Ad tümcesindeki yalın tümlecin yönetici ad olma koşulları. Dilbilim Araştırmaları Dergisi, 5, 62-79.
  • Eryiğit, G., Nivre, J., & Oflazer, K. (2008). Dependency parsing of Turkish. Computational Linguistics, 34(3), 259-307. https://doi.org/10.1162/coli.2008.07-017-R1-06-83
  • Göksel, A., & Kerslake, C. (2005). Turkish: A Comprehensive Grammar. New York: Routledge.
  • Hankamer, J. (2004). Why there are two -ki’s in Turkish. Eastern Mediterranean University.
  • Höfler, S. (2002). Link2tree: A dependency-constituency converter. Zürich: Lizentiatsarbeit, Institute of Computational Linguistics, University of Zürich.
  • Johansson, R., & Nugues, P. (2007). Extended constituent-to-dependency conversion for English. In J. Nivre, H.-J. Kalep, K. Muischnek, & M. Koit (Eds.), NODALIDA 2007 Proceedings (pp. 105-112). University of Tartu.
  • Jurafsky, D., & Martin, J. H. (2009). Speech and Language Processing . Boulder: Pearson Prentice Hall.
  • Karabulut, F. (2009). Ad Öbeği Taşınımı ve Boşluk Kuramı Bağlamında. Uluslararası Türk Dili ve Edebiyatı Kongresi (UTEK), 261-299.
  • Kiss, K. E. (2008). The Structure of the Hungarian VP revisited. Approaches to Hungarian, 31-58.
  • Koç, N. (1990). Yeni Dilbilgisi. İstanbul: İnkılâp Kitabevi.
  • Kornflit, J. (1996). On some infinitival wh-constructions in Turkish. Dilbilim Araştırmaları Dergisi, 7, 192-215.
  • Lombardo, V., & Lesmo, L. (1996). An Earley-type recognizer for dependency grammar. The 16th International Conference on Computational Linguistics (COLING 96), (pp. 723-728). San Francisco.
  • Malkoç, M. (2011). Direkt bileşenler analizi. Journal of Turkish Studies, 6(2), 645-656. http://dx.doi.org/10.7827/TurkishStudies.2204
  • MiniTreebank. (2024). Retrieved from github.com/MorphosyntacticConstituencyTreebank: https://github.com/MorphosyntacticConstituencyTreebank/MiniTreebank
  • Oflazer, K. (2016). Türkçe ve Doğal Dil İşleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2).
  • Solak, E. (2022). Türkçe ile Hesaplamalı Dil Bilimi. İstanbul: Beykoz Üniversitesi Yayınları.
  • Tesnière, L. (2015). Elements of structural syntax. John Benjamins Publishing Company.
  • The Leipzig Glossing Rules. (2015). Max Planck Institute Department of Linguistics: https://www.eva.mpg.de/lingua/resources/glossing-rules.php. adresinden alındı
  • Tuç, S. (2020). Neural dependency parsing for Turkish. Ankara: MSc, Haccettepe University.
  • Türk, U., Atmaca, F., Özateş, Ş. B., Berk, G., Bedir, S. T., Köksal, A., . . . Özgür, A. (2022). Resources for Turkish dependency parsing: Introducing the BOUN treebank and the BoAT annotation tool. Language Resources and Evaluation, 56(1), 259-307. https://doi.org/10.1007/s10579-021-09558-0
  • Underhill, R. (1985). Turkish grammar. Cambridge: MIT Press.
  • Uzun, N. E. (2000). Evrensel Dilbigisi ve Türkçe. İstanbul: Multilingual.
  • Yıldız, O. T., Solak, E., Çandır, Ş., Ehsani, R., & Görgün, O. (2016). Constructing a Turkish constituency parse treebank. Information Sciences and Systems 2015: 30th International Symposium on Computer and Information Sciences, (s. 339-347). https://doi.org/10.1007/978-3-319-22635-4_31

TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI

Year 2024, Volume: 12 Issue: 2, 172 - 197, 26.12.2024
https://doi.org/10.14514/beykozad.1508348

Abstract

Dilin modellenmesi, dil çalışmalarında önemli bir temel olarak yer alır. Farklı modelleme yöntemleri, farklı diller için uyarlanabilir olsa da bu uyarlamalar, hedef dil için her zaman yeterli olmayabilir. Bu durumdan en çok biçimbirimsel açıdan zengin diller etkilenir. Böyle bir dil için hazırlanacak model kurgulanırken dilin evrensel olarak ortak olan özelliklerinin yanı sıra, dilin kendine özgü özelliklerine odaklanılmalıdır. Bu makalede, bağımlı biçimbirim bakımından zengin bir görünüm sunan Türkçe ele alınarak uyarlanan gramer sunulmuştur. Çalışmada açıklanan gramer temelleri geleneksel üretici gramer yönteminden uyarlanmıştır. Bununla birlikte, sunulan gramer, biçimbirimleri söz dizimi elemanı olarak geleneksel söz dizimi elemanlarıyla birlikte, söz dizimine olan etkilerini ele almasıyla ve kullanılan özel bileşen kümesiyle geleneksel üretici gramer yöntemden ayrılır. Geleneksel yöntemden farklı olarak önerilen gramerde, tümce çözümlemesine sözcüklerden değil, biçimbirim elemanları olan sözcük gövdeleri, ekler, biçimbirimler ve bu gibi elemanların oluşturduğu gruplardan başlanır. Buna ek olarak Türkçenin söz dizimsel ve birimbirimsel özelliklerine göre kurgulanan bir bileşen kümesi de sunulmuştur. Sunulan bileşen kümesi, tümce, ad öbeği, eylem öbeği, belirteç öbeği gibi geleneksel sözdizimsel bileşenleri, öbek gövdesi olarak adlandırılan ara bir yapıyı ve çoğul eki, durum eki, zaman çekimi eki gibi, biçimbirimleri veya biçimbirim gruplarını temsil eden bileşenleri içerir.

References

  • Bozşahin, C. (2002). The combinatory morphemic lexicon. Computational Linguistics, 28(2) 145-186. https://doi.org/10.1162/089120102760173634
  • Carnie, A. (2012). Syntax: A Generative Introduction. Wiley-Blackwell.
  • Chomsky, N. (1956). Three models for the description of language. IRE Transactions on information theory, 2(3), 113-124. https://doi.org/10.1109/TIT.1956.1056813
  • Chomsky, N. (1957). Syntactic structures. Hague: Mouton.
  • Chomsky, N. (1995). The Minimalist Program. Cambridge: MIT Press.
  • Culicover, P. W., & Jackendoff, R. (2005). Simpler syntax. Oxford: Oxford University Press.
  • Çetinoğlu, Ö., & Oflazer, K. (2006). Altsözcüksel birimlerle Türkçe için sözcüksel işlevsel gramer geliştirilmesi. Turkish Symposium on Artificial Intelligence and Neural Networks, Akyaka, Muğla, Türkiye
  • Çetinoğlu, Ö., & Oflazer, K. (2018). Deep Parsing of Turkish with Lexical-Functional Grammar. In: Oflazer, K., & Saraçlar, M. (eds) Turkish Natural Language Processing (s. 175-206). Springer International Publishing. https://doi.org/10.1007/978-3-319-90165-7_9
  • De Marneffe, M.-C., & Nivre, J. (2019). Dependency grammar. Annual Review of Linguistics, 5(1), 197-218. https://doi.org/10.1146/annurev-linguistics-011718-011842
  • Dönmez, İ., & Adalı, E. (2018). Contex free grammer for Turkish. Journal of Natural and Applied Sciences, 22(2), 552-561.
  • Erguvanlı, E. E., & Erguvanlı Taylan, E. (1984). The Function of Word Order in Turkish Grammar. University of California Press.
  • Erkman-Akerson, F. (1994). Ad tümcesindeki yalın tümlecin yönetici ad olma koşulları. Dilbilim Araştırmaları Dergisi, 5, 62-79.
  • Eryiğit, G., Nivre, J., & Oflazer, K. (2008). Dependency parsing of Turkish. Computational Linguistics, 34(3), 259-307. https://doi.org/10.1162/coli.2008.07-017-R1-06-83
  • Göksel, A., & Kerslake, C. (2005). Turkish: A Comprehensive Grammar. New York: Routledge.
  • Hankamer, J. (2004). Why there are two -ki’s in Turkish. Eastern Mediterranean University.
  • Höfler, S. (2002). Link2tree: A dependency-constituency converter. Zürich: Lizentiatsarbeit, Institute of Computational Linguistics, University of Zürich.
  • Johansson, R., & Nugues, P. (2007). Extended constituent-to-dependency conversion for English. In J. Nivre, H.-J. Kalep, K. Muischnek, & M. Koit (Eds.), NODALIDA 2007 Proceedings (pp. 105-112). University of Tartu.
  • Jurafsky, D., & Martin, J. H. (2009). Speech and Language Processing . Boulder: Pearson Prentice Hall.
  • Karabulut, F. (2009). Ad Öbeği Taşınımı ve Boşluk Kuramı Bağlamında. Uluslararası Türk Dili ve Edebiyatı Kongresi (UTEK), 261-299.
  • Kiss, K. E. (2008). The Structure of the Hungarian VP revisited. Approaches to Hungarian, 31-58.
  • Koç, N. (1990). Yeni Dilbilgisi. İstanbul: İnkılâp Kitabevi.
  • Kornflit, J. (1996). On some infinitival wh-constructions in Turkish. Dilbilim Araştırmaları Dergisi, 7, 192-215.
  • Lombardo, V., & Lesmo, L. (1996). An Earley-type recognizer for dependency grammar. The 16th International Conference on Computational Linguistics (COLING 96), (pp. 723-728). San Francisco.
  • Malkoç, M. (2011). Direkt bileşenler analizi. Journal of Turkish Studies, 6(2), 645-656. http://dx.doi.org/10.7827/TurkishStudies.2204
  • MiniTreebank. (2024). Retrieved from github.com/MorphosyntacticConstituencyTreebank: https://github.com/MorphosyntacticConstituencyTreebank/MiniTreebank
  • Oflazer, K. (2016). Türkçe ve Doğal Dil İşleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2).
  • Solak, E. (2022). Türkçe ile Hesaplamalı Dil Bilimi. İstanbul: Beykoz Üniversitesi Yayınları.
  • Tesnière, L. (2015). Elements of structural syntax. John Benjamins Publishing Company.
  • The Leipzig Glossing Rules. (2015). Max Planck Institute Department of Linguistics: https://www.eva.mpg.de/lingua/resources/glossing-rules.php. adresinden alındı
  • Tuç, S. (2020). Neural dependency parsing for Turkish. Ankara: MSc, Haccettepe University.
  • Türk, U., Atmaca, F., Özateş, Ş. B., Berk, G., Bedir, S. T., Köksal, A., . . . Özgür, A. (2022). Resources for Turkish dependency parsing: Introducing the BOUN treebank and the BoAT annotation tool. Language Resources and Evaluation, 56(1), 259-307. https://doi.org/10.1007/s10579-021-09558-0
  • Underhill, R. (1985). Turkish grammar. Cambridge: MIT Press.
  • Uzun, N. E. (2000). Evrensel Dilbigisi ve Türkçe. İstanbul: Multilingual.
  • Yıldız, O. T., Solak, E., Çandır, Ş., Ehsani, R., & Görgün, O. (2016). Constructing a Turkish constituency parse treebank. Information Sciences and Systems 2015: 30th International Symposium on Computer and Information Sciences, (s. 339-347). https://doi.org/10.1007/978-3-319-22635-4_31
There are 34 citations in total.

Details

Primary Language Turkish
Subjects Natural Language Processing
Journal Section Research Article
Authors

Berke Özenç 0000-0003-2008-243X

Ercan Solak 0000-0002-8448-9987

Publication Date December 26, 2024
Submission Date July 1, 2024
Acceptance Date October 15, 2024
Published in Issue Year 2024 Volume: 12 Issue: 2

Cite

APA Özenç, B., & Solak, E. (2024). TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi, 12(2), 172-197. https://doi.org/10.14514/beykozad.1508348
AMA Özenç B, Solak E. TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi. December 2024;12(2):172-197. doi:10.14514/beykozad.1508348
Chicago Özenç, Berke, and Ercan Solak. “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”. Beykoz Akademi Dergisi 12, no. 2 (December 2024): 172-97. https://doi.org/10.14514/beykozad.1508348.
EndNote Özenç B, Solak E (December 1, 2024) TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi 12 2 172–197.
IEEE B. Özenç and E. Solak, “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”, Beykoz Akademi Dergisi, vol. 12, no. 2, pp. 172–197, 2024, doi: 10.14514/beykozad.1508348.
ISNAD Özenç, Berke - Solak, Ercan. “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”. Beykoz Akademi Dergisi 12/2 (December 2024), 172-197. https://doi.org/10.14514/beykozad.1508348.
JAMA Özenç B, Solak E. TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi. 2024;12:172–197.
MLA Özenç, Berke and Ercan Solak. “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”. Beykoz Akademi Dergisi, vol. 12, no. 2, 2024, pp. 172-97, doi:10.14514/beykozad.1508348.
Vancouver Özenç B, Solak E. TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi. 2024;12(2):172-97.