Araştırma Makalesi
BibTex RIS Kaynak Göster

A MORPHEME BASED CONSTITUENCY GRAMMAR APPROACH FOR TURKISH

Yıl 2024, Cilt: 12 Sayı: 2, 172 - 197, 26.12.2024
https://doi.org/10.14514/beykozad.1508348

Öz

Language modelling is an important foundation in linguistic studies. Although different modelling methods can be ported for different languages, these ports may not always be sufficient. Morphologically rich languages are affected the most by this issue. During the model construction, it is required to focus on the unique features of the language as well as the universally common feature. In this article, we presented a constituency grammar considering Turkish, a morpheme-rich language. The grammar model that we detailed is based on traditional constituency grammar. However, our grammar method differs from the traditional constituency grammar in that it handles morphemes as syntactic elements, together with traditional syntactic elements, their effects on syntax, and the specific set of components. Unlike the traditional method, we started sentence analysis from morphological elements such as word stems, morphemes, and similar elements. Additionally, we propose a set of constituents which is constructed considering the syntactic and morphological features of Turkish. The set of components we proposed includes traditional syntactic constituents such as a sentence, noun phrase, verb phrase, adverb phrase, an intermediate structure we call a phrase stem, and constituents that represent morphemes or morpheme groups, such as plural suffix, case suffix, tense suffix.

Kaynakça

  • Bozşahin, C. (2002). The combinatory morphemic lexicon. Computational Linguistics, 28(2) 145-186. https://doi.org/10.1162/089120102760173634
  • Carnie, A. (2012). Syntax: A Generative Introduction. Wiley-Blackwell.
  • Chomsky, N. (1956). Three models for the description of language. IRE Transactions on information theory, 2(3), 113-124. https://doi.org/10.1109/TIT.1956.1056813
  • Chomsky, N. (1957). Syntactic structures. Hague: Mouton.
  • Chomsky, N. (1995). The Minimalist Program. Cambridge: MIT Press.
  • Culicover, P. W., & Jackendoff, R. (2005). Simpler syntax. Oxford: Oxford University Press.
  • Çetinoğlu, Ö., & Oflazer, K. (2006). Altsözcüksel birimlerle Türkçe için sözcüksel işlevsel gramer geliştirilmesi. Turkish Symposium on Artificial Intelligence and Neural Networks, Akyaka, Muğla, Türkiye
  • Çetinoğlu, Ö., & Oflazer, K. (2018). Deep Parsing of Turkish with Lexical-Functional Grammar. In: Oflazer, K., & Saraçlar, M. (eds) Turkish Natural Language Processing (s. 175-206). Springer International Publishing. https://doi.org/10.1007/978-3-319-90165-7_9
  • De Marneffe, M.-C., & Nivre, J. (2019). Dependency grammar. Annual Review of Linguistics, 5(1), 197-218. https://doi.org/10.1146/annurev-linguistics-011718-011842
  • Dönmez, İ., & Adalı, E. (2018). Contex free grammer for Turkish. Journal of Natural and Applied Sciences, 22(2), 552-561.
  • Erguvanlı, E. E., & Erguvanlı Taylan, E. (1984). The Function of Word Order in Turkish Grammar. University of California Press.
  • Erkman-Akerson, F. (1994). Ad tümcesindeki yalın tümlecin yönetici ad olma koşulları. Dilbilim Araştırmaları Dergisi, 5, 62-79.
  • Eryiğit, G., Nivre, J., & Oflazer, K. (2008). Dependency parsing of Turkish. Computational Linguistics, 34(3), 259-307. https://doi.org/10.1162/coli.2008.07-017-R1-06-83
  • Göksel, A., & Kerslake, C. (2005). Turkish: A Comprehensive Grammar. New York: Routledge.
  • Hankamer, J. (2004). Why there are two -ki’s in Turkish. Eastern Mediterranean University.
  • Höfler, S. (2002). Link2tree: A dependency-constituency converter. Zürich: Lizentiatsarbeit, Institute of Computational Linguistics, University of Zürich.
  • Johansson, R., & Nugues, P. (2007). Extended constituent-to-dependency conversion for English. In J. Nivre, H.-J. Kalep, K. Muischnek, & M. Koit (Eds.), NODALIDA 2007 Proceedings (pp. 105-112). University of Tartu.
  • Jurafsky, D., & Martin, J. H. (2009). Speech and Language Processing . Boulder: Pearson Prentice Hall.
  • Karabulut, F. (2009). Ad Öbeği Taşınımı ve Boşluk Kuramı Bağlamında. Uluslararası Türk Dili ve Edebiyatı Kongresi (UTEK), 261-299.
  • Kiss, K. E. (2008). The Structure of the Hungarian VP revisited. Approaches to Hungarian, 31-58.
  • Koç, N. (1990). Yeni Dilbilgisi. İstanbul: İnkılâp Kitabevi.
  • Kornflit, J. (1996). On some infinitival wh-constructions in Turkish. Dilbilim Araştırmaları Dergisi, 7, 192-215.
  • Lombardo, V., & Lesmo, L. (1996). An Earley-type recognizer for dependency grammar. The 16th International Conference on Computational Linguistics (COLING 96), (pp. 723-728). San Francisco.
  • Malkoç, M. (2011). Direkt bileşenler analizi. Journal of Turkish Studies, 6(2), 645-656. http://dx.doi.org/10.7827/TurkishStudies.2204
  • MiniTreebank. (2024). Retrieved from github.com/MorphosyntacticConstituencyTreebank: https://github.com/MorphosyntacticConstituencyTreebank/MiniTreebank
  • Oflazer, K. (2016). Türkçe ve Doğal Dil İşleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2).
  • Solak, E. (2022). Türkçe ile Hesaplamalı Dil Bilimi. İstanbul: Beykoz Üniversitesi Yayınları.
  • Tesnière, L. (2015). Elements of structural syntax. John Benjamins Publishing Company.
  • The Leipzig Glossing Rules. (2015). Max Planck Institute Department of Linguistics: https://www.eva.mpg.de/lingua/resources/glossing-rules.php. adresinden alındı
  • Tuç, S. (2020). Neural dependency parsing for Turkish. Ankara: MSc, Haccettepe University.
  • Türk, U., Atmaca, F., Özateş, Ş. B., Berk, G., Bedir, S. T., Köksal, A., . . . Özgür, A. (2022). Resources for Turkish dependency parsing: Introducing the BOUN treebank and the BoAT annotation tool. Language Resources and Evaluation, 56(1), 259-307. https://doi.org/10.1007/s10579-021-09558-0
  • Underhill, R. (1985). Turkish grammar. Cambridge: MIT Press.
  • Uzun, N. E. (2000). Evrensel Dilbigisi ve Türkçe. İstanbul: Multilingual.
  • Yıldız, O. T., Solak, E., Çandır, Ş., Ehsani, R., & Görgün, O. (2016). Constructing a Turkish constituency parse treebank. Information Sciences and Systems 2015: 30th International Symposium on Computer and Information Sciences, (s. 339-347). https://doi.org/10.1007/978-3-319-22635-4_31

TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI

Yıl 2024, Cilt: 12 Sayı: 2, 172 - 197, 26.12.2024
https://doi.org/10.14514/beykozad.1508348

Öz

Dilin modellenmesi, dil çalışmalarında önemli bir temel olarak yer alır. Farklı modelleme yöntemleri, farklı diller için uyarlanabilir olsa da bu uyarlamalar, hedef dil için her zaman yeterli olmayabilir. Bu durumdan en çok biçimbirimsel açıdan zengin diller etkilenir. Böyle bir dil için hazırlanacak model kurgulanırken dilin evrensel olarak ortak olan özelliklerinin yanı sıra, dilin kendine özgü özelliklerine odaklanılmalıdır. Bu makalede, bağımlı biçimbirim bakımından zengin bir görünüm sunan Türkçe ele alınarak uyarlanan gramer sunulmuştur. Çalışmada açıklanan gramer temelleri geleneksel üretici gramer yönteminden uyarlanmıştır. Bununla birlikte, sunulan gramer, biçimbirimleri söz dizimi elemanı olarak geleneksel söz dizimi elemanlarıyla birlikte, söz dizimine olan etkilerini ele almasıyla ve kullanılan özel bileşen kümesiyle geleneksel üretici gramer yöntemden ayrılır. Geleneksel yöntemden farklı olarak önerilen gramerde, tümce çözümlemesine sözcüklerden değil, biçimbirim elemanları olan sözcük gövdeleri, ekler, biçimbirimler ve bu gibi elemanların oluşturduğu gruplardan başlanır. Buna ek olarak Türkçenin söz dizimsel ve birimbirimsel özelliklerine göre kurgulanan bir bileşen kümesi de sunulmuştur. Sunulan bileşen kümesi, tümce, ad öbeği, eylem öbeği, belirteç öbeği gibi geleneksel sözdizimsel bileşenleri, öbek gövdesi olarak adlandırılan ara bir yapıyı ve çoğul eki, durum eki, zaman çekimi eki gibi, biçimbirimleri veya biçimbirim gruplarını temsil eden bileşenleri içerir.

Kaynakça

  • Bozşahin, C. (2002). The combinatory morphemic lexicon. Computational Linguistics, 28(2) 145-186. https://doi.org/10.1162/089120102760173634
  • Carnie, A. (2012). Syntax: A Generative Introduction. Wiley-Blackwell.
  • Chomsky, N. (1956). Three models for the description of language. IRE Transactions on information theory, 2(3), 113-124. https://doi.org/10.1109/TIT.1956.1056813
  • Chomsky, N. (1957). Syntactic structures. Hague: Mouton.
  • Chomsky, N. (1995). The Minimalist Program. Cambridge: MIT Press.
  • Culicover, P. W., & Jackendoff, R. (2005). Simpler syntax. Oxford: Oxford University Press.
  • Çetinoğlu, Ö., & Oflazer, K. (2006). Altsözcüksel birimlerle Türkçe için sözcüksel işlevsel gramer geliştirilmesi. Turkish Symposium on Artificial Intelligence and Neural Networks, Akyaka, Muğla, Türkiye
  • Çetinoğlu, Ö., & Oflazer, K. (2018). Deep Parsing of Turkish with Lexical-Functional Grammar. In: Oflazer, K., & Saraçlar, M. (eds) Turkish Natural Language Processing (s. 175-206). Springer International Publishing. https://doi.org/10.1007/978-3-319-90165-7_9
  • De Marneffe, M.-C., & Nivre, J. (2019). Dependency grammar. Annual Review of Linguistics, 5(1), 197-218. https://doi.org/10.1146/annurev-linguistics-011718-011842
  • Dönmez, İ., & Adalı, E. (2018). Contex free grammer for Turkish. Journal of Natural and Applied Sciences, 22(2), 552-561.
  • Erguvanlı, E. E., & Erguvanlı Taylan, E. (1984). The Function of Word Order in Turkish Grammar. University of California Press.
  • Erkman-Akerson, F. (1994). Ad tümcesindeki yalın tümlecin yönetici ad olma koşulları. Dilbilim Araştırmaları Dergisi, 5, 62-79.
  • Eryiğit, G., Nivre, J., & Oflazer, K. (2008). Dependency parsing of Turkish. Computational Linguistics, 34(3), 259-307. https://doi.org/10.1162/coli.2008.07-017-R1-06-83
  • Göksel, A., & Kerslake, C. (2005). Turkish: A Comprehensive Grammar. New York: Routledge.
  • Hankamer, J. (2004). Why there are two -ki’s in Turkish. Eastern Mediterranean University.
  • Höfler, S. (2002). Link2tree: A dependency-constituency converter. Zürich: Lizentiatsarbeit, Institute of Computational Linguistics, University of Zürich.
  • Johansson, R., & Nugues, P. (2007). Extended constituent-to-dependency conversion for English. In J. Nivre, H.-J. Kalep, K. Muischnek, & M. Koit (Eds.), NODALIDA 2007 Proceedings (pp. 105-112). University of Tartu.
  • Jurafsky, D., & Martin, J. H. (2009). Speech and Language Processing . Boulder: Pearson Prentice Hall.
  • Karabulut, F. (2009). Ad Öbeği Taşınımı ve Boşluk Kuramı Bağlamında. Uluslararası Türk Dili ve Edebiyatı Kongresi (UTEK), 261-299.
  • Kiss, K. E. (2008). The Structure of the Hungarian VP revisited. Approaches to Hungarian, 31-58.
  • Koç, N. (1990). Yeni Dilbilgisi. İstanbul: İnkılâp Kitabevi.
  • Kornflit, J. (1996). On some infinitival wh-constructions in Turkish. Dilbilim Araştırmaları Dergisi, 7, 192-215.
  • Lombardo, V., & Lesmo, L. (1996). An Earley-type recognizer for dependency grammar. The 16th International Conference on Computational Linguistics (COLING 96), (pp. 723-728). San Francisco.
  • Malkoç, M. (2011). Direkt bileşenler analizi. Journal of Turkish Studies, 6(2), 645-656. http://dx.doi.org/10.7827/TurkishStudies.2204
  • MiniTreebank. (2024). Retrieved from github.com/MorphosyntacticConstituencyTreebank: https://github.com/MorphosyntacticConstituencyTreebank/MiniTreebank
  • Oflazer, K. (2016). Türkçe ve Doğal Dil İşleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2).
  • Solak, E. (2022). Türkçe ile Hesaplamalı Dil Bilimi. İstanbul: Beykoz Üniversitesi Yayınları.
  • Tesnière, L. (2015). Elements of structural syntax. John Benjamins Publishing Company.
  • The Leipzig Glossing Rules. (2015). Max Planck Institute Department of Linguistics: https://www.eva.mpg.de/lingua/resources/glossing-rules.php. adresinden alındı
  • Tuç, S. (2020). Neural dependency parsing for Turkish. Ankara: MSc, Haccettepe University.
  • Türk, U., Atmaca, F., Özateş, Ş. B., Berk, G., Bedir, S. T., Köksal, A., . . . Özgür, A. (2022). Resources for Turkish dependency parsing: Introducing the BOUN treebank and the BoAT annotation tool. Language Resources and Evaluation, 56(1), 259-307. https://doi.org/10.1007/s10579-021-09558-0
  • Underhill, R. (1985). Turkish grammar. Cambridge: MIT Press.
  • Uzun, N. E. (2000). Evrensel Dilbigisi ve Türkçe. İstanbul: Multilingual.
  • Yıldız, O. T., Solak, E., Çandır, Ş., Ehsani, R., & Görgün, O. (2016). Constructing a Turkish constituency parse treebank. Information Sciences and Systems 2015: 30th International Symposium on Computer and Information Sciences, (s. 339-347). https://doi.org/10.1007/978-3-319-22635-4_31
Toplam 34 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Doğal Dil İşleme
Bölüm Research Article
Yazarlar

Berke Özenç 0000-0003-2008-243X

Ercan Solak 0000-0002-8448-9987

Yayımlanma Tarihi 26 Aralık 2024
Gönderilme Tarihi 1 Temmuz 2024
Kabul Tarihi 15 Ekim 2024
Yayımlandığı Sayı Yıl 2024 Cilt: 12 Sayı: 2

Kaynak Göster

APA Özenç, B., & Solak, E. (2024). TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi, 12(2), 172-197. https://doi.org/10.14514/beykozad.1508348
AMA Özenç B, Solak E. TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi. Aralık 2024;12(2):172-197. doi:10.14514/beykozad.1508348
Chicago Özenç, Berke, ve Ercan Solak. “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”. Beykoz Akademi Dergisi 12, sy. 2 (Aralık 2024): 172-97. https://doi.org/10.14514/beykozad.1508348.
EndNote Özenç B, Solak E (01 Aralık 2024) TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi 12 2 172–197.
IEEE B. Özenç ve E. Solak, “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”, Beykoz Akademi Dergisi, c. 12, sy. 2, ss. 172–197, 2024, doi: 10.14514/beykozad.1508348.
ISNAD Özenç, Berke - Solak, Ercan. “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”. Beykoz Akademi Dergisi 12/2 (Aralık 2024), 172-197. https://doi.org/10.14514/beykozad.1508348.
JAMA Özenç B, Solak E. TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi. 2024;12:172–197.
MLA Özenç, Berke ve Ercan Solak. “TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI”. Beykoz Akademi Dergisi, c. 12, sy. 2, 2024, ss. 172-97, doi:10.14514/beykozad.1508348.
Vancouver Özenç B, Solak E. TÜRKÇE İÇİN BİÇİMBİRİM TEMELLİ BİR BİLEŞEN GRAMERİ YAKLAŞIMI. Beykoz Akademi Dergisi. 2024;12(2):172-97.