The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon

Bülent Özkan

Türkiye Türkçesi Söz Varlığında Fiillerin Derlem Denetimi ve Derlem Tabanlı Sözlüğü

Year 2014, Issue: 69, 171 - 204, 01.12.2014

Abstract

Türkiye Türkçesinin Söz Varlığını (TTSV) barındıran sözlükler, Sözlükbilimin ilke ve yöntemleri açısından Türkiye Türkçesinin Söz Varlığını (TTSV) barındıran sözlükler değerlendirildiğinde bu sözlüklerin; sözlükbirimlerin yazımsallığı, madde başı ve içi açıklamalarda eksikliklerin varlığı, sözlükbirim tanıklarının yetersizliği ve birçok sözlükbirimin sözlükte tanıksız yer alması, sözcük türlerinin etiketlenmesindeki eksiklikler, sözlük malzemesinin gerçek zamanlı olmaması vb. nedenlerle ‘genel amaçlı, ansiklopedik’ sözlükler oldukları görülür. Bunun nedeni Türkçe için henüz nitelikli, kapsamlı ve standartlara uygun bir derlemin oluşturulamamış olmasıdır. Sözlük çalışmalarımız derlem tabanlı olmaktan uzaktır. Bu açıdan sözlükbilim çalışmalarımızın derlem tabanlı uygulamaların sonuçlarını esas alan, sözlükbirimlerin ve anlamsal sıklıklarının göz önüne alındığı, gerçek zamanlı, kullanıcı temelli anlayıştan uzak bir çerçevede olduğu gözlemlenmektedir. Bu çalışmanın amacı, bugüne kadar sözlüklerde derlenen madde başı fiilleri (MBF) bir derlemden yazımsallıkları, madde başı açıklamaları, tanıkları, sözcük türü olarak etiketleri açısından gerçek zamanlı olarak denetlemek ve sözlük girdilerini bir derlemden elde edilen veriler ışığında düzenlemektir. Çalışma, temelde derlemin oluşturulması, TTSV’de tanımlı 6.374 MBF’nin derlemden tüm yönleriyle toplanması, elde edilen sonuçların yayımlanması olmak üzere üç aşamadan oluşmaktadır. Birinci aşamada, Türkiye Türkçesinin yazın diline ait çeşitli türlerde metin parçaları ile internet ortamından seçilen alana özgü toplam 35 milyon ‘söz’lük (+/-) bir derlem amaca uygun bir veri tabanı uygulamasıyla biçimbirimsel, sözcükbirimsel ve tümcesel olarak sayısallaştırılıp sorgulanabilir hâle getirilmiştir. İkinci aşamada, TTSV’de fiillerin söz konusu derlem aracılığıyla derlem denetimi yapılmıştır. Üçüncü aşama ise elde edilen sonuçlar Türkiye Türkçesinde Fiillerin Derlem Tabanlı Sözlüğü olarak sanal ortamda yayımlanmıştır. Bu makale ağırlıklı olarak söz konusu çalışmanın ikinci ve üçüncü aşamasını yöntem ve uygulama açısından tanıtmayı amaçlamaktadır

Keywords

Türkiye Türkçesinin Söz Varlığı, fiiller, derlem dilbilim, sözlükbilim, Türkçenin öğretimi

References

Atkins, Sue (2003). “Lexicographic Relevance: Selecting Information from Corpus Evidence”. International Journal of Lexicography 16 (3): 251-280.
Baker, Paul vd. (2006). A Glossary of Corpus Linguistics. UK: Edinburg University Press.
Biber, Douglas vd. (2002). Corpus Linguistics, Investigating Language Structure and Use. UK: Cambridge University Press.
http://fiiller.mersin.edu.tr/. [Erişim: 10.11.2011].
http://info.ox.ac.uk/bnc/. [Erişim: 23.10.2010].
http://mistug.tubitak.gov.tr/proje/. [Erişim: 4.03.2014].
http://turkcederlem.mersin.edu.tr/. [Erişim: 10.11.2011].
http://turkcederlem.mersin.edu.tr/derlem516/. [Erişim: 10.11.2011].
http://www.hlst.sabanciuniv.edu/TL/. [Erişim: 19.10.2010].
http://www.tdk.gov.tr/index.php?option=com_gts&view=gts. [Erişim 10.11.2011].
http://www.tnc.org.tr/. [Erişim: 16.4.2011].
Kennedy, Graeme (1998). An Introduction to Corpus Linguistics. New York: Addison Wesley Longman Limited.
Krishnamurthy, Ramesh (2008). “Corpus-driven Lexicography”. International Journal of Lexicography 21(3): 231-242.
McEnery, Tony and Adrrew Wilson (2004). Corpus Linguistics -An Introduction-. USA: Edinburg Universitiy Press.
McEnery, Tony vd. (2006). Corpus-Based Language Studies An Advanced Resource Book. New York: Routledge.
Özkan, Bülent ve Ayşe Eda Gündoğdu (2011). “Ana Dili ve Yabancı Dil Olarak Türkçenin Öğretiminde Belirteçler -Derlem Tabanlı Bir Uygulama-“. Theoretical and Applied Researches on Turkish Language Teaching. Ed. L. Uzun, Ü. Bozkurt. Almanya: Die Blaue Eule. Essen. 317-336.
Özkan, Bülent (2013). Yöntem ve Uygulama Açısından 'Türkiye Türkçesi Söz Varlığının Derlem Tabanlı Sözlüğü'. bilig, Türk Dünyası Sosyal Bilimler Dergisi 66: 149-178.
____, (2010a). “Türkçenin Öğretiminde Sıfatların Eşdizim Sözlüğü: Yöntem ve Uygulama”. E-Uluslararası Eğitim Araştırmaları Dergisi 1(2): 51-65.
____, (2010b). "Güncel Türkçe Sözlükte Zarf Olarak Tanımlı Sözlükbirimlerin Derlem Denetimi". Turkish Studies International Periodical for the Languages, Literature and History of Turkish or Turkic 5(3): 1764-1782.
_____, (2012). Türkiye Türkçesinde Fiillerin Derlem Denetimi ve Derlem Tabanlı Sözlüğü. TÜBİTAK-SOBAG Proje Sonuç Raporu. (Proje No: 109K516) Ankara. (http://mistug.tubitak.gov.tr/proje/).
Sampson, Geoffrey and Diana McCarthy (2005). Corpus Linguistics: Reading in a Widening Discipline. New York: Continuum.
Say, Bilge (2003). Türkçe için Biçimbirimsel ve Sözdizimsel Olarak İşaretlenmiş Ağaç Yapılı Bir Derlem Oluşturma. Proje Raporu. EK-B: Türkçe Ağaç Yapılı Derlem Kılavuzu (Proje No: 199E026). Ankara.
Say, Bilge vd. (2002). “Bilgisayar Ortamında Derlem Geliştirme Çalışması”. Akademik Bilişim Konferansı. Konya.
Summers, D. (1993). “Longman/Lancaster English Language Corpus - Criteria and Design”. International Journal of Lexicography 6(3): 181-208.
Tahiroğlu, B. Tahir (2006). Bilgisayar Destekli Dil Bilimi Çalıştayı Bildirileri. Ankara: TDK Yay. 89-98.
Türkçe Sözlük (2005). Ankara: TDK Yay.

The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon

Year 2014, Issue: 69, 171 - 204, 01.12.2014

Bülent Özkan

Abstract

When the dictionaries of Turkey Turkish lexicon are taken into consideration,
it can be said that these dictionaries function mainly as encyclopedias
or general dictionaries. One of the reasons is that there
are problems about the textual elements, lexical entries, and the inadequacy
of lexicographic evidence. Another reason is that there is
not a qualified corpus created according to standards and scopes. As a
matter of fact, dictionary studies are not in line with a corpus. From
this perspective, lexicography studies are not in line with the results of
corpus-based data about the frequencies of meaning; moreover, they
are neither spontaneous nor user-friendly. The aim of the present
study is not only to examine the textual elements, explanations, lexicographic
evidence and part of speech tags for the verbs from a corpus
spontaneously, but also to design the data in accordance with the
corpus data. The study is composed of three steps, which are: creating
the corpus, the compiling of 6.374 verbs in the corpus with all of
their properties in Turkey Turkish lexicon, and publishing the results.
As for the first step, 35 million words (+/-), which are domain
specific and gathered from different texts as well as the internet, have
been digitized and made ready for search in terms of morphemic, lexicographical
and sentential aspects. For the second step, the corpus
check of the verbs in Turkey Turkish lexicon has been conducted.
Finally, the obtained results have been published online as “CorpusBased
Dictionary of Verbs in Turkey Turkish” This article particularly
aims to introduce the techniques and application of the second
and third steps and share the results of the project.

Keywords

Turkey Turkish lexicon, verbs, corpus linguistics, lexicography, teaching Turkish

References

Atkins, Sue (2003). “Lexicographic Relevance: Selecting Information from Corpus Evidence”. International Journal of Lexicography 16 (3): 251-280.
Baker, Paul vd. (2006). A Glossary of Corpus Linguistics. UK: Edinburg University Press.
Biber, Douglas vd. (2002). Corpus Linguistics, Investigating Language Structure and Use. UK: Cambridge University Press.
http://fiiller.mersin.edu.tr/. [Erişim: 10.11.2011].
http://info.ox.ac.uk/bnc/. [Erişim: 23.10.2010].
http://mistug.tubitak.gov.tr/proje/. [Erişim: 4.03.2014].
http://turkcederlem.mersin.edu.tr/. [Erişim: 10.11.2011].
http://turkcederlem.mersin.edu.tr/derlem516/. [Erişim: 10.11.2011].
http://www.hlst.sabanciuniv.edu/TL/. [Erişim: 19.10.2010].
http://www.tdk.gov.tr/index.php?option=com_gts&view=gts. [Erişim 10.11.2011].
http://www.tnc.org.tr/. [Erişim: 16.4.2011].
Kennedy, Graeme (1998). An Introduction to Corpus Linguistics. New York: Addison Wesley Longman Limited.
Krishnamurthy, Ramesh (2008). “Corpus-driven Lexicography”. International Journal of Lexicography 21(3): 231-242.
McEnery, Tony and Adrrew Wilson (2004). Corpus Linguistics -An Introduction-. USA: Edinburg Universitiy Press.
McEnery, Tony vd. (2006). Corpus-Based Language Studies An Advanced Resource Book. New York: Routledge.
Özkan, Bülent ve Ayşe Eda Gündoğdu (2011). “Ana Dili ve Yabancı Dil Olarak Türkçenin Öğretiminde Belirteçler -Derlem Tabanlı Bir Uygulama-“. Theoretical and Applied Researches on Turkish Language Teaching. Ed. L. Uzun, Ü. Bozkurt. Almanya: Die Blaue Eule. Essen. 317-336.
Özkan, Bülent (2013). Yöntem ve Uygulama Açısından 'Türkiye Türkçesi Söz Varlığının Derlem Tabanlı Sözlüğü'. bilig, Türk Dünyası Sosyal Bilimler Dergisi 66: 149-178.
____, (2010a). “Türkçenin Öğretiminde Sıfatların Eşdizim Sözlüğü: Yöntem ve Uygulama”. E-Uluslararası Eğitim Araştırmaları Dergisi 1(2): 51-65.
____, (2010b). "Güncel Türkçe Sözlükte Zarf Olarak Tanımlı Sözlükbirimlerin Derlem Denetimi". Turkish Studies International Periodical for the Languages, Literature and History of Turkish or Turkic 5(3): 1764-1782.
_____, (2012). Türkiye Türkçesinde Fiillerin Derlem Denetimi ve Derlem Tabanlı Sözlüğü. TÜBİTAK-SOBAG Proje Sonuç Raporu. (Proje No: 109K516) Ankara. (http://mistug.tubitak.gov.tr/proje/).
Sampson, Geoffrey and Diana McCarthy (2005). Corpus Linguistics: Reading in a Widening Discipline. New York: Continuum.
Say, Bilge (2003). Türkçe için Biçimbirimsel ve Sözdizimsel Olarak İşaretlenmiş Ağaç Yapılı Bir Derlem Oluşturma. Proje Raporu. EK-B: Türkçe Ağaç Yapılı Derlem Kılavuzu (Proje No: 199E026). Ankara.
Say, Bilge vd. (2002). “Bilgisayar Ortamında Derlem Geliştirme Çalışması”. Akademik Bilişim Konferansı. Konya.
Summers, D. (1993). “Longman/Lancaster English Language Corpus - Criteria and Design”. International Journal of Lexicography 6(3): 181-208.
Tahiroğlu, B. Tahir (2006). Bilgisayar Destekli Dil Bilimi Çalıştayı Bildirileri. Ankara: TDK Yay. 89-98.
Türkçe Sözlük (2005). Ankara: TDK Yay.

There are 26 citations in total.

Details

Other ID	JA68MP47AC
Journal Section	Articles
Authors	Bülent Özkan This is me
Publication Date	December 1, 2014
Published in Issue	Year 2014 Issue: 69

Cite

APA	Özkan, B. (2014). The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon. Bilig(69), 171-204.
AMA	Özkan B. The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon. Bilig. December 2014;(69):171-204.
Chicago	Özkan, Bülent. “The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon”. Bilig, no. 69 (December 2014): 171-204.
EndNote	Özkan B (December 1, 2014) The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon. Bilig 69 171–204.
IEEE	B. Özkan, “The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon”, Bilig, no. 69, pp. 171–204, December 2014.
ISNAD	Özkan, Bülent. “The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon”. Bilig 69 (December 2014), 171-204.
JAMA	Özkan B. The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon. Bilig. 2014;:171–204.
MLA	Özkan, Bülent. “The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon”. Bilig, no. 69, 2014, pp. 171-04.
Vancouver	Özkan B. The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon. Bilig. 2014(69):171-204.

Article Files

Full Text

Ahmet Yesevi University Board of Trustees