Türkiye Türkçesinin Söz Varlığını (TTSV) barındıran sözlükler, Sözlükbilimin ilke ve yöntemleri açısından Türkiye Türkçesinin Söz Varlığını (TTSV) barındıran sözlükler değerlendirildiğinde bu sözlüklerin; sözlükbirimlerin yazımsallığı, madde başı ve içi açıklamalarda eksikliklerin varlığı, sözlükbirim tanıklarının yetersizliği ve birçok sözlükbirimin sözlükte tanıksız yer alması, sözcük türlerinin etiketlenmesindeki eksiklikler, sözlük malzemesinin gerçek zamanlı olmaması vb. nedenlerle ‘genel amaçlı, ansiklopedik’ sözlükler oldukları görülür. Bunun nedeni Türkçe için henüz nitelikli, kapsamlı ve standartlara uygun bir derlemin oluşturulamamış olmasıdır. Sözlük çalışmalarımız derlem tabanlı olmaktan uzaktır. Bu açıdan sözlükbilim çalışmalarımızın derlem tabanlı uygulamaların sonuçlarını esas alan, sözlükbirimlerin ve anlamsal sıklıklarının göz önüne alındığı, gerçek zamanlı, kullanıcı temelli anlayıştan uzak bir çerçevede olduğu gözlemlenmektedir. Bu çalışmanın amacı, bugüne kadar sözlüklerde derlenen madde başı fiilleri (MBF) bir derlemden yazımsallıkları, madde başı açıklamaları, tanıkları, sözcük türü olarak etiketleri açısından gerçek zamanlı olarak denetlemek ve sözlük girdilerini bir derlemden elde edilen veriler ışığında düzenlemektir. Çalışma, temelde derlemin oluşturulması, TTSV’de tanımlı 6.374 MBF’nin derlemden tüm yönleriyle toplanması, elde edilen sonuçların yayımlanması olmak üzere üç aşamadan oluşmaktadır. Birinci aşamada, Türkiye Türkçesinin yazın diline ait çeşitli türlerde metin parçaları ile internet ortamından seçilen alana özgü toplam 35 milyon ‘söz’lük (+/-) bir derlem amaca uygun bir veri tabanı uygulamasıyla biçimbirimsel, sözcükbirimsel ve tümcesel olarak sayısallaştırılıp sorgulanabilir hâle getirilmiştir. İkinci aşamada, TTSV’de fiillerin söz konusu derlem aracılığıyla derlem denetimi yapılmıştır. Üçüncü aşama ise elde edilen sonuçlar Türkiye Türkçesinde Fiillerin Derlem Tabanlı Sözlüğü olarak sanal ortamda yayımlanmıştır. Bu makale ağırlıklı olarak söz konusu çalışmanın ikinci ve üçüncü aşamasını yöntem ve uygulama açısından tanıtmayı amaçlamaktadır
When the dictionaries of Turkey Turkish lexicon are taken into consideration,
it can be said that these dictionaries function mainly as encyclopedias
or general dictionaries. One of the reasons is that there
are problems about the textual elements, lexical entries, and the inadequacy
of lexicographic evidence. Another reason is that there is
not a qualified corpus created according to standards and scopes. As a
matter of fact, dictionary studies are not in line with a corpus. From
this perspective, lexicography studies are not in line with the results of
corpus-based data about the frequencies of meaning; moreover, they
are neither spontaneous nor user-friendly. The aim of the present
study is not only to examine the textual elements, explanations, lexicographic
evidence and part of speech tags for the verbs from a corpus
spontaneously, but also to design the data in accordance with the
corpus data. The study is composed of three steps, which are: creating
the corpus, the compiling of 6.374 verbs in the corpus with all of
their properties in Turkey Turkish lexicon, and publishing the results.
As for the first step, 35 million words (+/-), which are domain
specific and gathered from different texts as well as the internet, have
been digitized and made ready for search in terms of morphemic, lexicographical
and sentential aspects. For the second step, the corpus
check of the verbs in Turkey Turkish lexicon has been conducted.
Finally, the obtained results have been published online as “CorpusBased
Dictionary of Verbs in Turkey Turkish” This article particularly
aims to introduce the techniques and application of the second
and third steps and share the results of the project.
Other ID | JA68MP47AC |
---|---|
Journal Section | Articles |
Authors | |
Publication Date | December 1, 2014 |
Published in Issue | Year 2014 Issue: 69 |
Ahmet Yesevi University Board of Trustees