Türkçe sondan eklemeli bir dildir ve sahip olduğu ekler oldukça işlektir. Eklendiği sözcüğün türünü ve anlamını değiştirebilen bu eklerin, çoğunlukla sözcüğe kazandırdığı anlamlar kestirilebilmektedir. Bu sayede, yeni türeyen sözcüklerin anlamlarını çıkartabilmek için gerekli iki girdi söz konusudur: sözcüğün anlamı ve ekin kazandırdığı anlam. Çıktı olarak elde edilecek olan şey ise, türeyen sözcüğün yeni anlamı ve türüdür. Sözcük ve ek sayısı çok fazla olduğundan, doğal olarak bu sözcük-ek eşleştirmesini birebir yapmak olanaksızdır. Oysa ki sözcükler, anlamsal olarak belirli kavramsal sınıflarda toplanacak şekilde etiketlenirse, bu kurallar bütünü daha kolay bir şekilde oluşturulabilir. Türk Dil Kurumu sözlüğü, kök veya türemiş farkı gözetilmeksizin sözcüklerin çoğunu anlamları ile birlikte bünyesinde barındırır. Ancak kavramsal bir sınıflandırma bilgisi bu sözlükte tutulmamaktadır. Türkçe Wordnet ise üzerinde çalışmaların hâlâ devam ettiği, hem kök hem de türemiş sözcüklerin kavramsal sınıf bilgileri ile birlikte tutulduğu bir kavramsal sözlüktür. Bu çalışmada esas alınan, türemiş sözcüklerin yer almadığı, sadece kök sözcüklerin ve bu sözcüklerin alt-üst sınıf bilgilerinin tutulduğu bir veri tabanı oluşturmaktır. Çalışmanın amacı ise, bu veri tabanını kullanarak, türetilen yeni sözcüklerin anlamlarını, geçiş yaptığı yeni türü ve anlamsal sınıfı ortaya koyacak kuralları belirlemektir. Bu çalışma ile türemiş sözcüklerin anlamları daha standart hale gelebilmektedir ve daha yalın bir sözlük ortaya koyulabilmektedir. Ayrıca sözlüklerde yer almayan sözcükler de, otomatik olarak oluşturulabilmekte ve kullanımı sık olmasa da ortaya koyulabilmektedir. Eğer sözcük kullanılmıyor veya çok seyrek kullanılıyorsa, bu o sözcüğün var olmadığı anlamına gelmemektedir. Çalışmanın sonuçlar kısmında da ayrıntılı biçimde anlatılacağı üzere, başarı oranı eklerin eklendiği düzeye göre değişmektedir ve 1.düzey eklenen eklerde %88,2, 2.düzey eklenen eklerde %81,4 şeklindedir.
Eklerin Kazandırdığı Anlamlar Sözcükte Anlamsal Sınıflar Türkçe Wordnet Alt-Üst Kavramsal Sınıflar Sözcükte Anlamın Kurallı Olarak Üretilmesi
Turkish is a language that takes suffixes to the end of the word and its suffixes are very productive. The meanings that the suffixes which changes the type and the meaning of the words they are attached to add to the words can usually be predicted. In this way, to understand the meanings of the new derived words, two inputs are required: the meaning of the word and the meaning that the suffix gives. Output will be the new meaning and type of the derived word. Because the number of words and suffixes is very much, it is impossible to do one to one word-suffix mapping. However, if the words can be labeled as to be aggregated semantically in specific conceptual classes, all of these rules can be created more easily. Turkish Language Institution Dictionary, includes most of these words together with their meanings, without differentiating between root form and derived words. However, this dictionary does not include a conceptual class information. Besides Turkish Wordnet is a conceptual dictionary which is still progressing and including both base form and derived words together with their conceptual class information. The basis of this study is to create a database which includes only the base form words and hypernymy-hyponymy information of these words without keeping derived words. The purpose of this study is to determine the rules that will reveal the new meanings, types and semantic classes of the derived words. The information required on this point is the identification of the suffixes of the words under a common semantic class and determination of the semantic and functional changes that these suffix cause on the word. Because, the words may turn from name into verb, from verb to name or gain a new meaning and be included into a new semantic class together with the suffix it takes. The meanings of the words may become more standardized and a more plain dictionary may be revealed with this study. Moreover words not included in the dictionary are automatically generated and can be revealed though not used very often. If the word is not used or rarely used, this does not mean that there is no such word. As will be described in the results part of the study, success rate varies according to the level of the suffixes have been added and it's 88.2% at 1 st level added suffixes and 81.4% at 2nd level added suffixes.
The Meanings Gained by Adding Suffixes Semantic Classes of Words Turkish Wordnet Hypernymy Hyponymy Generation of Words’ Meanings with Rules
Other ID | JA37JD66HH |
---|---|
Journal Section | Makaleler(Araştırma) |
Authors | |
Publication Date | June 24, 2016 |
Published in Issue | Year 2011 Volume: 4 Issue: 1 - Volume: 4 Issue: 1 |
Article Acceptance
Use user registration/login to upload articles online.
The acceptance process of the articles sent to the journal consists of the following stages:
1. Each submitted article is sent to at least two referees at the first stage.
2. Referee appointments are made by the journal editors. There are approximately 200 referees in the referee pool of the journal and these referees are classified according to their areas of interest. Each referee is sent an article on the subject he is interested in. The selection of the arbitrator is done in a way that does not cause any conflict of interest.
3. In the articles sent to the referees, the names of the authors are closed.
4. Referees are explained how to evaluate an article and are asked to fill in the evaluation form shown below.
5. The articles in which two referees give positive opinion are subjected to similarity review by the editors. The similarity in the articles is expected to be less than 25%.
6. A paper that has passed all stages is reviewed by the editor in terms of language and presentation, and necessary corrections and improvements are made. If necessary, the authors are notified of the situation.
. This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.