BibTex RIS Cite

CREATING A TURKISH CORPUS AND DETERMINIG WORD LENGTH DISTRIBUTION THAT ARE USED IN TURKISH TEXT

Year 2003, Volume: 5 Issue: 1, 1 - 7, 01.01.2003

Abstract

In this work, by making use of 10 different web sites having Turkish content, a corpus of
30MB is generated. The number of words used on the web sites that forms this corpus is
calculated, word length distribution of all the corpus is analyzed, and average word length of
Turkish is determined.

TÜRKÇE KÜLLİYAT OLUŞTURULMASI VE TÜRKÇE METİNLERDE KULLANILAN KELİMELERİN UZUNLUK DAĞILIMLARININ BELİRLENMESİ

Year 2003, Volume: 5 Issue: 1, 1 - 7, 01.01.2003

Abstract

Bu çalışmada, Türkçe içeriğe sahip 10 ayrı web sitesinden yararlanılarak, 30MB
büyüklüğünde bir külliyat oluşturulmuştur. Bu külliyatı oluşturan web sitelerinde kullanılan
kelime sayıları hesaplanmış, tüm külliyat için kelime uzunluk dağılımları incelenmiş ve Türkçe’nin ortalama kelime uzunluğu belirlenmiştir.

There are 0 citations in total.

Details

Other ID JA85AP86KU
Authors

Gökhan Dalkılıç

Yalçın Çebi

Publication Date January 1, 2003
Published in Issue Year 2003 Volume: 5 Issue: 1

Cite

Vancouver Dalkılıç G, Çebi Y. TÜRKÇE KÜLLİYAT OLUŞTURULMASI VE TÜRKÇE METİNLERDE KULLANILAN KELİMELERİN UZUNLUK DAĞILIMLARININ BELİRLENMESİ. DEUFMD. 2003;5(1):1-7.

This journal is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0).

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJmaWxlIiwicGF0aCI6IjliNTAvMDBjMi8xZmIxLzY5MjZmZDIyOGE1NzgyLjA3MzU5MTk2LnBuZyIsImV4cCI6MTc2NDE2OTMzMSwibm9uY2UiOiI2MTU1ODg1NGZlYzhkZTA1OThkNTU2NGFmYTQzYTc0YiJ9.O5b4Ex8bMlFv5797LL8VnE9YWS_X5880dfbmOp2-kc8