BibTex RIS Kaynak Göster

CREATING A TURKISH CORPUS AND DETERMINIG WORD LENGTH DISTRIBUTION THAT ARE USED IN TURKISH TEXT

Yıl 2003, Cilt: 5 Sayı: 1, 1 - 7, 01.01.2003

Öz

In this work, by making use of 10 different web sites having Turkish content, a corpus of
30MB is generated. The number of words used on the web sites that forms this corpus is
calculated, word length distribution of all the corpus is analyzed, and average word length of
Turkish is determined.

TÜRKÇE KÜLLİYAT OLUŞTURULMASI VE TÜRKÇE METİNLERDE KULLANILAN KELİMELERİN UZUNLUK DAĞILIMLARININ BELİRLENMESİ

Yıl 2003, Cilt: 5 Sayı: 1, 1 - 7, 01.01.2003

Öz

Bu çalışmada, Türkçe içeriğe sahip 10 ayrı web sitesinden yararlanılarak, 30MB
büyüklüğünde bir külliyat oluşturulmuştur. Bu külliyatı oluşturan web sitelerinde kullanılan
kelime sayıları hesaplanmış, tüm külliyat için kelime uzunluk dağılımları incelenmiş ve Türkçe’nin ortalama kelime uzunluğu belirlenmiştir.

Toplam 0 adet kaynakça vardır.

Ayrıntılar

Diğer ID JA85AP86KU
Yazarlar

Gökhan Dalkılıç

Yalçın Çebi

Yayımlanma Tarihi 1 Ocak 2003
Yayımlandığı Sayı Yıl 2003 Cilt: 5 Sayı: 1

Kaynak Göster

Vancouver Dalkılıç G, Çebi Y. TÜRKÇE KÜLLİYAT OLUŞTURULMASI VE TÜRKÇE METİNLERDE KULLANILAN KELİMELERİN UZUNLUK DAĞILIMLARININ BELİRLENMESİ. DEUFMD. 2003;5(1):1-7.

Bu dergi, Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY-NC 4.0) altında lisanslanmıştır.

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJmaWxlIiwicGF0aCI6IjliNTAvMDBjMi8xZmIxLzY5MjZmZDIyOGE1NzgyLjA3MzU5MTk2LnBuZyIsImV4cCI6MTc2NDE2OTE1Nywibm9uY2UiOiJhZDRmNjNlNzdhOWYwOWQ4YTNjNGVmNGIxOTFlZWViNyJ9.4Dxgc9mc-p4Tyti8NTU5pxEfGUWeuJud1fPWxu2mUy8