In this work, by making use of 10 different web sites having Turkish content, a corpus of
30MB is generated. The number of words used on the web sites that forms this corpus is
calculated, word length distribution of all the corpus is analyzed, and average word length of
Turkish is determined.
Bu çalışmada, Türkçe içeriğe sahip 10 ayrı web sitesinden yararlanılarak, 30MB
büyüklüğünde bir külliyat oluşturulmuştur. Bu külliyatı oluşturan web sitelerinde kullanılan
kelime sayıları hesaplanmış, tüm külliyat için kelime uzunluk dağılımları incelenmiş ve Türkçe’nin ortalama kelime uzunluğu belirlenmiştir.
| Diğer ID | JA85AP86KU |
|---|---|
| Yazarlar | |
| Yayımlanma Tarihi | 1 Ocak 2003 |
| Yayımlandığı Sayı | Yıl 2003 Cilt: 5 Sayı: 1 |
Bu dergi, Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY-NC 4.0) altında lisanslanmıştır.