BibTex RIS Kaynak Göster

CREATING A TURKISH CORPUS AND DETERMINIG WORD LENGTH DISTRIBUTION THAT ARE USED IN TURKISH TEXT

Yıl 2003, Cilt: 5 Sayı: 1, 1 - 7, 01.01.2003
https://izlik.org/JA44SP58RM

Öz

In this work, by making use of 10 different web sites having Turkish content, a corpus of
30MB is generated. The number of words used on the web sites that forms this corpus is
calculated, word length distribution of all the corpus is analyzed, and average word length of
Turkish is determined.

TÜRKÇE KÜLLİYAT OLUŞTURULMASI VE TÜRKÇE METİNLERDE KULLANILAN KELİMELERİN UZUNLUK DAĞILIMLARININ BELİRLENMESİ

Yıl 2003, Cilt: 5 Sayı: 1, 1 - 7, 01.01.2003
https://izlik.org/JA44SP58RM

Öz

Bu çalışmada, Türkçe içeriğe sahip 10 ayrı web sitesinden yararlanılarak, 30MB
büyüklüğünde bir külliyat oluşturulmuştur. Bu külliyatı oluşturan web sitelerinde kullanılan
kelime sayıları hesaplanmış, tüm külliyat için kelime uzunluk dağılımları incelenmiş ve Türkçe’nin ortalama kelime uzunluğu belirlenmiştir.

Toplam 0 adet kaynakça vardır.

Ayrıntılar

Diğer ID JA85AP86KU
Yazarlar

Gökhan Dalkılıç

Yalçın Çebi

Yayımlanma Tarihi 1 Ocak 2003
IZ https://izlik.org/JA44SP58RM
Yayımlandığı Sayı Yıl 2003 Cilt: 5 Sayı: 1

Kaynak Göster

Vancouver 1.Dalkılıç G, Çebi Y. TÜRKÇE KÜLLİYAT OLUŞTURULMASI VE TÜRKÇE METİNLERDE KULLANILAN KELİMELERİN UZUNLUK DAĞILIMLARININ BELİRLENMESİ. DEUFMD [Internet]. 01 Ocak 2003;5(1):1-7. Erişim adresi: https://izlik.org/JA44SP58RM

Bu dergi, Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY-NC 4.0) altında lisanslanmıştır.

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJmaWxlIiwicGF0aCI6IjliNTAvMDBjMi8xZmIxLzY5MjZmZDIyOGE1NzgyLjA3MzU5MTk2LnBuZyIsImV4cCI6MTc2NDE2OTE1Nywibm9uY2UiOiJhZDRmNjNlNzdhOWYwOWQ4YTNjNGVmNGIxOTFlZWViNyJ9.4Dxgc9mc-p4Tyti8NTU5pxEfGUWeuJud1fPWxu2mUy8