TR
EN
Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri
Öz
Bu çalışmanın amacı, basılı Türkçe’nin bazı istatistiksel değerlerinin belirlenmesidir. Derlenen istatistikler tekli, ikili, …, beşli harf gruplarının sıklık dağılımları, ilk/son harf çözümlemeleri, harf başına belirsizlik (entropi)ve fazlalık, rastgelelik endeksi, sözcük uzunluk dağılımı, sesli/sessiz harf oranı’nı içermektedir. Hürriyet gazetesinin internet arşivinden bir Türkçe külliyat (corpus) oluşturularak anılan değerler elde edilmiştir. Bununla yetinilmeyip, Türkçe’ye ilişkin öteki çalışmalar da kullanılarak, tüm bu çalışmaların ağırlıklı bileşkesi olan, bugüne kadar elde edilen en geniş Türkçe külliyat tabanı ve metin çeşitliliğine sahip, en kapsamlı sonuçlar elde edilmiştir. Farklı çalışmalarda elde edilen sonuçların birbiriyle uyumluluk derecesini belirlemek amacıyla bir benzerlik ölçütü geliştirilmiş ve mevcut çalışmaların sonuçlarına uygulanmıştır.
Anahtar Kelimeler
Kaynakça
- COVER, T. and KING, R. (1978), A Convergent Gambling Estimate of the Entropy of English, IEEE Transactions on Information Theory, IT-24, n.4, 413-421
- DALKILIÇ, G. (2001), Günümüz Türkçesi’nin İstatistiksel Özellikleri ve Bir Metin Sıkıştırma Uygulaması, Yüksek Lisans Tezi, Uluslararası Bilgisayar Enst., Ege Üniversitesi.
- DALKILIÇ, and M.E. DALKILIÇ, G. (2000), On the Entropy, Redundancy and Compression of Contemporary Printed Turkish Proc. of the XV International. Symposium on Computer and Information Sciences, 60-67.
- DİRİ, B. (2000), A Text Compression System Based on the Morphology of Turkish Language, Proc. of the XV Int’l. Symp. on Computer & Information Sciences, 12-23.
- GÖKSU, T. and ERTAUL. L. (1998), Yer Değiştirmeli ve Dizi Şifreleyiciler için Türkçe’nin Yapısal Özelliklerini Kullanan Bir Kriptoanaliz, BAS’98, 184-194.
- GÖNENÇ, G. (1980), Türkçe abece İçin ‘En İyi’ Kodlar, 3. Ulusal Bilişim Kurultayı, Bilişim’80 Bildiriler Kitabı, 73-75.
- JURAFSKY, D. and MARTIN, J.H. (2000), Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice Hall.
- KOLTUKSUZ, A. (1995), Simetrik Kriptosistemler için Türkiye Türkçesinin Kriptanalitik Ölçütleri, Doktora Tezi, Bilgisayar Mühendisliği, Ege Üniversitesi.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Uygulamalı İstatistik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
15 Nisan 2002
Gönderilme Tarihi
24 Aralık 2001
Kabul Tarihi
4 Mart 2002
Yayımlandığı Sayı
Yıl 2002 Cilt: 1 Sayı: 1
APA
Dalkılıç, M. E., & Dalkılıç, G. (2002). Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. İstatistik Araştırma Dergisi, 1(1), 113-130. https://izlik.org/JA22DL75JS
AMA
1.Dalkılıç ME, Dalkılıç G. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR. 2002;1(1):113-130. https://izlik.org/JA22DL75JS
Chicago
Dalkılıç, Mehmet Emin, ve Gökhan Dalkılıç. 2002. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi 1 (1): 113-30. https://izlik.org/JA22DL75JS.
EndNote
Dalkılıç ME, Dalkılıç G (01 Nisan 2002) Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. İstatistik Araştırma Dergisi 1 1 113–130.
IEEE
[1]M. E. Dalkılıç ve G. Dalkılıç, “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”, JSRTR, c. 1, sy 1, ss. 113–130, Nis. 2002, [çevrimiçi]. Erişim adresi: https://izlik.org/JA22DL75JS
ISNAD
Dalkılıç, Mehmet Emin - Dalkılıç, Gökhan. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi 1/1 (01 Nisan 2002): 113-130. https://izlik.org/JA22DL75JS.
JAMA
1.Dalkılıç ME, Dalkılıç G. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR. 2002;1:113–130.
MLA
Dalkılıç, Mehmet Emin, ve Gökhan Dalkılıç. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi, c. 1, sy 1, Nisan 2002, ss. 113-30, https://izlik.org/JA22DL75JS.
Vancouver
1.Mehmet Emin Dalkılıç, Gökhan Dalkılıç. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR [Internet]. 01 Nisan 2002;1(1):113-30. Erişim adresi: https://izlik.org/JA22DL75JS