TR
EN
Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri
Abstract
Bu çalışmanın amacı, basılı Türkçe’nin bazı istatistiksel değerlerinin belirlenmesidir. Derlenen istatistikler tekli, ikili, …, beşli harf gruplarının sıklık dağılımları, ilk/son harf çözümlemeleri, harf başına belirsizlik (entropi)ve fazlalık, rastgelelik endeksi, sözcük uzunluk dağılımı, sesli/sessiz harf oranı’nı içermektedir. Hürriyet gazetesinin internet arşivinden bir Türkçe külliyat (corpus) oluşturularak anılan değerler elde edilmiştir. Bununla yetinilmeyip, Türkçe’ye ilişkin öteki çalışmalar da kullanılarak, tüm bu çalışmaların ağırlıklı bileşkesi olan, bugüne kadar elde edilen en geniş Türkçe külliyat tabanı ve metin çeşitliliğine sahip, en kapsamlı sonuçlar elde edilmiştir. Farklı çalışmalarda elde edilen sonuçların birbiriyle uyumluluk derecesini belirlemek amacıyla bir benzerlik ölçütü geliştirilmiş ve mevcut çalışmaların sonuçlarına uygulanmıştır.
Keywords
References
- COVER, T. and KING, R. (1978), A Convergent Gambling Estimate of the Entropy of English, IEEE Transactions on Information Theory, IT-24, n.4, 413-421
- DALKILIÇ, G. (2001), Günümüz Türkçesi’nin İstatistiksel Özellikleri ve Bir Metin Sıkıştırma Uygulaması, Yüksek Lisans Tezi, Uluslararası Bilgisayar Enst., Ege Üniversitesi.
- DALKILIÇ, and M.E. DALKILIÇ, G. (2000), On the Entropy, Redundancy and Compression of Contemporary Printed Turkish Proc. of the XV International. Symposium on Computer and Information Sciences, 60-67.
- DİRİ, B. (2000), A Text Compression System Based on the Morphology of Turkish Language, Proc. of the XV Int’l. Symp. on Computer & Information Sciences, 12-23.
- GÖKSU, T. and ERTAUL. L. (1998), Yer Değiştirmeli ve Dizi Şifreleyiciler için Türkçe’nin Yapısal Özelliklerini Kullanan Bir Kriptoanaliz, BAS’98, 184-194.
- GÖNENÇ, G. (1980), Türkçe abece İçin ‘En İyi’ Kodlar, 3. Ulusal Bilişim Kurultayı, Bilişim’80 Bildiriler Kitabı, 73-75.
- JURAFSKY, D. and MARTIN, J.H. (2000), Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice Hall.
- KOLTUKSUZ, A. (1995), Simetrik Kriptosistemler için Türkiye Türkçesinin Kriptanalitik Ölçütleri, Doktora Tezi, Bilgisayar Mühendisliği, Ege Üniversitesi.
Details
Primary Language
Turkish
Subjects
Applied Statistics
Journal Section
Research Article
Publication Date
April 15, 2002
Submission Date
December 24, 2001
Acceptance Date
March 4, 2002
Published in Issue
Year 2002 Volume: 1 Number: 1
APA
Dalkılıç, M. E., & Dalkılıç, G. (2002). Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. İstatistik Araştırma Dergisi, 1(1), 113-130. https://izlik.org/JA22DL75JS
AMA
1.Dalkılıç ME, Dalkılıç G. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR. 2002;1(1):113-130. https://izlik.org/JA22DL75JS
Chicago
Dalkılıç, Mehmet Emin, and Gökhan Dalkılıç. 2002. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi 1 (1): 113-30. https://izlik.org/JA22DL75JS.
EndNote
Dalkılıç ME, Dalkılıç G (April 1, 2002) Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. İstatistik Araştırma Dergisi 1 1 113–130.
IEEE
[1]M. E. Dalkılıç and G. Dalkılıç, “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”, JSRTR, vol. 1, no. 1, pp. 113–130, Apr. 2002, [Online]. Available: https://izlik.org/JA22DL75JS
ISNAD
Dalkılıç, Mehmet Emin - Dalkılıç, Gökhan. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi 1/1 (April 1, 2002): 113-130. https://izlik.org/JA22DL75JS.
JAMA
1.Dalkılıç ME, Dalkılıç G. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR. 2002;1:113–130.
MLA
Dalkılıç, Mehmet Emin, and Gökhan Dalkılıç. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi, vol. 1, no. 1, Apr. 2002, pp. 113-30, https://izlik.org/JA22DL75JS.
Vancouver
1.Mehmet Emin Dalkılıç, Gökhan Dalkılıç. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR [Internet]. 2002 Apr. 1;1(1):113-30. Available from: https://izlik.org/JA22DL75JS