Research Article

Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri

Volume: 1 Number: 1 April 15, 2002
TR EN

Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri

Abstract

Bu çalışmanın amacı, basılı Türkçe’nin bazı istatistiksel değerlerinin belirlenmesidir. Derlenen istatistikler tekli, ikili, …, beşli harf gruplarının sıklık dağılımları, ilk/son harf çözümlemeleri, harf başına belirsizlik (entropi)ve fazlalık, rastgelelik endeksi, sözcük uzunluk dağılımı, sesli/sessiz harf oranı’nı içermektedir. Hürriyet gazetesinin internet arşivinden bir Türkçe külliyat (corpus) oluşturularak anılan değerler elde edilmiştir. Bununla yetinilmeyip, Türkçe’ye ilişkin öteki çalışmalar da kullanılarak, tüm bu çalışmaların ağırlıklı bileşkesi olan, bugüne kadar elde edilen en geniş Türkçe külliyat tabanı ve metin çeşitliliğine sahip, en kapsamlı sonuçlar elde edilmiştir. Farklı çalışmalarda elde edilen sonuçların birbiriyle uyumluluk derecesini belirlemek amacıyla bir benzerlik ölçütü geliştirilmiş ve mevcut çalışmaların sonuçlarına uygulanmıştır.

Keywords

References

  1. COVER, T. and KING, R. (1978), A Convergent Gambling Estimate of the Entropy of English, IEEE Transactions on Information Theory, IT-24, n.4, 413-421
  2. DALKILIÇ, G. (2001), Günümüz Türkçesi’nin İstatistiksel Özellikleri ve Bir Metin Sıkıştırma Uygulaması, Yüksek Lisans Tezi, Uluslararası Bilgisayar Enst., Ege Üniversitesi.
  3. DALKILIÇ, and M.E. DALKILIÇ, G. (2000), On the Entropy, Redundancy and Compression of Contemporary Printed Turkish Proc. of the XV International. Symposium on Computer and Information Sciences, 60-67.
  4. DİRİ, B. (2000), A Text Compression System Based on the Morphology of Turkish Language, Proc. of the XV Int’l. Symp. on Computer & Information Sciences, 12-23.
  5. GÖKSU, T. and ERTAUL. L. (1998), Yer Değiştirmeli ve Dizi Şifreleyiciler için Türkçe’nin Yapısal Özelliklerini Kullanan Bir Kriptoanaliz, BAS’98, 184-194.
  6. GÖNENÇ, G. (1980), Türkçe abece İçin ‘En İyi’ Kodlar, 3. Ulusal Bilişim Kurultayı, Bilişim’80 Bildiriler Kitabı, 73-75.
  7. JURAFSKY, D. and MARTIN, J.H. (2000), Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice Hall.
  8. KOLTUKSUZ, A. (1995), Simetrik Kriptosistemler için Türkiye Türkçesinin Kriptanalitik Ölçütleri, Doktora Tezi, Bilgisayar Mühendisliği, Ege Üniversitesi.

Details

Primary Language

Turkish

Subjects

Applied Statistics

Journal Section

Research Article

Authors

Mehmet Emin Dalkılıç * This is me
Türkiye

Publication Date

April 15, 2002

Submission Date

December 24, 2001

Acceptance Date

March 4, 2002

Published in Issue

Year 2002 Volume: 1 Number: 1

APA
Dalkılıç, M. E., & Dalkılıç, G. (2002). Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. İstatistik Araştırma Dergisi, 1(1), 113-130. https://izlik.org/JA22DL75JS
AMA
1.Dalkılıç ME, Dalkılıç G. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR. 2002;1(1):113-130. https://izlik.org/JA22DL75JS
Chicago
Dalkılıç, Mehmet Emin, and Gökhan Dalkılıç. 2002. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi 1 (1): 113-30. https://izlik.org/JA22DL75JS.
EndNote
Dalkılıç ME, Dalkılıç G (April 1, 2002) Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. İstatistik Araştırma Dergisi 1 1 113–130.
IEEE
[1]M. E. Dalkılıç and G. Dalkılıç, “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”, JSRTR, vol. 1, no. 1, pp. 113–130, Apr. 2002, [Online]. Available: https://izlik.org/JA22DL75JS
ISNAD
Dalkılıç, Mehmet Emin - Dalkılıç, Gökhan. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi 1/1 (April 1, 2002): 113-130. https://izlik.org/JA22DL75JS.
JAMA
1.Dalkılıç ME, Dalkılıç G. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR. 2002;1:113–130.
MLA
Dalkılıç, Mehmet Emin, and Gökhan Dalkılıç. “Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri”. İstatistik Araştırma Dergisi, vol. 1, no. 1, Apr. 2002, pp. 113-30, https://izlik.org/JA22DL75JS.
Vancouver
1.Mehmet Emin Dalkılıç, Gökhan Dalkılıç. Basılı Türkçe’nin Önemli Bazı İstatistiksel Özellikleri. JSRTR [Internet]. 2002 Apr. 1;1(1):113-30. Available from: https://izlik.org/JA22DL75JS