With the rapid growth of online information, the number of documents in digital media is
very common increased and access request to this information easier and quickly makes
important the document compression. A part of studies on the document compression, the
morphological structure of the language used is intended to work. In this study, Turkish and
English language documents to determine the compression efficiency by using the
morphological structure of 10 different decomposition methods applied and the effect on the
compression success of this method are given in comparison.
The morphological structure of Turkish language The morphological structure of English language Document compression Entropy coding N-gram
İnternet‟in yaygınlaşmasıyla sayısal ortamdaki doküman sayısı gittikçe artmakta ve bu
bilgiye daha kolay ve hızlı bir şekilde erişme isteği doküman sıkıştırmayı önemli hale
getirmektedir. Doküman sıkıştırma alanında yapılan çalışmaların bir kısmı, dilin biçim
bilimsel yapısını kullanmayı amaçlayan çalışmalardır. Bu çalışmada, Türkçe ve İngilizce
dokümanların sıkıştırılma verimlerinin belirlenmesinde dilin biçim bilimsel yapısı
kullanılarak 10 farklı ayrıştırma yöntemi uygulanmış ve bu yöntemlerin sıkıştırma başarısına
olan etkileri karşılaştırmalı olarak verilmiştir.
Türkçe‟nin biçim bilimsel yapısı İngilizce‟nin biçim bilimsel yapısı Doküman sıkıştırma Entropi kodlama N-gram
Diğer ID | JA43PA39DU |
---|---|
Bölüm | Araştırma Makalesi |
Yazarlar | |
Yayımlanma Tarihi | 1 Ekim 2010 |
Yayımlandığı Sayı | Yıl 2010 Cilt: 12 Sayı: 3 |
Dokuz Eylül Üniversitesi, Mühendislik Fakültesi Dekanlığı Tınaztepe Yerleşkesi, Adatepe Mah. Doğuş Cad. No: 207-I / 35390 Buca-İZMİR.