Araştırma Makalesi

METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ

Cilt: 6 Sayı: 3 20 Aralık 2016
PDF İndir
TR EN

METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ

Öz

Bu çalışmada metin veriler üzerinde yapılmakta olan dizgi eşleme işlemi istatistikleri ile aynı veriler üzerinde gerçekleştirilen sıkıştırılmış dizgi eşleme işlemi istatistikleri karşılaştırılmıştır. Bu kıyaslamayı yapmak için daha önce geliştirdiğimiz bir uygulama* iyileştirilmiştir ve test sonuçları bu uygulama sayesinde elde edilmiştir. Çalışmanın amacına uygun olarak literatürde mevcut dizgi eşleme algoritmalarının üzerinde herhangi bir değişiklik yapılmadan, sıkıştırılmış dizgi eşlemede de kullanılabilmesini sağlayan bir sıkıştırma yöntemi de sunulmuştur.

Yapılan testlerde ikili ve üçlü kodlamaya dayanan sıkıştırma algoritması %30-%35 arası bir sıkıştırma faktörü sunarken, elde edilen sıkıştırılmış dizgi eşleme süresi, sıkıştırılmamış metin üzerinde yapılan dizgi eşleme süresinden daha düşük olarak bulunmuştur. Ayrıca, dizgi eşleme yaparken gerçekleştirilen karakter karşılaştırma sayılarının sıkıştırılmış metinde, sıkıştırılmamış metne göre daha az olduğu saptanmıştır. Dolayısıyla geliştirilen algoritmanın amacı yüksek sıkıştırma oranı sağlamak yerine, sıkıştırılmış dosya ile sıkıştırılmamış dosya arasındaki metin işleme süreleri farklarına dikkat çekmek ve başka uygulamalar için bir fikir oluşturmaktır.

Ayrıca, üretilen algoritma üzerinde bazı değişiklikler yapılarak sıkıştırma oranlarının %5 gibi iyileşmesi sağlanmış ve algoritmanın yeni hali çalışmada verilmiştir.

Anahtar Kelimeler

Kaynakça

  1. Amir, A., & Benson, C. (1992). Efficient two-dimensional compressed matching. In Data Compression Conference, 1992. DCC ’92. (pp. 279–288). http://doi.org/10.1109/DCC.1992.227453
  2. Amir, A., Benson, G., & Farach, M. (1996). Let Sleeping Files Lie: Pattern Matching in Z-Compressed Files. Journal of Computer and System Sciences, 52(23), 299–307. http://doi.org/DOI: 10.1006/jcss.1996.0023
  3. Boyer, R. S., & Moore, J. S. (1977). A Fast String Searching Algorithm. Commun. ACM, 20(10), 762–772. http://doi.org/10.1145/359842.359859 Crochemore, M., & Rytter, W. (2002). Jewels of Stringology: Text Algorithms. Hackensack, NJ, USA: World Scientific. Retrieved from http://www.amazon.com/exec/obidos/redirect?tag=citeulike07-20&path=ASIN/9810248970
  4. Farach, M., & Thorup, M. (1998). String Matching in Lempel—Ziv Compressed Strings. Algorithmica, 20(4), 388–404. http://doi.org/10.1007/PL00009202
  5. Gasieniec, L., & Rytter, W. (1999). Almost-optimal fully LZW-compressed pattern matching. In Data Compression Conference, 1999. Proceedings. DCC ’99 (pp. 316–325). http://doi.org/10.1109/DCC.1999.755681
  6. Kärkkäinen, J., Navarro, G., & Ukkonen, E. (2003). Approximate string matching on Ziv-Lempel compressed text. Journal of Discrete Algorithms, 1(3–4), 313–338. http://doi.org/10.1016/S1570-8667(03)00032-7
  7. Kida, T., Takeda, M., Shinohara, A., & Arikawa, S. (1999). Shift-and approach to pattern matching in LZW compressed text. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 1645, 1–13. http://doi.org/10.1007/3-540-48452-3_1
  8. Klein, S. T., & Shapira, D. (2002). A new compression method for compressed matching. Data Compression Conference, 2000. Proceedings. DCC 2000, 400–409. http://doi.org/10.1109/DCC.2000.838180

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yazarlar

Nusret Buluş Bu kişi benim

Cihat Erdoğan Bu kişi benim

Yayımlanma Tarihi

20 Aralık 2016

Gönderilme Tarihi

1 Haziran 2016

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2016 Cilt: 6 Sayı: 3

Kaynak Göster

APA
Buluş, N., Erdoğan, C., & Diri, B. (2016). METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ. Ejovoc (Electronic Journal of Vocational Colleges), 6(3), 60-76. https://izlik.org/JA26ZE87GY
AMA
1.Buluş N, Erdoğan C, Diri B. METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ. Ejovoc. 2016;6(3):60-76. https://izlik.org/JA26ZE87GY
Chicago
Buluş, Nusret, Cihat Erdoğan, ve Banu Diri. 2016. “METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ”. Ejovoc (Electronic Journal of Vocational Colleges) 6 (3): 60-76. https://izlik.org/JA26ZE87GY.
EndNote
Buluş N, Erdoğan C, Diri B (01 Aralık 2016) METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ. Ejovoc (Electronic Journal of Vocational Colleges) 6 3 60–76.
IEEE
[1]N. Buluş, C. Erdoğan, ve B. Diri, “METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ”, Ejovoc, c. 6, sy 3, ss. 60–76, Ara. 2016, [çevrimiçi]. Erişim adresi: https://izlik.org/JA26ZE87GY
ISNAD
Buluş, Nusret - Erdoğan, Cihat - Diri, Banu. “METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ”. Ejovoc (Electronic Journal of Vocational Colleges) 6/3 (01 Aralık 2016): 60-76. https://izlik.org/JA26ZE87GY.
JAMA
1.Buluş N, Erdoğan C, Diri B. METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ. Ejovoc. 2016;6:60–76.
MLA
Buluş, Nusret, vd. “METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ”. Ejovoc (Electronic Journal of Vocational Colleges), c. 6, sy 3, Aralık 2016, ss. 60-76, https://izlik.org/JA26ZE87GY.
Vancouver
1.Nusret Buluş, Cihat Erdoğan, Banu Diri. METİN VERİLERDE DİZGİ EŞLEME VE SIKIŞTIRILMIŞ DİZGİ EŞLEME İŞLEMLERİ ARASINDAKİ PERFORMANS FARKLARININ İNCELENMESİ. Ejovoc [Internet]. 01 Aralık 2016;6(3):60-76. Erişim adresi: https://izlik.org/JA26ZE87GY