DERİN ÖĞRENME KULLANILARAK OPTİMUM JPEG KALİTE FAKTÖRÜNÜN BELİRLENMESİ

Emir Öztürk; Altan Mesut

doi:10.21923/jesd.698719

Araştırma Makalesi

DERİN ÖĞRENME KULLANILARAK OPTİMUM JPEG KALİTE FAKTÖRÜNÜN BELİRLENMESİ

Yıl 2020, Cilt: 8 Sayı: 4, 1010 - 1018, 25.12.2020

Emir Öztürk , Altan Mesut

https://doi.org/10.21923/jesd.698719

Öz

Görüntü verisinde sıkıştırma algoritmalarının kullanılması bir gereklilik haline gelmiştir. En çok kullanılan görüntü sıkıştırma algoritmalarından biri olan JPEG, görüntü üzerinde kayıplı bir sıkıştırma gerçekleştirmekte ve verilen kalite faktörüne göre bu kayıp değişmektedir. Düşük kalite faktörlerinde dosya boyutu küçülmekte fakat bozulma gözle görülür hale gelmektedir. Yüksek kalite faktörlerinde ise kalite artmakta fakat dosya boyutundan edilen sıkıştırma karı azalmaktadır. Bu sebeple hem görüntü kalitesini korumak hem de yer kazancı sağlamak için dosya boyutu ve görüntü kalitesi arasındaki dengenin sağlanması faydalı olacaktır. Bu çalışmanın amacı, dosya boyutu ve görüntüdeki bozulmanın arasındaki oranın en iyi (optimum) olduğu kalite faktörünü derin öğrenme yöntemleri kullanarak belirlemektir. Yapılan çalışmada önerilen bir veri çıkarma yöntemi yoğun sinir ağları (dense neural networks) ile eğitilmiş ve yöntemin başarısı evrişimsel sinir ağları ile yapılan denemelerle karşılaştırılmıştır. Görüntüdeki bozulmanın hesaplanmasında SSIM (Structural Similarity Index) kullanılmıştır. Elde edilen sonuçlarda önerilen yöntem kalite faktörünün belirlenmesinde CNN kullanılmasına göre %9.36 daha fazla doğruluk oranına sahip olmuştur.

Anahtar Kelimeler

Veri sıkıştırma , Derin Öğrenme , CNN , JPEG

Kaynakça

Artusi, A., Mantiuk, R.K., Richter, T., Korshunov, P., Hanhart, P., Ebrahimi, T., Agostinelli, M., 2016. JPEG XT: A Compression Standard for HDR and WCG Images. IEEE Signal Processing Magazine, 33 (2), 118–24.
Baştürk, A., Baştürk, N.B., Qurbanov, O., 2018. Parmak İzi̇ Tanıma İçi̇n Farklı Sınıflandırıcıların Karşılaştırmalı Başarım Anali̇zi̇. Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, 7 (2), 504–13.
Boureau, Y.L., Ponce, J., Lecun, Y., 2010. A Theoretical Analysis of Feature Pooling in Visual Recognition. ICML 2010 - Proceedings, 27th International Conference on Machine Learning.
Çelik, Ö., Osmanoğlu, U. Ö., & Çanakçı, B., 2020. Sosyal Medya Yorumlarindan Duygu Anali̇zi̇. Mühendislik Bilimleri ve Tasarım Dergisi, 8(2), 366–374.
Cengil, E., Çınar, A., 2016. A New Approach for Image Classification: Convolutional Neural Network. European Journal of Technic EJT, 6 (2), 96–103.
Çevik, K. K., Kayakuş, M., 2020. Bilişim Teknoloji̇leri̇ Departmanında Kullanıcıların Taleplerine Cevap Verme Süresi̇ni̇n Maki̇ne Öğrenmesi̇ İle Tahmi̇n Edi̇lmesi̇. Mühendislik Bilimleri ve Tasarım Dergisi, 8(3), 728–739.
Dufaux, F., Sullivan, G.J., 2009. The JPEG XR Image Coding Standard. IEEE Signal Processing Magazine.
Gonzalez, T.F., 2007. Handbook of Approximation Algorithms and Metaheuristics. Handbook of Approximation Algorithms and Metaheuristics, 1–1432.
Işık, N., Işık, A. H., 2020. Yapay Si̇ni̇r Ağları İle Elektrostati̇k Lens Si̇stem Tasarımı. Mühendislik Bilimleri ve Tasarım Dergisi, 8(2), 388–396.
Kuznetsova, A., Rom, H., Alldrin, N., Uijlings, J., Krasin, I., Pont-Tuset, J., Kamali, S., et al., 2018. The Open Images Dataset v4: Unified Image Classification, Object Detection, and Visual Relationship Detection at Scale. ArXiv Preprint ArXiv:1811.00982.
LeCun, Y.A., Bottou, L., Orr, G.B., Müller, K.R., 2012. Efficient Backprop. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics).
Masters, D., Luschi, C., 2018. Revisiting Small Batch Training for Deep Neural Networks, 1–18.
Nair, V., Hinton, G.E., 2010. Rectified Linear Units Improve Restricted Boltzmann Machines. In ICML 2010 - Proceedings, 27th International Conference on Machine Learning.
Özcan, T., Baştürk, A., 2019. Lip Reading Using Convolutional Neural Networks with and without Pre-Trained Models. Balkan Journal of Electrical and Computer Engineering, 7 (2), 195–201.
Pinto, N., Cox, D.D., DiCarlo, J.J., 2008. Why Is Real-World Visual Object Recognition Hard? PLoS Computational Biology, 4 (1), 0151–56.
Randers-Pehrson, G., Boutell, T., 1999. PNG (Portable Network Graphics) Specification, Version 1.2. PNG Development Group,.
Rende, F.Ş., Bütün, G., Karahan, Ş., 2016. Derin Öǧrenme Algoritmalarinda Model Testleri: Derin Testler. CEUR Workshop Proceedings, 172154–59.
Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Huang, Z., et al., 2015. ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision.
Skodras, A., Christopoulos, C., Ebrahimi, T., 2001. The JPEG 2000 Still Image Compression Standard. IEEE Signal Processing Magazine.
Wallace, G.K., 1992. The JPEG Still Picture Compression Standard. IEEE Transactions on Consumer Electronics.
Wang, T., Wu, D.J., Coates, A., Ng, A.Y., 2012. End-to-End Text Recognition with Convolutional Neural Networks. In Proceedings - International Conference on Pattern Recognition.
Wang, Z., Bovik, A.C., Sheikh, H.R., Simoncelli, E.P., 2004. Image Quality Assessment: From Error Visibility to Structural Similarity. IEEE Transactions on Image Processing.
Zhang, Q., Zhang, M., Chen, T., Sun, Z., Ma, Y., Yu, B., 2019. Recent Advances in Convolutional Neural Network Acceleration. Neurocomputing, 32337–51.

FINDING THE OPTIMUM JPEG QUALITY FACTOR USING DEEP LEARNING

Yıl 2020, Cilt: 8 Sayı: 4, 1010 - 1018, 25.12.2020

Emir Öztürk , Altan Mesut

https://doi.org/10.21923/jesd.698719

Öz

It has become a necessity to use compression algorithms in image data. One of the most used image compression algorithms, JPEG performs lossy compression on an image and the loss varies according to the given quality factor. At low quality factor values, the file size gets smaller and artifacts become noticeable. In high quality factors, quality of image increases but savings from storage space decreases. For this reason, it will be beneficial to balance the file size and image quality in order to both maintain image quality and save space. The aim of this study is to determine the quality factor value, where the ratio between file size and image distortion is optimum, by using deep learning methods. In the study, a proposed data extraction method was trained with dense neural networks and the success of the method is compared with experimental results obtained with convolutional neural networks. Calculation of image distortion was carried out using SSIM (Structural Similarity Index). In the results obtained, the proposed method has 9.36% more accuracy than CNN in determining the quality factor.

Anahtar Kelimeler

Data Compression , Deep Learning , CNN , JPEG

Kaynakça

Artusi, A., Mantiuk, R.K., Richter, T., Korshunov, P., Hanhart, P., Ebrahimi, T., Agostinelli, M., 2016. JPEG XT: A Compression Standard for HDR and WCG Images. IEEE Signal Processing Magazine, 33 (2), 118–24.
Baştürk, A., Baştürk, N.B., Qurbanov, O., 2018. Parmak İzi̇ Tanıma İçi̇n Farklı Sınıflandırıcıların Karşılaştırmalı Başarım Anali̇zi̇. Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, 7 (2), 504–13.
Boureau, Y.L., Ponce, J., Lecun, Y., 2010. A Theoretical Analysis of Feature Pooling in Visual Recognition. ICML 2010 - Proceedings, 27th International Conference on Machine Learning.
Çelik, Ö., Osmanoğlu, U. Ö., & Çanakçı, B., 2020. Sosyal Medya Yorumlarindan Duygu Anali̇zi̇. Mühendislik Bilimleri ve Tasarım Dergisi, 8(2), 366–374.
Cengil, E., Çınar, A., 2016. A New Approach for Image Classification: Convolutional Neural Network. European Journal of Technic EJT, 6 (2), 96–103.
Çevik, K. K., Kayakuş, M., 2020. Bilişim Teknoloji̇leri̇ Departmanında Kullanıcıların Taleplerine Cevap Verme Süresi̇ni̇n Maki̇ne Öğrenmesi̇ İle Tahmi̇n Edi̇lmesi̇. Mühendislik Bilimleri ve Tasarım Dergisi, 8(3), 728–739.
Dufaux, F., Sullivan, G.J., 2009. The JPEG XR Image Coding Standard. IEEE Signal Processing Magazine.
Gonzalez, T.F., 2007. Handbook of Approximation Algorithms and Metaheuristics. Handbook of Approximation Algorithms and Metaheuristics, 1–1432.
Işık, N., Işık, A. H., 2020. Yapay Si̇ni̇r Ağları İle Elektrostati̇k Lens Si̇stem Tasarımı. Mühendislik Bilimleri ve Tasarım Dergisi, 8(2), 388–396.
Kuznetsova, A., Rom, H., Alldrin, N., Uijlings, J., Krasin, I., Pont-Tuset, J., Kamali, S., et al., 2018. The Open Images Dataset v4: Unified Image Classification, Object Detection, and Visual Relationship Detection at Scale. ArXiv Preprint ArXiv:1811.00982.
LeCun, Y.A., Bottou, L., Orr, G.B., Müller, K.R., 2012. Efficient Backprop. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics).
Masters, D., Luschi, C., 2018. Revisiting Small Batch Training for Deep Neural Networks, 1–18.
Nair, V., Hinton, G.E., 2010. Rectified Linear Units Improve Restricted Boltzmann Machines. In ICML 2010 - Proceedings, 27th International Conference on Machine Learning.
Özcan, T., Baştürk, A., 2019. Lip Reading Using Convolutional Neural Networks with and without Pre-Trained Models. Balkan Journal of Electrical and Computer Engineering, 7 (2), 195–201.
Pinto, N., Cox, D.D., DiCarlo, J.J., 2008. Why Is Real-World Visual Object Recognition Hard? PLoS Computational Biology, 4 (1), 0151–56.
Randers-Pehrson, G., Boutell, T., 1999. PNG (Portable Network Graphics) Specification, Version 1.2. PNG Development Group,.
Rende, F.Ş., Bütün, G., Karahan, Ş., 2016. Derin Öǧrenme Algoritmalarinda Model Testleri: Derin Testler. CEUR Workshop Proceedings, 172154–59.
Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Huang, Z., et al., 2015. ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision.
Skodras, A., Christopoulos, C., Ebrahimi, T., 2001. The JPEG 2000 Still Image Compression Standard. IEEE Signal Processing Magazine.
Wallace, G.K., 1992. The JPEG Still Picture Compression Standard. IEEE Transactions on Consumer Electronics.
Wang, T., Wu, D.J., Coates, A., Ng, A.Y., 2012. End-to-End Text Recognition with Convolutional Neural Networks. In Proceedings - International Conference on Pattern Recognition.
Wang, Z., Bovik, A.C., Sheikh, H.R., Simoncelli, E.P., 2004. Image Quality Assessment: From Error Visibility to Structural Similarity. IEEE Transactions on Image Processing.
Zhang, Q., Zhang, M., Chen, T., Sun, Z., Ma, Y., Yu, B., 2019. Recent Advances in Convolutional Neural Network Acceleration. Neurocomputing, 32337–51.

Toplam 23 adet kaynakça vardır.

Ayrıntılar

Birincil Dil	Türkçe
Konular	Bilgisayar Yazılımı
Bölüm	Araştırma Makaleleri \ Research Articles
Yazarlar	Emir Öztürk 0000-0002-3734-5171 Altan Mesut 0000-0002-1477-3093
Yayımlanma Tarihi	25 Aralık 2020
Gönderilme Tarihi	4 Mart 2020
Kabul Tarihi	10 Kasım 2020
Yayımlandığı Sayı	Yıl 2020 Cilt: 8 Sayı: 4

Kaynak Göster

APA	Öztürk, E., & Mesut, A. (2020). DERİN ÖĞRENME KULLANILARAK OPTİMUM JPEG KALİTE FAKTÖRÜNÜN BELİRLENMESİ. Mühendislik Bilimleri ve Tasarım Dergisi, 8(4), 1010-1018. https://doi.org/10.21923/jesd.698719

Kapak Resmi İndir

Makale Dosyaları

Tam Metin