Today, large-scale image retrieval methods are used for fast access to increasing visual information. Hashing methods are an image retrieval approach that provides computationally effective and high-speed access. Hash codes created with hand-crafted features extracted from images in the past are now built with deep learning architectures. Convolutional neural network (CNN)'s an impressive performance using optimized features strengthens this trend day by day. However, it contradicts the hash codes consisting of '0' and '1' values and the procedure of updating the parameters and output of CNN architectures. To solve this problem, solutions such as bringing the bits in the CNN output to '0' and '1' values with a threshold value, and converting the output bits to binary values with the help of loss functions in the CNN output are presented in the literature. It is very useful for studies involving loss function solutions for end-to-end training. However, in these studies, loss weights are generally empirical. In order to solve this situation, a framework consisting of two steps is suggested in this study. In the first stage, Euclidean distance is used in the output of a CNN architecture that is trained in a pairwise manner. After reducing the distance between the two images below the specified value, in the second step, the network parameters are transferred, and the output is drawn to binary values with binarization loss. Thus, binary hash codes are obtained automatically for each image without using any additional weight.
CNN Content-based image retrieval CBIR medical image retrieval hashing binarization loss Euclidean distance
TÜBİTAK
120E018
This research is funded by the Scientific and Technological Research Council of Turkey (TÜBİTAK) under grant number 120E018.
Günümüzde, artan görsel bilgiye hızlı erişim için büyük ölçekli görüntü erişimi yöntemleri kullanılmaktadır. Hashing yöntemleri, hesaplama açısından etkili ve çok hızlı erişim sağlayan görüntü erişimi yaklaşımlarındandır. Geçmişte görüntülerden çıkarılan el yapımı özelliklerle oluşturulan karma kodlar artık derin öğrenme mimarileriyle oluşturulmaktadır. Evrişimli sinir ağının (CNN) optimize edilmiş özellikleri kullanan etkileyici performansı, bu eğilimi her geçen gün güçlendirmektedir. Ancak, '0' ve '1' değerlerinden oluşan karma kodlarla ve CNN mimarilerinin parametrelerini ve çıktılarını güncelleme prosedürü ile çelişir. Bu problemi çözmek için CNN çıktısındaki bitlerin eşik değeri ile '0' ve '1' değerlerine getirilmesi ve CNN çıkışındaki kayıp fonksiyonları yardımıyla çıkış bitlerinin ikili değerlere çevrilmesi gibi çözümler bulunmaktadır. Uçtan uca eğitim için kayıp fonksiyonu çözümlerini içeren çalışmalar için çok kullanışlıdır. Ancak bu çalışmalarda kayıp ağırlıkları genellikle ampiriktir. Bu durumu çözmek için bu çalışmada iki aşamadan oluşan bir çerçeve önerilmektedir. İlk aşamada, çift olarak eğitilmiş bir CNN mimarisinin çıktısında Öklid mesafesi kullanılır. İki görüntü arasındaki mesafe belirtilen değerin altına indirildikten sonra ikinci adımda ağ parametreleri aktarılır ve çıktı ikili değerlere çekilir. Böylelikle herhangi bir ek ağırlık kullanılmadan her görüntü için ikili hash kodları otomatik olarak elde edilir.
CNN içerik tabanlı görüntü erişimi CBIR tıbbi görüntü erişimi hashing ikilileştirme kaybı Öklid mesafesi
120E018
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Proje Numarası | 120E018 |
Yayımlanma Tarihi | 5 Ekim 2020 |
Yayımlandığı Sayı | Yıl 2020 Ejosat Özel Sayı 2020 (ICCEES) |