Nowadays, the use of the human ear images gains importance for the sustainability of biometric authorization and surveillance systems. Contemporary studies show that such processes can be done semi-automatically or fully automatically, instead of being done manually. Due to the fact that deep learning uses abstract features (i.e., representation learning), it reaches quite high performance values compared to classical methods. In our study, a synergistic gender recognition approach based on hybrid deep learning was created based on the use of human ear images in classifying people fully automatically according to their gender. By means of hybridization, hybrid deep neural network architectural models are used, which include both convolutional neural network component and recurrent neural network type components together. In these models, long-short term memory and gated recurrent unit are taken as recurrent neural network type components. Thanks to these components, the hybrid model extracts the relational dependencies between the pixel regions in the image very well. On account of this synergistic approach, the gender classification accuracy of hybrid models is higher than the standalone convolutional neural network model in our study. Two different image datasets with gender marking were used in our experiments. The reliability of the experimental results has been proven by objective metrics. In the conducted experiments, the highest values in gender recognition with hybrid models were obtained with the test accuracy of 85.16% for the EarVN dataset and 87.61% for the WPUT dataset, respectively. Discussion and conclusions are included in the last section of our study.
Human Ear Gender Recognition Deep Learning Convolutional Neural Network Recurrent Neural Network
Günümüzde insan kulak görüntülerinin kullanımı, biyometrik yetkilendirme ve gözetleme sistemlerinin sürdürülebilirliği adına önem kazanmaktadır. Güncel çalışmalar, böyle işlemlerin el ile yapılması yerine yarı otomatik veya tam otomatik olarak yapılabileceğini göstermektedir. Derin öğrenme soyut öznitelikleri (temsili öğrenme) kullanması nedeniyle klasik yöntemlere göre oldukça yüksek başarım değerlerine ulaşmaktadır. Çalışmamızda insanların cinsiyetlerine göre tam otomatik olarak sınıflandırılmasında insan kulağı görüntülerinin kullanımına dayanan melez derin öğrenme tabanlı sinerjik bir cinsiyet tanıma yaklaşımı oluşturulmuştur. Melezleme yoluyla hem evrişimli sinir ağı bileşeni hem de tekrarlayan sinir ağı tipli bileşenlerini bir arada içeren melez derin sinir ağı mimari modelleri kullanılmıştır. Bu modellerde tekrarlayan sinir ağı tipi bileşenler olarak uzun kısa süreli bellek ve kapılı tekrarlayan birim alınmıştır. Bu bileşenler sayesinde melez model görüntü içerisindeki piksel bölgeleri arasındaki ilişkisel bağımlılıkları oldukça iyi elde etmektedir. Bu sinerjik yaklaşım sayesinde çalışmamızdaki tek başına evrişimli sinir ağı modeline göre melez modellerin cinsiyet sınıflandırma doğruluğu daha yüksek olmaktadır. Cinsiyet işaretlemesine sahip iki farklı görüntü veri kümesi deneylerimizde kullanılmıştır. Deneysel sonuçların güvenirliği nesnel ölçütlerle kanıtlanmıştır. Yapılan deneylerde melez modellerle yapılan cinsiyet tanımada en yüksek değerler sırasıyla, EarVN veri kümesi için test doğruluğu %85,16 ve WPUT veri kümesi için test doğruluğu %87,61 oranlarında elde edilmiştir. Çalışmamızın son bölümünde tartışma ve sonuçlara yer verilmektedir.
İnsan Kulağı Cinsiyet Tanıma Derin Öğrenme Evrişimli Sinir Ağı Tekrarlayıcı Sinir Ağı
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 28 Şubat 2022 |
Gönderilme Tarihi | 30 Mayıs 2021 |
Kabul Tarihi | 16 Ekim 2021 |
Yayımlandığı Sayı | Yıl 2022 |