Deep learning (multi layer artificial neural network) is a sub-branch of machine learning that enables learning from large data sets with its layered architecture. Increased processor speeds and storage, inexpensive computer hardware and machine learning gains are factors that boost deep learning development. Gradient Descent based optimization algorithms(Stochastic gradient descent (SGD), Momentum, Adam, Adagrad, RMSProp and Adadelta) used to minimize error in deep learning are also part of this success.
In this study, deep learning and optimization algorithms were applied to the caltech 101 data set, which is an international data set. Relu was used as activation function and cross entropy was preferred as loss function. Images are resized to 64x64. Each time the program is run, a random six category image is taken and 100 iterations are executed. Different results were obtained with optimization algorithms and these results were analyzed. The success rates in classification were observed as SGD: 64.5%, Momentum: 85.56%, Adam: 92.31%, Adagrad: 71.25%, RMSProp: 40.26% and Adadelta: 86.88%.
Optimization Algorithms Deep Learning Artifical Neural Networks
Derin Öğrenme (çok katmanlı yapay sinir ağı), katmanlı mimarisiyle büyük veri setlerinden öğrenme geçekleştiren makine öğreniminin bir alt dalıdır. İşlemci hızları ve depolamadaki artış, ucuz bilgisayar donanımı ve makine öğreniminin kazanımları, derin öğrenme gelişimini yükselten faktörlerdir. Derin öğrenmede hatayı minimuma düşürmek için kullanılan Dik İniş (Gradient Descent) tabanlı optimizasyon algoritmaları da (Stochastic gradient descent (SGD), Momentum, Adam, Adagrad, RMSProp ve Adadelta), bu başarının bir parçası olmaktadır.
Bu çalışmada uluslararası bir veri seti olan Caltech 101 veri setine derin öğrenme ve optimizasyon algoritmaları uygulanmıştır. Aktivasyon fonksiyonu olarak Relu, hata fonksiyonu olarak da Cross Entropi işlemleri tercih edilmiştir. Veri setindeki imgeler 64x64’e göre yeniden boyutlandırılmıştır. Programın her çalıştırılmasında rasgele altı kategori imge alınmaktadır ve 100 iterasyon çalıştırılmaktadır. Optimizasyon algoritmaları ile farklı sonuçlar elde edilmiş ve bu sonuçlar analiz edilmiştir. Sınıflamadaki başarı oranları SGD:%64.5, Momentum:%85.56, Adam:%92.31, Adagrad:%71.25, RMSProp:%40.26 ve Adadelta:%86.88 olarak gözlemlenmiştir.
Birincil Dil | Türkçe |
---|---|
Konular | Yapay Zeka, Yazılım Mühendisliği, Bilgisayar Yazılımı, Yazılım Testi, Doğrulama ve Validasyon |
Bölüm | PAPERS |
Yazarlar | |
Yayımlanma Tarihi | 1 Aralık 2020 |
Gönderilme Tarihi | 14 Haziran 2020 |
Kabul Tarihi | 29 Eylül 2020 |
Yayımlandığı Sayı | Yıl 2020 Cilt: 5 Sayı: 2 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.