TR
EN
Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi
Öz
Otomatik makine öğrenimi (AutoML) ve derin sinir ağları birçok hiperparametreye sahiptir. Karmaşık ve hesapsal maliyet olarak pahalı makine öğrenme modellerine son zamanlarda ilginin artması, hiperparametre optimizasyonu (HPO) araştırmalarının yeniden canlanmasına neden olmuştur. HPO’un başlangıcı epey uzun yıllara dayanmaktadır ve derin öğrenme ağları ile popülaritesi artmıştır. Bu makale, HPO ile ilgili en önemli konuların gözden geçirilmesini sağlamaktadır. İlk olarak model eğitimi ve yapısı ile ilgili temel hiperparametreler tanıtılmakta ve değer aralığı için önemleri ve yöntemleri tartışılmaktadır. Sonrasında, özellikle derin öğrenme ağları için etkinliklerini ve doğruluklarını kapsayan optimizasyon algoritmalarına ve uygulanabilirliklerine odaklanılmaktadır. Aynı zamanda bu çalışmada HPO için önemli olan ve araştırmacılar tarafından tercih edilen HPO kitlerini incelenmiştir. İncelenen HPO kitlerinin en gelişmiş arama algoritmaları, büyük derin öğrenme araçları ile fizibilite ve kullanıcılar tarafından tasarlanan yeni modüller için genişletilebilme durumlarını karşılaştırmaktadır. HPO derin öğrenme algoritmalarına uygulandığında ortaya çıkan problemler, optimizasyon algoritmaları arasında bir karşılaştırma ve sınırlı hesaplama kaynaklarına sahip model değerlendirmesi için öne çıkan yaklaşımlarla sonuçlanmaktadır.
Anahtar Kelimeler
Kaynakça
- [1] Sculley, D., Snoek, J., Wiltschko, A., and Rahimi, A., (2018).Winner’s curse? On Pace, Progress, and Empirical Rigor, In: International Conference on Learning Representations Workshop track, published online: iclr.cc
- [2] King, R. D., Feng, C., & Sutherland, A. (1995). Statlog: comparison of classification algorithms on large real-world problems. Applied Artificial Intelligence an International Journal, 9(3), 289-333.
- [3] Kohavi, R., & John, G. H. (1995). Automatic parameter selection by minimizing estimated error. In Machine Learning Proceedings 1995 (pp. 304-312). Morgan Kaufmann.
- [4] Michie, D., Spiegelhalter, D. J., & Taylor, C. C. (1994). Machine learning. Neural and Statistical Classification, 13(1994), 1-298.
- [5] Ripley, B. D. (1993). Statistical aspects of neural networks. Networks and chaos—statistical and probabilistic aspects, 50, 40-123.
- [6] Rodriguez, J. (2018). Understanding Hyperparameters Optimization in Deep Learning Models: Concepts and Tools.
- [7] Tan, M., & Le, Q. V. (2019). Efficientnet: Rethinking model scaling for convolutional neural networks. arXiv preprint arXiv:1905.11946.
- [8] Ma, N., Zhang, X., Zheng, H. T., & Sun, J. (2018). Shufflenet v2: Practical guidelines for efficient cnn architecture design. In Proceedings of the European conference on computer vision (ECCV) (pp. 116-131).
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
Derleme
Yayımlanma Tarihi
30 Mart 2021
Gönderilme Tarihi
10 Temmuz 2020
Kabul Tarihi
2 Aralık 2020
Yayımlandığı Sayı
Yıl 2021 Cilt: 12 Sayı: 2
APA
Altun, S., & Talu, M. F. (2021). Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, 12(2), 187-199. https://doi.org/10.24012/dumf.767700
AMA
1.Altun S, Talu MF. Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. DÜMF MD. 2021;12(2):187-199. doi:10.24012/dumf.767700
Chicago
Altun, Sara, ve Muhammed Fatih Talu. 2021. “Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12 (2): 187-99. https://doi.org/10.24012/dumf.767700.
EndNote
Altun S, Talu MF (01 Mart 2021) Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12 2 187–199.
IEEE
[1]S. Altun ve M. F. Talu, “Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi”, DÜMF MD, c. 12, sy 2, ss. 187–199, Mar. 2021, doi: 10.24012/dumf.767700.
ISNAD
Altun, Sara - Talu, Muhammed Fatih. “Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12/2 (01 Mart 2021): 187-199. https://doi.org/10.24012/dumf.767700.
JAMA
1.Altun S, Talu MF. Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. DÜMF MD. 2021;12:187–199.
MLA
Altun, Sara, ve Muhammed Fatih Talu. “Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, c. 12, sy 2, Mart 2021, ss. 187-99, doi:10.24012/dumf.767700.
Vancouver
1.Sara Altun, Muhammed Fatih Talu. Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. DÜMF MD. 01 Mart 2021;12(2):187-99. doi:10.24012/dumf.767700
Cited By
Hyperparameter optimization of pre-trained convolutional neural networks using adolescent identity search algorithm
Neural Computing and Applications
https://doi.org/10.1007/s00521-023-09121-8Evaluation of YOLOv8 Model Series with HOP for Object Detection in Complex Agriculture Domains
International Journal of Pure and Applied Sciences
https://doi.org/10.29132/ijpas.1448068