TR
EN
Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi
Abstract
Otomatik makine öğrenimi (AutoML) ve derin sinir ağları birçok hiperparametreye sahiptir. Karmaşık ve hesapsal maliyet olarak pahalı makine öğrenme modellerine son zamanlarda ilginin artması, hiperparametre optimizasyonu (HPO) araştırmalarının yeniden canlanmasına neden olmuştur. HPO’un başlangıcı epey uzun yıllara dayanmaktadır ve derin öğrenme ağları ile popülaritesi artmıştır. Bu makale, HPO ile ilgili en önemli konuların gözden geçirilmesini sağlamaktadır. İlk olarak model eğitimi ve yapısı ile ilgili temel hiperparametreler tanıtılmakta ve değer aralığı için önemleri ve yöntemleri tartışılmaktadır. Sonrasında, özellikle derin öğrenme ağları için etkinliklerini ve doğruluklarını kapsayan optimizasyon algoritmalarına ve uygulanabilirliklerine odaklanılmaktadır. Aynı zamanda bu çalışmada HPO için önemli olan ve araştırmacılar tarafından tercih edilen HPO kitlerini incelenmiştir. İncelenen HPO kitlerinin en gelişmiş arama algoritmaları, büyük derin öğrenme araçları ile fizibilite ve kullanıcılar tarafından tasarlanan yeni modüller için genişletilebilme durumlarını karşılaştırmaktadır. HPO derin öğrenme algoritmalarına uygulandığında ortaya çıkan problemler, optimizasyon algoritmaları arasında bir karşılaştırma ve sınırlı hesaplama kaynaklarına sahip model değerlendirmesi için öne çıkan yaklaşımlarla sonuçlanmaktadır.
Keywords
References
- [1] Sculley, D., Snoek, J., Wiltschko, A., and Rahimi, A., (2018).Winner’s curse? On Pace, Progress, and Empirical Rigor, In: International Conference on Learning Representations Workshop track, published online: iclr.cc
- [2] King, R. D., Feng, C., & Sutherland, A. (1995). Statlog: comparison of classification algorithms on large real-world problems. Applied Artificial Intelligence an International Journal, 9(3), 289-333.
- [3] Kohavi, R., & John, G. H. (1995). Automatic parameter selection by minimizing estimated error. In Machine Learning Proceedings 1995 (pp. 304-312). Morgan Kaufmann.
- [4] Michie, D., Spiegelhalter, D. J., & Taylor, C. C. (1994). Machine learning. Neural and Statistical Classification, 13(1994), 1-298.
- [5] Ripley, B. D. (1993). Statistical aspects of neural networks. Networks and chaos—statistical and probabilistic aspects, 50, 40-123.
- [6] Rodriguez, J. (2018). Understanding Hyperparameters Optimization in Deep Learning Models: Concepts and Tools.
- [7] Tan, M., & Le, Q. V. (2019). Efficientnet: Rethinking model scaling for convolutional neural networks. arXiv preprint arXiv:1905.11946.
- [8] Ma, N., Zhang, X., Zheng, H. T., & Sun, J. (2018). Shufflenet v2: Practical guidelines for efficient cnn architecture design. In Proceedings of the European conference on computer vision (ECCV) (pp. 116-131).
Details
Primary Language
Turkish
Subjects
-
Journal Section
Review
Publication Date
March 30, 2021
Submission Date
July 10, 2020
Acceptance Date
December 2, 2020
Published in Issue
Year 2021 Volume: 12 Number: 2
APA
Altun, S., & Talu, M. F. (2021). Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, 12(2), 187-199. https://doi.org/10.24012/dumf.767700
AMA
1.Altun S, Talu MF. Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. DUJE. 2021;12(2):187-199. doi:10.24012/dumf.767700
Chicago
Altun, Sara, and Muhammed Fatih Talu. 2021. “Derin Sinir Ağları Için Hiperparametre Metodlarının Ve Kitlerinin İncelenmesi”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12 (2): 187-99. https://doi.org/10.24012/dumf.767700.
EndNote
Altun S, Talu MF (March 1, 2021) Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12 2 187–199.
IEEE
[1]S. Altun and M. F. Talu, “Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi”, DUJE, vol. 12, no. 2, pp. 187–199, Mar. 2021, doi: 10.24012/dumf.767700.
ISNAD
Altun, Sara - Talu, Muhammed Fatih. “Derin Sinir Ağları Için Hiperparametre Metodlarının Ve Kitlerinin İncelenmesi”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12/2 (March 1, 2021): 187-199. https://doi.org/10.24012/dumf.767700.
JAMA
1.Altun S, Talu MF. Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. DUJE. 2021;12:187–199.
MLA
Altun, Sara, and Muhammed Fatih Talu. “Derin Sinir Ağları Için Hiperparametre Metodlarının Ve Kitlerinin İncelenmesi”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, vol. 12, no. 2, Mar. 2021, pp. 187-99, doi:10.24012/dumf.767700.
Vancouver
1.Sara Altun, Muhammed Fatih Talu. Derin Sinir Ağları için Hiperparametre Metodlarının ve Kitlerinin İncelenmesi. DUJE. 2021 Mar. 1;12(2):187-99. doi:10.24012/dumf.767700
Cited By
Hyperparameter optimization of pre-trained convolutional neural networks using adolescent identity search algorithm
Neural Computing and Applications
https://doi.org/10.1007/s00521-023-09121-8Evaluation of YOLOv8 Model Series with HOP for Object Detection in Complex Agriculture Domains
International Journal of Pure and Applied Sciences
https://doi.org/10.29132/ijpas.1448068