TR
EN
Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları
Öz
Doğrusal ters sarkaç (LIP) sistemleri, doğal kararsızlıkları ve doğrusal olmayan hızlı dinamikleri nedeniyle kontrol algoritmalarının performansının değerlendirilmesinde temel bir kıyaslama problemi olarak kabul edilir. Bu çalışmada, sistemin dinamik modelini lineerize etmeye gerek duymayan, modelden bağımsız bir Derin Pekiştirmeli Öğrenme (Deep Reinforcement Learning - DRL) yöntemi olan Derin Q-Ağı (DQN) algoritması kullanılarak bir kontrolcü tasarımı gerçekleştirilmiştir. MATLAB/Simulink ortamında, donanım kısıtlarına uygun ayrıklaştırılmış bir eylem uzayı ve enerji verimliliğini hedefleyen karesel bir ödül fonksiyonu ile eğitilen ajan, simülasyon testlerinde sarkacı düşey konumundan kaldırmış ve dikey denge konumunda başarıyla stabilize etmiştir. Çalışmanın özgün yanı, simülasyonda doğrulanan ajanın fiziksel deney düzeneğine entegrasyonu sırasında karşılaşılan "Simülasyondan Gerçeğe Geçiş" (Sim-to-Real Gap) probleminin deneysel olarak analiz edilmesidir. Simülasyon ortamında 20 ms örnekleme zamanı varsayımıyla mükemmel sonuç veren kontrolcü, gerçek donanım üzerinde Derin Sinir Ağı'nın hesaplama maliyeti ve veri iletim gecikmeleri nedeniyle kontrol döngüsünü ancak 80 ms sürede tamamlayabilmiştir. Bu gecikme, hızlı dinamiklere sahip sarkaç sisteminin kararsızlığa sürüklenmesine ve denge kaybına yol açmıştır. Elde edilen bulgular, DRL algoritmalarının gömülü sistemlerde uygulanabilirliği için hesaplama verimliliğinin ve donanım kısıtlarının eğitim sürecine dahil edilmesinin kritik önemini ortaya koymaktadır.
Anahtar Kelimeler
Kaynakça
- R. Özalp, N. K. Varol, B. Taşci, and A. Uçar, “A Review of Deep Reinforcement Learning Algorithms and Comparative Results on Inverted Pendulum System,” in Machine Learning Paradigms: Advances in Deep Learning-based Technological Applications, 1st ed., Springer, 2020, 237–256.
- X. Bajrami, A. Pajaziti, R. Likaj, A. Shala, R. Berisha, and M. Bruqi, “Control theory application for swing up and stabilisation of rotating inverted pendulum,” Symmetry, 13(8), p. 1491, 2021.
- T. N. Ho and V.-D.-H. Nguyen, “Model-free swing-up and balance control of a rotary inverted pendulum using the TD3 algorithm: Simulation and experiments,” Eng. Technol. Appl. Sci. Res., 15(1), 19316–19323, 2025.
- D. Ju, J. Lee, and Y. S. Lee, “Sim-to-real reinforcement learning for a rotary double-inverted pendulum based on a mathematical model,” Mathematics, 13(12), 1996, 2025.
- T. Glück, A. Eder, and A. Kugi, “Swing-up control of a triple pendulum on a cart with experimental validation,” Automatica, 49(3), 801–808, 2013.
- R. Liu, F. Nageotte, P. Zanne, M. De Mathelin, and B. Dresp-Langley, “Deep reinforcement learning for the control of robotic manipulation: A focussed mini-review,” Robotics, 10(1), 22, Jan. 2021.
- J. Terven, “Deep reinforcement learning: A chronological overview and methods,” AI, 6(3), 46, Feb. 2025.
- V. Mnih, K. Kavukcuoglu, D. Silver, A. Graves, I. Antonoglou, D. Wierstra, and M. Riedmiller, “Playing Atari with deep reinforcement learning,” arXiv preprint arXiv:1312.5602, 2013.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Kontrol Mühendisliği
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
24 Mayıs 2026
Gönderilme Tarihi
16 Aralık 2025
Kabul Tarihi
19 Şubat 2026
Yayımlandığı Sayı
Yıl 2026 Cilt: 5 Sayı: 1
APA
Köybaşı, E., & Bıçakçı, S. (2026). Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. Türk Mühendislik Araştırma ve Eğitimi Dergisi, 5(1), 8-16. https://izlik.org/JA96MY52RH
AMA
1.Köybaşı E, Bıçakçı S. Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. TMAED. 2026;5(1):8-16. https://izlik.org/JA96MY52RH
Chicago
Köybaşı, Erman, ve Sabri Bıçakçı. 2026. “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”. Türk Mühendislik Araştırma ve Eğitimi Dergisi 5 (1): 8-16. https://izlik.org/JA96MY52RH.
EndNote
Köybaşı E, Bıçakçı S (01 Mayıs 2026) Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. Türk Mühendislik Araştırma ve Eğitimi Dergisi 5 1 8–16.
IEEE
[1]E. Köybaşı ve S. Bıçakçı, “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”, TMAED, c. 5, sy 1, ss. 8–16, May. 2026, [çevrimiçi]. Erişim adresi: https://izlik.org/JA96MY52RH
ISNAD
Köybaşı, Erman - Bıçakçı, Sabri. “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”. Türk Mühendislik Araştırma ve Eğitimi Dergisi 5/1 (01 Mayıs 2026): 8-16. https://izlik.org/JA96MY52RH.
JAMA
1.Köybaşı E, Bıçakçı S. Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. TMAED. 2026;5:8–16.
MLA
Köybaşı, Erman, ve Sabri Bıçakçı. “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”. Türk Mühendislik Araştırma ve Eğitimi Dergisi, c. 5, sy 1, Mayıs 2026, ss. 8-16, https://izlik.org/JA96MY52RH.
Vancouver
1.Erman Köybaşı, Sabri Bıçakçı. Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. TMAED [Internet]. 01 Mayıs 2026;5(1):8-16. Erişim adresi: https://izlik.org/JA96MY52RH