Araştırma Makalesi

Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları

Cilt: 5 Sayı: 1 24 Mayıs 2026
PDF İndir
TR EN

Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları

Öz

Doğrusal ters sarkaç (LIP) sistemleri, doğal kararsızlıkları ve doğrusal olmayan hızlı dinamikleri nedeniyle kontrol algoritmalarının performansının değerlendirilmesinde temel bir kıyaslama problemi olarak kabul edilir. Bu çalışmada, sistemin dinamik modelini lineerize etmeye gerek duymayan, modelden bağımsız bir Derin Pekiştirmeli Öğrenme (Deep Reinforcement Learning - DRL) yöntemi olan Derin Q-Ağı (DQN) algoritması kullanılarak bir kontrolcü tasarımı gerçekleştirilmiştir. MATLAB/Simulink ortamında, donanım kısıtlarına uygun ayrıklaştırılmış bir eylem uzayı ve enerji verimliliğini hedefleyen karesel bir ödül fonksiyonu ile eğitilen ajan, simülasyon testlerinde sarkacı düşey konumundan kaldırmış ve dikey denge konumunda başarıyla stabilize etmiştir. Çalışmanın özgün yanı, simülasyonda doğrulanan ajanın fiziksel deney düzeneğine entegrasyonu sırasında karşılaşılan "Simülasyondan Gerçeğe Geçiş" (Sim-to-Real Gap) probleminin deneysel olarak analiz edilmesidir. Simülasyon ortamında 20 ms örnekleme zamanı varsayımıyla mükemmel sonuç veren kontrolcü, gerçek donanım üzerinde Derin Sinir Ağı'nın hesaplama maliyeti ve veri iletim gecikmeleri nedeniyle kontrol döngüsünü ancak 80 ms sürede tamamlayabilmiştir. Bu gecikme, hızlı dinamiklere sahip sarkaç sisteminin kararsızlığa sürüklenmesine ve denge kaybına yol açmıştır. Elde edilen bulgular, DRL algoritmalarının gömülü sistemlerde uygulanabilirliği için hesaplama verimliliğinin ve donanım kısıtlarının eğitim sürecine dahil edilmesinin kritik önemini ortaya koymaktadır.

Anahtar Kelimeler

Kaynakça

  1. R. Özalp, N. K. Varol, B. Taşci, and A. Uçar, “A Review of Deep Reinforcement Learning Algorithms and Comparative Results on Inverted Pendulum System,” in Machine Learning Paradigms: Advances in Deep Learning-based Technological Applications, 1st ed., Springer, 2020, 237–256.
  2. X. Bajrami, A. Pajaziti, R. Likaj, A. Shala, R. Berisha, and M. Bruqi, “Control theory application for swing up and stabilisation of rotating inverted pendulum,” Symmetry, 13(8), p. 1491, 2021.
  3. T. N. Ho and V.-D.-H. Nguyen, “Model-free swing-up and balance control of a rotary inverted pendulum using the TD3 algorithm: Simulation and experiments,” Eng. Technol. Appl. Sci. Res., 15(1), 19316–19323, 2025.
  4. D. Ju, J. Lee, and Y. S. Lee, “Sim-to-real reinforcement learning for a rotary double-inverted pendulum based on a mathematical model,” Mathematics, 13(12), 1996, 2025.
  5. T. Glück, A. Eder, and A. Kugi, “Swing-up control of a triple pendulum on a cart with experimental validation,” Automatica, 49(3), 801–808, 2013.
  6. R. Liu, F. Nageotte, P. Zanne, M. De Mathelin, and B. Dresp-Langley, “Deep reinforcement learning for the control of robotic manipulation: A focussed mini-review,” Robotics, 10(1), 22, Jan. 2021.
  7. J. Terven, “Deep reinforcement learning: A chronological overview and methods,” AI, 6(3), 46, Feb. 2025.
  8. V. Mnih, K. Kavukcuoglu, D. Silver, A. Graves, I. Antonoglou, D. Wierstra, and M. Riedmiller, “Playing Atari with deep reinforcement learning,” arXiv preprint arXiv:1312.5602, 2013.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Kontrol Mühendisliği

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

24 Mayıs 2026

Gönderilme Tarihi

16 Aralık 2025

Kabul Tarihi

19 Şubat 2026

Yayımlandığı Sayı

Yıl 2026 Cilt: 5 Sayı: 1

Kaynak Göster

APA
Köybaşı, E., & Bıçakçı, S. (2026). Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. Türk Mühendislik Araştırma ve Eğitimi Dergisi, 5(1), 8-16. https://izlik.org/JA96MY52RH
AMA
1.Köybaşı E, Bıçakçı S. Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. TMAED. 2026;5(1):8-16. https://izlik.org/JA96MY52RH
Chicago
Köybaşı, Erman, ve Sabri Bıçakçı. 2026. “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”. Türk Mühendislik Araştırma ve Eğitimi Dergisi 5 (1): 8-16. https://izlik.org/JA96MY52RH.
EndNote
Köybaşı E, Bıçakçı S (01 Mayıs 2026) Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. Türk Mühendislik Araştırma ve Eğitimi Dergisi 5 1 8–16.
IEEE
[1]E. Köybaşı ve S. Bıçakçı, “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”, TMAED, c. 5, sy 1, ss. 8–16, May. 2026, [çevrimiçi]. Erişim adresi: https://izlik.org/JA96MY52RH
ISNAD
Köybaşı, Erman - Bıçakçı, Sabri. “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”. Türk Mühendislik Araştırma ve Eğitimi Dergisi 5/1 (01 Mayıs 2026): 8-16. https://izlik.org/JA96MY52RH.
JAMA
1.Köybaşı E, Bıçakçı S. Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. TMAED. 2026;5:8–16.
MLA
Köybaşı, Erman, ve Sabri Bıçakçı. “Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları”. Türk Mühendislik Araştırma ve Eğitimi Dergisi, c. 5, sy 1, Mayıs 2026, ss. 8-16, https://izlik.org/JA96MY52RH.
Vancouver
1.Erman Köybaşı, Sabri Bıçakçı. Doğrusal Ters Sarkaç Kontrolünde Derin Q-Ağı Yaklaşımı: Simülasyon Başarımı ve Gerçek Zamanlı Uygulama Kısıtları. TMAED [Internet]. 01 Mayıs 2026;5(1):8-16. Erişim adresi: https://izlik.org/JA96MY52RH