ARAÇLARIN KRİTİK ARALIK KABUL KARARLARININ PEKİŞTİRMELİ ÖĞRENMEYLE SİMÜLASYONU
Öz
Bu çalışma pekiştirmeli öğrenme yöntemini kullanarak araçların kritik aralık kabul kararlarının basit bir T-kavşakta modellemesini sunmaktadır. Önerilen yaklaşım araçların ulaşım ağlarındaki nihai amaçlarının bekleme sürelerini ve risklerini optimize edeceklerini varsayarak basit bir kritik aralık kabul kararını pekiştirmeli öğrenme problemine çevirmektedir. Trafik simülasyon yazılımında sürücüler kararlarının yol açacağı sonuçları bilmeyerek hareket eder, fakat bir çok simülasyon episodu sonrasında eylemlerinin sonuçlarını bekleme süresi ve risk şeklinde öğrenmeye başlarlar. Gerçek bir dönel kavşağın Paramics trafik simülasyon modeli deneysel analizler için kullanılmıştır. Elde edilen sonuçlara göre kullanılan bu simülasyon modeli “Q-learning” öğrenme yöntemi kullanılınca sürücülerin kritik aralık kabul kararlarının doğrulaması kolaylıkla yapılabilmektedir.
Anahtar Kelimeler
Kaynakça
- Abdulhai, B. and Kattan, L. (2003) Reinforcement Learning: Introduction to Theory and Potential for Transport Applications, Canadian Journal of Civil Engineering, 30, 981-991. doi: 10.1139/l03-014
- Abdulahi, B., Pringle, R. and Karakoulas, G. J. 2003. Reinforcement learning for true adaptive traffic signal control. Journal of Transportation Engineering. Vol. 129. No.3. pp. 278-285. doi: 10.1061/(ASCE)0733-947X(2003)129:3(278)
- Arel, I., Liu, C., Urbanik, T. and Kohls, A. G. (2010) Reinforcement learning based multi-agent system for network traffic signal control, IET Intelligent Transportation Systems, 4(2), 128–135. doi: 10.1049/iet-its.2009.0070
- Ashton, W. D. (1971) Gap acceptance problems at a traffic intersection, Applied Statistics, 20(2), 130-138. doi: 10.2307/2346461
- Bartin, B., Ozbay, K., Yanmaz-Tuzel, O. and List, G. (2006) Modeling and Simulation of Unconventional Traffic Circles, Transportation Research Journal: Journal of the Transportation Research Board, 1965, 201-209. doi: 10.3141/1965-21
- Barton, R. R., and Schruben, L. W. (2001) Resampling methods for input modeling, Proceedings of the 2001 Winter Simulation Conference, 1, 372–378. doi: 10.1109/WSC.2001.977303
- Bazzan, A. L. C., Oliveira, D. and Silva, B. C. (2010) Learning in groups of traffic signals, Engineering Applications of Artificial Intelligence, 23, 560-568. doi: 10.1016/j.engappai.2009.11.009
- Bingham, E. (2001) Reinforcement learning in neurofuzzy traffic signal control, European Journal of Operation Research, 131, 232-241. doi: 10.1016/S0377-2217(00)00123-5
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yazarlar
Bekir Oğuz Bartın
Bu kişi benim
Yayımlanma Tarihi
19 Eylül 2017
Gönderilme Tarihi
8 Nisan 2016
Kabul Tarihi
1 Ağustos 2017
Yayımlandığı Sayı
Yıl 2017 Cilt: 22 Sayı: 2