In this study, portfolio optimization has been conducted using the reinforcement learning approach, one of the artificial intelligence algorithms. The data is considered for constituents of BIST30 index, which is the blue-chip index of Borsa Istanbul. The performance of Deep Deterministic Policy Gradient (DDPG), a deep learning algorithm of reinforcement learning, has been tested against to the Markowitz mean-variance and equal-weighted portfolios as benchmark models, the BIST30 index itself has also been taken as a benchmark portfolio. This study contributes to the relevant literature in terms of Türkiye as an example of a developing country and the method employed. The study demonstrates the potentiality of RL approaches that are becoming widespread for portfolio optimization. The obtained results reveal that the portfolio formed with the DDPG approach show a superior portfolio over portfolios obtained with other classical approaches. These findings, while highlighting the potential of RL approaches in practice, emerge as an alternative option for fund managers, especially in a volatile market environment.
Reinforcement Learning Portfolio Optimization Borsa Istanbul DDPG Markowitz Model Emerging Markets.
The author declares that this study was conducted in accordance with ethical principles and academic integrity. No human participants or personal data were used, and there is no conflict of interest to declare.
This research did not receive any specific grant from funding agencies in the public, commercial, or not-for-profit sectors.
Authors would like to thank the organizers of the IERFM2025 Conference for the opportunity to present the preliminary version of this study and the participants for their valuable feedback and suggestions.
Bu çalışmada, yapay zekâ algoritmalarından biri olan pekiştirmeli öğrenme yaklaşımı kullanılarak portföy optimizasyonu gerçekleştirilmiştir. Veriler, Borsa İstanbul'un endeksi olan BIST30 endeksinin bileşenleri için ele alınmıştır. Takviyeli öğrenmenin derin öğrenme algoritmalarından biri olan Derin Deterministik Politika Gradyanının (DDPG) performansı, kıyaslama modeli olarak Markowitz ortalama-varyans ve eşit ağırlıklı portföylere karşı test edilmiş, ayrıca BIST30 endeksinin kendisi de kıyaslama portföyü olarak alınmıştır. Bu çalışma, gelişmekte olan bir ülke örneği olarak Türkiye ve kullanılan yöntem açısından ilgili literatüre katkıda bulunmaktadır. Çalışma, giderek yaygınlaşan RL yaklaşımlarının portföy optimizasyonu için potansiyelini göstermektedir. Elde edilen sonuçlar, DDPG yaklaşımıyla oluşturulan portföyün, diğer klasik yaklaşımlarla elde edilen portföylere göre daha üstün bir portföy gösterdiğini ortaya koymaktadır. Bu bulgular, RL yaklaşımlarının pratikteki potansiyelini vurgularken, özellikle dalgalı piyasa ortamında fon yöneticileri için alternatif bir seçenek olarak ortaya çıkmaktadır.
Pekiştirmeli Öğrenme Portföy Optimizasyonu Borsa İstanbul DDPG Markowitz Modeli Gelişmekte Olan Piyasalar
Yazarlar, bu çalışmanın etik kurallara ve akademik dürüstlük ilkelerine uygun olarak yürütüldüğünü beyan eder. Çalışmada insan katılımcılardan veya kişisel verilerden yararlanılmamış olup çıkar çatışması bulunmamaktadır.
Bu araştırma, kamu, ticari veya kar amacı gütmeyen finansman kuruluşlarından herhangi bir özel destek almamıştır.
Bu çalışmanın öncül sürümünü sunma fırsatı tanıyan IERFM2025 Kongresi düzenleyicilerine ve değerli görüşleriyle katkı sağlayan katılımcılara teşekkür eder.
| Birincil Dil | İngilizce |
|---|---|
| Konular | Yatırımlar ve Portföy Yönetimi |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 27 Ekim 2025 |
| Kabul Tarihi | 17 Mart 2026 |
| Yayımlanma Tarihi | 31 Mart 2026 |
| DOI | https://doi.org/10.30784/epfad.1811319 |
| IZ | https://izlik.org/JA43NB89ZH |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 11 Sayı: 1 |