Borsa tahmini, hisse senedi fiyatlarının ya da yönlerinin tahmin edilmesinde analistler ve yatırımcılar için önemli ve aktif araştırma konusu olmuştur. Bu çalışmada, finansal duygu analizi yapılarak Borsa İstanbul 100 endeksinin yönünün tahminlenmesi amaçlanmıştır. Bildiğimiz kadarıyla bu çalışma, borsa yönü tahminlemesinde hem haber kaynağı olarak Twitter ortamını kullanması hem de bunun derin topluluk modelleriyle yapılması açısından literatürdeki ilk çalışmadır. Ancak, Twitter gibi kullanıcı fikirlerini ifade etmede boyut sınırlaması sorunuyla karşılaşılan sosyal ağlarda sınıflandırma performansı, önemli ölçüde etkilenmektedir. Buradan hareketle, veri kümelerinin anlamsal açıdan çeşitli yöntemlerle zenginleştirilmesi ve topluluk öğrenmesi yaklaşımının derin öğrenme algoritmalarıyla harmanlanarak sınıflandırma performansının iyileştirilmesi hedeflenmektedir. Bu çalışmanın literatüre katkısı dört aşamada özetlenebilir: Birincisi, Twitter ortamındaki boyut sınırlaması problemini ortadan kaldırmak amacıyla özellik kümesi anlamsal olarak zenginleştirilmiştir. İlk aşamada, veri kümesini ifade edebilecek en anlamlı özellikler, bilgi kazanımı (IG) ve karınca kolonisi optimizasyonu (ACO) yöntemleriyle seçilmiştir. Sonrasında, seçilen bu özelliklere veri kümesini anlam, bağlam ve söz dizimi açısından ifade edebilecek, borsa tahminlemesinde daha önce kullanılmamış Avg(Word2vec), Avg(Glove), Avg(Word2vec)+Avg(Glove), TF-IDF+Avg(Word2vec), TF-IDF+Avg(Glove) gibi farklı doküman gösterim teknikleri uygulanmıştır. İkincisi, sınıflandırmayı tek bir öğrenme algoritmasıyla gerçekleştirmek yerine birden fazla öğrenme algoritmalarıyla yaparak sistem performansının iyileştirilmesi amaçlanmıştır. Burada, geleneksel sınıflandırma algoritmalarını kullanmak yerine Konvolüsyonel Sinir Ağları (CNN), Tekrarlayan Sinir Ağları (RNN), Uzun Kısa Vadeli Hafıza Ağları (LSTM) gibi derin öğrenme mimarilerinin harmanlanmasıyla derin topluluk modeli (DTM) oluşturulmuştur. Üçüncüsü, derin topluluk modelinin nihai kararını elde etmek için çoğunluk oylaması (majority voting) ve yığıtlama (stacking) yöntemleri kullanılmıştır. Dördüncü olarak önerilen yaklaşımın sınıflandırma performasını iyileştirdiğini kanıtlamak amacıyla herkesin kullanımına açık Türkçe ve İngilizce Twitter veri kümeleri kullanılmıştır. Sonuç olarak, deney sonuçları önerilen modelin literatür çalışmalarıyla kıyaslandığında önceki çalışmalardan önemli ölçüde üstün olduğunu göstermektedir.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 25 Aralık 2019 |
Gönderilme Tarihi | 24 Aralık 2018 |
Kabul Tarihi | 10 Nisan 2019 |
Yayımlandığı Sayı | Yıl 2020 |