TR
EN
Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)
Öz
Bu çalışmada GitHub platformunda 2011–2021 dönemine ait farklı programlama dillerinin depo (repository), çekme isteği (PR) ve sorun (issue) verileri kullanılarak, dillerin popülerliği zaman serisi tabanlı makine öğrenmesi yöntemleriyle tahmin edilmiştir. Üç farklı kaynaktan bütünleştirilen veri kümesi, dil–yıl–çeyrek düzeyinde PR, issue ve depo sayılarını içermekte; farklı kaynaklardan elde edilen metrikler tek bir zaman çizelgesinde birleştirilerek her dil için çeyreklik gözlemler üzerinden modelleme yapılmasına olanak vermektedir. Öznitelik mühendisliği sonrasında lojistik regresyon, karar ağaçları, rastgele orman, destek vektör makineleri ve gradyan artırma yöntemleri uygulanmıştır. Bulgular, Lojistik Regresyonun (AUC=0,996), Rastgele Ormanın (AUC=0,994) ve SVM’nin (AUC=0,988) güçlü ayırt edicilik sağladığını; Karar Ağaçları ve Gradyan Artırmanın ise yüksek doğruluk değerlerine rağmen ROC-AUC açısından daha zayıf kaldığını göstermektedir. Bu kapsamda, doğruluk ile ROC-AUC’nin birlikte raporlanması yöntemler arasındaki ayrım gücünü daha görünür kılmaktadır. Ayrıca analizler, Python ve JavaScript gibi dillerin uzun vadeli yükselişini doğrulamış, karar ağaçları ve gradyan artırma nadir dönemlerde öne çıkan dilleri yakalamada daha dengeli sonuçlar sunmuştur.
Anahtar Kelimeler
Destekleyen Kurum
Herhangi bir kurum tarafından desteklenmemiştir.
Proje Numarası
Çalışma, herhangi bir proje tarafından desteklenmemiştir.
Etik Beyan
Yazarlar arasında çıkar çatışması bulunmamaktadır.
Kaynakça
- Biau, G., & Scornet, E. (2016). A random forest guided tour. Test, 25(2), 197–227. https://doi.org/10.1007/s11749-016-0481-7
- Bissyandé, T. F., Lo, D., Jiang, L., Réveillère, L., Klein, J., & Le Traon, Y. (2013). Got issues? Who cares about it? A large scale investigation of issue trackers from GitHub. 2013 IEEE 24th International Symposium on Software Reliability Engineering (ISSRE), 188–197. IEEE. https://doi.org/10.1109/ISSRE.2013.6698917
- Borges, H., Hora, A., & Valente, M. T. (2016). Predicting the popularity of GitHub repositories. Proceedings of the 12th International Conference on Predictive Models and Data Analytics in Software Engineering (PROMISE 2016), 1–10. ACM. https://doi.org/10.1145/2972958.2972966
- Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. Wadsworth International Group.
- Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
- Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794. https://doi.org/10.1145/2939672.2939785
- Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273–297. https://doi.org/10.1007/BF00994018
- Cox, D. R. (1958). The regression analysis of binary sequences. Journal of the Royal Statistical Society: Series B (Methodological), 20(2), 215–242.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Bilgisayar Yazılımı, Programlama Dilleri, Pekiştirmeli Öğrenme, Yazılım Mühendisliği (Diğer)
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
31 Aralık 2025
Gönderilme Tarihi
24 Eylül 2025
Kabul Tarihi
27 Kasım 2025
Yayımlandığı Sayı
Yıl 2025 Cilt: 11 Sayı: 2
APA
Uğurlu, B., & Karasulu, B. (2025). Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science, 11(2), 351-365. https://doi.org/10.34186/klujes.1790613
AMA
1.Uğurlu B, Karasulu B. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). KLUJES. 2025;11(2):351-365. doi:10.34186/klujes.1790613
Chicago
Uğurlu, Bora, ve Bahadir Karasulu. 2025. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science 11 (2): 351-65. https://doi.org/10.34186/klujes.1790613.
EndNote
Uğurlu B, Karasulu B (01 Aralık 2025) Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science 11 2 351–365.
IEEE
[1]B. Uğurlu ve B. Karasulu, “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”, KLUJES, c. 11, sy 2, ss. 351–365, Ara. 2025, doi: 10.34186/klujes.1790613.
ISNAD
Uğurlu, Bora - Karasulu, Bahadir. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science 11/2 (01 Aralık 2025): 351-365. https://doi.org/10.34186/klujes.1790613.
JAMA
1.Uğurlu B, Karasulu B. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). KLUJES. 2025;11:351–365.
MLA
Uğurlu, Bora, ve Bahadir Karasulu. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science, c. 11, sy 2, Aralık 2025, ss. 351-65, doi:10.34186/klujes.1790613.
Vancouver
1.Bora Uğurlu, Bahadir Karasulu. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). KLUJES. 01 Aralık 2025;11(2):351-65. doi:10.34186/klujes.1790613