TR
EN
Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)
Abstract
Bu çalışmada GitHub platformunda 2011–2021 dönemine ait farklı programlama dillerinin depo (repository), çekme isteği (PR) ve sorun (issue) verileri kullanılarak, dillerin popülerliği zaman serisi tabanlı makine öğrenmesi yöntemleriyle tahmin edilmiştir. Üç farklı kaynaktan bütünleştirilen veri kümesi, dil–yıl–çeyrek düzeyinde PR, issue ve depo sayılarını içermekte; farklı kaynaklardan elde edilen metrikler tek bir zaman çizelgesinde birleştirilerek her dil için çeyreklik gözlemler üzerinden modelleme yapılmasına olanak vermektedir. Öznitelik mühendisliği sonrasında lojistik regresyon, karar ağaçları, rastgele orman, destek vektör makineleri ve gradyan artırma yöntemleri uygulanmıştır. Bulgular, Lojistik Regresyonun (AUC=0,996), Rastgele Ormanın (AUC=0,994) ve SVM’nin (AUC=0,988) güçlü ayırt edicilik sağladığını; Karar Ağaçları ve Gradyan Artırmanın ise yüksek doğruluk değerlerine rağmen ROC-AUC açısından daha zayıf kaldığını göstermektedir. Bu kapsamda, doğruluk ile ROC-AUC’nin birlikte raporlanması yöntemler arasındaki ayrım gücünü daha görünür kılmaktadır. Ayrıca analizler, Python ve JavaScript gibi dillerin uzun vadeli yükselişini doğrulamış, karar ağaçları ve gradyan artırma nadir dönemlerde öne çıkan dilleri yakalamada daha dengeli sonuçlar sunmuştur.
Keywords
Supporting Institution
The study was not supported by any project.
Project Number
Çalışma, herhangi bir proje tarafından desteklenmemiştir.
Ethical Statement
There is no conflict of interest among the authors.
References
- Biau, G., & Scornet, E. (2016). A random forest guided tour. Test, 25(2), 197–227. https://doi.org/10.1007/s11749-016-0481-7
- Bissyandé, T. F., Lo, D., Jiang, L., Réveillère, L., Klein, J., & Le Traon, Y. (2013). Got issues? Who cares about it? A large scale investigation of issue trackers from GitHub. 2013 IEEE 24th International Symposium on Software Reliability Engineering (ISSRE), 188–197. IEEE. https://doi.org/10.1109/ISSRE.2013.6698917
- Borges, H., Hora, A., & Valente, M. T. (2016). Predicting the popularity of GitHub repositories. Proceedings of the 12th International Conference on Predictive Models and Data Analytics in Software Engineering (PROMISE 2016), 1–10. ACM. https://doi.org/10.1145/2972958.2972966
- Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. Wadsworth International Group.
- Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
- Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794. https://doi.org/10.1145/2939672.2939785
- Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273–297. https://doi.org/10.1007/BF00994018
- Cox, D. R. (1958). The regression analysis of binary sequences. Journal of the Royal Statistical Society: Series B (Methodological), 20(2), 215–242.
Details
Primary Language
Turkish
Subjects
Computer Software, Programming Languages, Reinforcement Learning, Software Engineering (Other)
Journal Section
Research Article
Publication Date
December 31, 2025
Submission Date
September 24, 2025
Acceptance Date
November 27, 2025
Published in Issue
Year 2025 Volume: 11 Number: 2
APA
Uğurlu, B., & Karasulu, B. (2025). Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science, 11(2), 351-365. https://doi.org/10.34186/klujes.1790613
AMA
1.Uğurlu B, Karasulu B. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science. 2025;11(2):351-365. doi:10.34186/klujes.1790613
Chicago
Uğurlu, Bora, and Bahadir Karasulu. 2025. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri Ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science 11 (2): 351-65. https://doi.org/10.34186/klujes.1790613.
EndNote
Uğurlu B, Karasulu B (December 1, 2025) Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science 11 2 351–365.
IEEE
[1]B. Uğurlu and B. Karasulu, “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”, Kirklareli University Journal of Engineering and Science, vol. 11, no. 2, pp. 351–365, Dec. 2025, doi: 10.34186/klujes.1790613.
ISNAD
Uğurlu, Bora - Karasulu, Bahadir. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri Ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science 11/2 (December 1, 2025): 351-365. https://doi.org/10.34186/klujes.1790613.
JAMA
1.Uğurlu B, Karasulu B. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science. 2025;11:351–365.
MLA
Uğurlu, Bora, and Bahadir Karasulu. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri Ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science, vol. 11, no. 2, Dec. 2025, pp. 351-65, doi:10.34186/klujes.1790613.
Vancouver
1.Bora Uğurlu, Bahadir Karasulu. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science. 2025 Dec. 1;11(2):351-65. doi:10.34186/klujes.1790613