Araştırma Makalesi

Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)

Cilt: 11 Sayı: 2 31 Aralık 2025
PDF İndir
TR EN

Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)

Öz

Bu çalışmada GitHub platformunda 2011–2021 dönemine ait farklı programlama dillerinin depo (repository), çekme isteği (PR) ve sorun (issue) verileri kullanılarak, dillerin popülerliği zaman serisi tabanlı makine öğrenmesi yöntemleriyle tahmin edilmiştir. Üç farklı kaynaktan bütünleştirilen veri kümesi, dil–yıl–çeyrek düzeyinde PR, issue ve depo sayılarını içermekte; farklı kaynaklardan elde edilen metrikler tek bir zaman çizelgesinde birleştirilerek her dil için çeyreklik gözlemler üzerinden modelleme yapılmasına olanak vermektedir. Öznitelik mühendisliği sonrasında lojistik regresyon, karar ağaçları, rastgele orman, destek vektör makineleri ve gradyan artırma yöntemleri uygulanmıştır. Bulgular, Lojistik Regresyonun (AUC=0,996), Rastgele Ormanın (AUC=0,994) ve SVM’nin (AUC=0,988) güçlü ayırt edicilik sağladığını; Karar Ağaçları ve Gradyan Artırmanın ise yüksek doğruluk değerlerine rağmen ROC-AUC açısından daha zayıf kaldığını göstermektedir. Bu kapsamda, doğruluk ile ROC-AUC’nin birlikte raporlanması yöntemler arasındaki ayrım gücünü daha görünür kılmaktadır. Ayrıca analizler, Python ve JavaScript gibi dillerin uzun vadeli yükselişini doğrulamış, karar ağaçları ve gradyan artırma nadir dönemlerde öne çıkan dilleri yakalamada daha dengeli sonuçlar sunmuştur.

Anahtar Kelimeler

Destekleyen Kurum

Herhangi bir kurum tarafından desteklenmemiştir.

Proje Numarası

Çalışma, herhangi bir proje tarafından desteklenmemiştir.

Etik Beyan

Yazarlar arasında çıkar çatışması bulunmamaktadır.

Kaynakça

  1. Biau, G., & Scornet, E. (2016). A random forest guided tour. Test, 25(2), 197–227. https://doi.org/10.1007/s11749-016-0481-7
  2. Bissyandé, T. F., Lo, D., Jiang, L., Réveillère, L., Klein, J., & Le Traon, Y. (2013). Got issues? Who cares about it? A large scale investigation of issue trackers from GitHub. 2013 IEEE 24th International Symposium on Software Reliability Engineering (ISSRE), 188–197. IEEE. https://doi.org/10.1109/ISSRE.2013.6698917
  3. Borges, H., Hora, A., & Valente, M. T. (2016). Predicting the popularity of GitHub repositories. Proceedings of the 12th International Conference on Predictive Models and Data Analytics in Software Engineering (PROMISE 2016), 1–10. ACM. https://doi.org/10.1145/2972958.2972966
  4. Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. Wadsworth International Group.
  5. Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
  6. Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794. https://doi.org/10.1145/2939672.2939785
  7. Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273–297. https://doi.org/10.1007/BF00994018
  8. Cox, D. R. (1958). The regression analysis of binary sequences. Journal of the Royal Statistical Society: Series B (Methodological), 20(2), 215–242.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Yazılımı, Programlama Dilleri, Pekiştirmeli Öğrenme, Yazılım Mühendisliği (Diğer)

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

31 Aralık 2025

Gönderilme Tarihi

24 Eylül 2025

Kabul Tarihi

27 Kasım 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 11 Sayı: 2

Kaynak Göster

APA
Uğurlu, B., & Karasulu, B. (2025). Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science, 11(2), 351-365. https://doi.org/10.34186/klujes.1790613
AMA
1.Uğurlu B, Karasulu B. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). KLUJES. 2025;11(2):351-365. doi:10.34186/klujes.1790613
Chicago
Uğurlu, Bora, ve Bahadir Karasulu. 2025. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science 11 (2): 351-65. https://doi.org/10.34186/klujes.1790613.
EndNote
Uğurlu B, Karasulu B (01 Aralık 2025) Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). Kirklareli University Journal of Engineering and Science 11 2 351–365.
IEEE
[1]B. Uğurlu ve B. Karasulu, “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”, KLUJES, c. 11, sy 2, ss. 351–365, Ara. 2025, doi: 10.34186/klujes.1790613.
ISNAD
Uğurlu, Bora - Karasulu, Bahadir. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science 11/2 (01 Aralık 2025): 351-365. https://doi.org/10.34186/klujes.1790613.
JAMA
1.Uğurlu B, Karasulu B. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). KLUJES. 2025;11:351–365.
MLA
Uğurlu, Bora, ve Bahadir Karasulu. “Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021)”. Kirklareli University Journal of Engineering and Science, c. 11, sy 2, Aralık 2025, ss. 351-65, doi:10.34186/klujes.1790613.
Vancouver
1.Bora Uğurlu, Bahadir Karasulu. Zaman Serisi Tabanlı Makine Öğrenmesi Modelleri ile GitHub Projelerindeki Programlama Dili Popülerliğinin Tahmini (2011–2021). KLUJES. 01 Aralık 2025;11(2):351-65. doi:10.34186/klujes.1790613