Java, çeşitli alanlarda uzun zamandır yaygın olarak kullanılan bir programlama dilidir. Java ve kütüphaneleri; hatalar, değişiklik istekleri, performans ve kullanılabilirlik gereksinimleri vb. gibi çeşitli sebeplerle sık sık güncellenmektedir. Bu makalede, bu değişikliklerin Java kullanımını nasıl etkilediği ve kullanımındaki eğilimler analiz edilmiştir. Veri kaynağı olarak, yazılım teknolojileri alanındaki en büyük çevrimiçi soru-cevap sitesi olan Stack Overflow genel veri kümesi kullanılmıştır. İlk olarak, Stack Overflow veri kümesinde Java ile ilgili sorulmuş tüm soru-cevap gönderilerini bulmak için kosinüs benzerliği kullanan pratik bir yaklaşım önerilmiş ve bu yaklaşım daha önceki yaklaşımlarla karşılaştırılmıştır. Daha sonra, oluşturulan derlem üzerinde konu modelleme yapmak için Gizli Dirichlet Ayırımı yöntemi kullanılarak ana konular belirlenmiş; ana konular ve anahtar kelimeler yıllara göre incelenmiştir. Son olarak, konular “alana özgü” ve “geliştirme ortamıyla ilgili” konular olarak sınıflandırıp, bu sınıfların hem kısa vadede hem de uzun vadede değişme eğilimleri araştırılmıştır.
Java has been a widely used programming language for a long time in various fields. Java and its libraries have been frequently updated for various reasons including bugs, change requests, performance and usability requirements and so on. In this paper, we examine how these changes affect the use of Java and analyze trends in its usage. As a data source, we use the Stack Overflow public dataset which is the largest online Q&A site about software technologies. We firstly employ a practical approach to extract the Java-related posts from the Stack Overflow dataset using cosine similarity and compare it with previous works. We then apply Latent Dirichlet Allocation (LDA) to the corpus for topic modelling. We divided the data set into two-year periods to obtain consistent clusters. After obtaining main topics, we examine topics and keywords on a two-year basis. Finally, unlikely previous works, we manually classify topics into two as “domain-specific” and “development environment” and investigate tendencies of these classes to change in both the short term and the long term.
Primary Language | English |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | August 31, 2020 |
Published in Issue | Year 2020 Issue: 19 |