University Information Management System (ÜBYS) is being developed within our institution (İzmir Kâtip Çelebi University) and various institutions outside of our own institution use different components under UBYS. Various errors may arise in the process in line with the size of the software and arise from the nature of the software development, and various improvements are requested regardless of the errors that occur. In this study, we present a topic modelling based analysis on service support requests provided by different institutions and people on university information manament system. Topic models that arise because of topic modelling of service support requests can be regarded as key concepts derived from the data collection. The issues raised are expressed as a collection of terms, but are of great value to summarize most of the text documents (UBYS service support requests). Moreover, hidden patterns and semantics in the data are revealed. Topic modeling helps us understand large collections of unstructured text bodies, organize and present information. Latent Dirichlet allocation, which is used for topic modeling, is an important method of topic modeling in which each document is considered a collection of topics and each word in the document corresponds to one of the topics. Therefore, when a document (text data) is given, LDA clusters each subject group into subject groups with a set of words that best describe that group based on the document. In this study, four components, namely, Student Information System (AIS), Personnel Information System (HRM), Electronic Document Management System (ERMS) and Scientific Research Projects (SRP) within the body of information system are taken into account. Analysis of the service support requests of these components has been carried out by latent Dirichlet allocation, which is one of the most basic methods for topic modeling. The study presents the main results and visualizations obtained by the latent Dirichlet allocation method.
Software Development Service Support Requests Text Mining Topic Modelling Latent Dirichlet Allocation
Kurumumuz (İzmir Kâtip Çelebi Üniversitesi) bünyesinde Üniversite Bilgi Yönetim Sistemi(ÜBYS) geliştirilmekte ve kendi kurumumuz dışında çeşitli kurumlar tarafından da ÜBYS altındaki farklı bileşenler kullanılmaktadır. Yazılım geliştirmenin doğasından kaynaklanan ve yazılımın büyüklüğü ile doğru orantılı olarak süreç içerisinde çeşitli hatalar oluşabilmekte, oluşan hatalardan bağımsız olarak çeşitli geliştirmelerin yapılması istenmektedir. Bu çalışmada, Üniversite Bilgi Yönetim Sistemi(ÜBYS) geliştirilirken farklı kurum ve bu kurumlardaki kişilerden gelen hata bildirimi ve isteklerin konu modelleme yöntemlerine dayalı analizi gerçekleştirilmektedir. Servis destek taleplerinin konu modellemesi sonucunda ortaya çıkan konu modelleri ÜBYS servis destek veri koleksiyonundan bulunup çıkartılan anahtar kavramlar olarak adlandırılabilirler. Çıkartılan konular bir terim koleksiyonu olarak ifade edilmekle birlikte metin dokümanlarının (ÜBYS servis destek taleplerinin) büyük bir kısmını özetlemek için çok değerlidir. Dahası verilerdeki gizlikalmış kalıplar ve anlamsallık ortaya çıkarılmış olmaktadır. Büyük boyutlu dokümanlardan denetimsiz bir şekilde gizli yapıyı keşfeden konu modeleme güçlü bir yöntemdir. Konu modelleme yapılandırılmamış (unstructured) metin gövdelerinin büyük koleksiyonlarını anlamamıza, bilgileri düzenlememize ve sunmamıza yardımcı olur. Konu modellemesi için kullanılan gizli Dirichlet tahsisi (latent Dirichlet allocation), her belgenin bir konu koleksiyonu olarak kabul edildiği ve belgedeki her kelimenin konulardan birine karşılık geldiği bir konu modelleme yöntemidir. Dolayısıyla, bir belge(metin verisi) verildiğinde LDA, belgeyi temel alarak her konu grubunu o grubu en iyi açıklayan bir dizi kelimenin olduğu konu gruplarına kümeler. Bu çalışmada ÜBYS bünyesindeki Öğrenci Bilgi Sistemi (AIS), Personel Bilgi Sistemi (HRM), Elektronik Belge Yönetim Sistemi(ERMS) ve Bilimsel Araştırma Projeleri (SRP) olmak üzere dört bileşen ele alınmıştır. Bu bileşenlere ait servis destek taleplerinin konu modellemesi için en temel yöntemlerden biri olan gizli Dirichlet tahsisi ile analizi gerçekleştirilmiştir. Bileşenlerden elde edilen metin belgeleri üzerinde temel konulara ve konulara ilişkin temel anahtar sözcüklere ilişkin analiz ve görseller sunulmaktadır.
Yazılım Geliştirme Servis Destek Talepleri Metin Madenciliği Konu Modelleme Gizli Dirichlet Tahsisi
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 15 Ağustos 2020 |
Yayımlandığı Sayı | Yıl 2020 Ejosat Özel Sayı 2020 (HORA) |