TY - JOUR T1 - Topic Modelling of Doctoral Theses Written on Lung Cancer in Türkiye Using LDA TT - Türkiye'de Akciğer Kanseri Üzerine Yazılmış Doktora Tezlerinin LDA ile Konu Modellemesi AU - Tüfekci, Nezihe AU - Üzümcü, Fatma PY - 2025 DA - November Y2 - 2025 DO - 10.21076/vizyoner.1658488 JF - Süleyman Demirel Üniversitesi Vizyoner Dergisi JO - SDÜ Vizyoner Dergisi PB - Süleyman Demirel University WT - DergiPark SN - 1308-9552 SP - 1401 EP - 1418 VL - 16 IS - 48 LA - en AB - The aim of the study is to examine the research status, subject and content of doctoral theses on lung cancer in Türkiye. In December 2024, research documents are scanned using the text mining method in R software, employing topic-based text analysis. The search is conducted on the YOK National Thesis Centre page, selecting 'lung cancer', 'all', and 'doctorate'. The most frequently covered topics are found through the obtained thesis abstracts with the artificial intelligence-based 'Latent Dirichlet Allocation' algorithm. Content analysis is performed by examining the relationship between the subject headings and thesis abstracts. It is aimed to determine the most emphasized content in theses on lung cancer. As a result of the algorithm, the words are found to be compatible in the consistency test. The study shows that lung cancer research is mainly clinical and medical, but the data also has significant health management and health economics outputs. A detailed investigation of concepts like "quality of life, treatment process, cost, and value" identify areas for health policies and technology assessments. Latent Dirichlet Allocation (LDA) emerges as a tool to compare studies across databases, helping researchers choose topics and understand the subject density of theses conducted in Türkiye. KW - Lung Cancer KW - Thesis Analysis KW - Bioinformatics KW - Text Mining KW - Latent Dirichlet Allocation (LDA) N2 - Bu çalışmanın amacı, Türkiye'de akciğer kanseri üzerine yapılan doktora tezlerinin araştırma durumunu, konusunu ve içeriğini incelemektir. Araştırma dokümanları Aralık 2024’te R yazılımında metin madenciliği yöntemi kullanılarak konu tabanlı metin analizi ile taranmıştır. Arama, YÖK Ulusal Tez Merkezi sayfasında “akciğer kanseri”, ‘tümü’ ve “doktora” seçenekleri seçilerek gerçekleştirilmiştir. Elde edilen tez özetleri üzerinden yapay zekâ tabanlı ‘Gizli Dirichlet Ayrımı' algoritması ile en sık ele alınan konular bulunmuştur. Konu başlıkları ile tez özetleri arasındaki ilişki incelenerek içerik analizi yapılmıştır. Akciğer kanseri konulu tezlerde en çok vurgulanan içeriklerin belirlenmesi amaçlanmıştır. Algoritma sonucunda, kelimelerin tutarlılık testinde uyumlu olduğu tespit edilmiştir. Çalışma, akciğer kanserine yönelik araştırmaların ağırlıklı olarak klinik ve tıbbi nitelikte olduğunu ancak elde edilen verilerin sağlık yönetimi ve sağlık ekonomisi açısından da önemli çıktılar sağladığını göstermektedir. “Yaşam kalitesi, tedavi süreci, maliyet ve değer” gibi önemli kavramların ayrıntılı bir şekilde incelenmesi, sağlık politikaları ve teknoloji değerlendirmeleri için alanlar belirlemiştir. Gizli Dirichlet Ayrımı (GDA), veritabanları arasında çalışmaları karşılaştırmak için bir araç olarak ortaya çıkmış ve araştırmacıların konuları seçmelerine ve Türkiye'de yazılan tezlerin konu yoğunluğunu anlamalarına yardımcı olmuştur. CR - Altıntaş, V., Albayrak, M., & Topal, K. (2021). Kanser hastalığı ile ilgili paylaşımlar için dirichlet ayrımı ile gizli konu modelleme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 36(4), 2183-2196. CR - Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of Machine Learning Research, 3(Jan), 993-1022. CR - Boyd-Graber, J., Hu, Y., & Mimno, D. (2017). Applications of topic models. Foundations and Trends® in Information Retrieval, 11(2-3), 143-296. CR - Budak, İ. (2024). Labeling of European environment agency waste and recycling reports with LDA analysis. In Technical landfills and waste management: Volume 2: Municipal solid waste management (p. 285-294). Springer Nature Switzerland. CR - Criswell, K. R. (2012). A qualitative study of psychosocial needs for ındividuals with lung cancer. [Doctoral Dissertation]. Loma Linda University. CR - Ekinci, E., Omurca, S. İ., Kırık, E., & Taşçı, Ş. (2020). Tıp veri kümesi için gizli dirichlet ayrımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 22(64), 67-80. CR - Fadaka, A., Ajiboye, B., Ojo, O., Adewale, O., Olayide, I., & Emuowhochere, R. (2017). Biology of glucose metabolization in cancer cells. Journal of Oncological Sciences, 3(2), 45-51. CR - Feldman, R. & Sanger J. (2007). Text mining handbook. Cambridge Universıty Press. CR - Gridelli, C., Rossi, A., Carbone, D. P., Guarize, J., Karachaliou, N., Mok, T., ... & Rosell, R. (2015). Non-small-cell lung cancer. Nature Reviews Disease Primers, 1(1), 1-16. CR - Güneş, A., & Yıldırım, B. (2022). Eğitimde metin madenciliği ve uygulamaları. Eğitim Yayınevi. CR - Hearst, M. A. (1999). Untangling text data mining. In Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics (p. 3-10). https://aclanthology.org/P99-1001.pdf CR - Hoy, H., Lynch, T., & Beck, M. (2019). Surgical treatment of lung cancer. Critical Care Nursing Clinics, 31(3), 303-313. CR - Karakuş, L. (2021). Eğitimde Metin Madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi. [Master’s Thesis]. Akdeniz Üniversitesi. CR - Kennedy, K., Hulbert, A., Pasquinelli, M., & Feldman, L. E. (2022). Impact of CT screening in lung cancer: Scientific Evidence and Literatüre Review. In Seminars in Oncology (p. 198-205). WB Saunders CR - Maier, D., Waldherr, A., Miltner, P., Wiedemann, G., Niekler, A., Keinert, A., ... & Adam, S. (2018). Applying LDA topic modeling. In Computational methods for communication science (p. 13-38). Routledge. CR - Minna, J. D., Roth, J. A., & Gazdar, A. F. (2002). Focus on lung cancer. Cancer cell, 1(1), 49-52. CR - Morgan, D. L. (1996). Focus groups as qualitative research. Sage Publications. CR - Nasution, M. K. (2017). Penelaahan literatur. Teknik Penulisan Karya Ilmiah. CR - Schellekens, M. P. J. (2017). Psychological distress in lung cancer: Mindfulness-based stress reduction for patients and partners. [Doctoral Dissertation]. Utrecht University. CR - Sugiantoro, B., Humam, A. I., Fitriyani, N. L., Alfian, G., Maarif, M. R., & Syafrudin, M. (2023). Utilizing latent dirichlet allocation for analyzing topics in undergraduate theses. In 2023 10th International Conference on Information Technology, Computer, and Electrical Engineering (ICITACEE) (pp. 121-126). IEEE. CR - Van Nieuwenhove, Z. (2017). Analysis of latent dirichlet allocation [Ph.D. Dissertation]. Tilburg University. CR - Yeşilmen, S. (2024). Synthesıs of dye-conjugated PD-L1 targeted peptıdes for use in PET/CT in dıagnosıs of lung cancer [Master’s Thesis]. İstanbul Technical Universitesi. UR - https://doi.org/10.21076/vizyoner.1658488 L1 - https://dergipark.org.tr/en/download/article-file/4693324 ER -