EN
TR
Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları
Abstract
Türkçe metinlerde metin madenciliği uygulamalarında en önemli güçlük, dilin sondan eklemeli yapısı nedeniyle ön işleme ve normalleştirme kararlarının analiz sonuçlarını doğrudan etkilemesidir. Buna rağmen R yazılımında; Türkçe metinler için veri hazırlama, dilsel normalleştirme, metin temsili oluşturma, tematik örüntü çıkarımı ve çıktıların raporlanması gibi adımları birlikte ve gerekçeleriyle açıklayan uygulama kılavuzları hala sınırlı düzeydedir. Bu çalışma, bu eksikliği azaltmak amacıyla, R yazılımı kullanılarak, Türkçe metinlerde metin istatistikleri üretme ve içerik analizi yürütme sürecini adım adım bir iş akışı olarak sunmuştur. Çalışmanın materyalini, aynı konu ekseninde üretilmiş, 30 Türkçe metinden oluşan bir yapı oluşturmuştur. Yöntemde, öncelikle potansiyel ön bilgi için; ham metinler için uzunluk, cümle yapısı, sözcüksel çeşitlilik, bağlaç, durak sözcük oranları ve noktalama profiline ilişkin göstergeler hesaplanmıştır. Ardından Türkçeye uygun ön işleme ve köke indirgeme adımları uygulanmış, belge–terim matrisleri oluşturulmuş ve tematik örüntü çıkarımı için aday çözümlerin birden fazla kalite göstergesiyle karşılaştırılması sonucunda gerekçeli bir seçim yapılmıştır. Bulgular, metinler arasında belirgin uzunluk ve tematik içerik yoğunluğu farklılıkları bulunduğunu ve ön işleme sonrasında analize giren token hacminde azalma gerçekleştiğini göstermiştir. Seçilen tematik yapının tekrarlı çalıştırmalarda orta düzeyde benzerlik ürettiği görülmüştür. Sonuç olarak çalışma, Türkçe metinlerde R yazılımı ile yürütülen metin analizi sürecinde kritik karar noktalarını görünür kılan ve aynı veri ile tekrarlandığında benzer çıktılar üretebilen bir uygulama çerçevesi sunmuştur.
Keywords
References
- Alkan, B. B., Karakuş, L., & Direkci, B. (2022). Generating a sentiment dictionary in R and dictionary-based sentiment analysis in Turkish texts. Digital Scholarship in the Humanities, 38(2), 461–476. https://doi.org/10.1093/llc/fqac093
- Alkan, B. B., Karakuş, L., & Direkci, B. (2023). Knowledge discovery from the texts of Nobel Prize winners in literature: sentiment analysis and Latent Dirichlet Allocation. Scientometrics, 128(9), 5311–5334. https://doi.org/10.1007/s11192-023-04783-6
- Belford, M., Mac Namee, B., & Greene, D. (2018). Stability of topic modeling via matrix factorization. Expert Systems with Applications, 91, 159–169. https://doi.org/10.1016/j.eswa.2017.08.047
- Benoit, K., Watanabe, K., Wang, H. P., Nulty, P., Obeng, A., Müller, S., … & Matsuo, A. (2018). quanteda: An R package for the quantitative analysis of textual data. The Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
- Benoit, K., Watanabe, K., Wang, H., Nulty, P., Obeng, A., Müller, S., & Matsuo, A. (2018). quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
- Denny, M. J., & Spirling, A. (2018). Text preprocessing for unsupervised learning: Why it matters, when it misleads, and what to do about it. Political Analysis, 26(2), 168–189. https://doi.org/10.1017/pan.2017.44
- Eryiğit, G., & Torunoğlu-Selamet, D. (2017). Social media text normalization for Turkish. Natural Language Engineering, 23(6), 835–875. https://doi.org/10.1017/s1351324917000134
- Feinerer, I., Hornik, K., & Meyer, D. (2008). Text Mining Infrastructure in R. Journal of Statistical Software, 25(5). https://doi.org/10.18637/jss.v025.i05
Details
Primary Language
Turkish
Subjects
Measurement and Evaluation in Education (Other), Turkish Education
Journal Section
Research Article
Publication Date
June 30, 2026
Submission Date
February 23, 2026
Acceptance Date
March 27, 2026
Published in Issue
Year 2026 Volume: 9 Number: 1
APA
Karakuş, L., & Alkan, B. B. (2026). Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim Ve Yeni Yaklaşımlar Dergisi, 9(1), 19-44. https://doi.org/10.52974/jena.1895987
AMA
1.Karakuş L, Alkan BB. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026;9(1):19-44. doi:10.52974/jena.1895987
Chicago
Karakuş, Leyla, and Bilal Barış Alkan. 2026. “Türkçe Metinlerde Metin Madenciliği Ile Pratik Içerik Analizi Uygulamaları”. Eğitim Ve Yeni Yaklaşımlar Dergisi 9 (1): 19-44. https://doi.org/10.52974/jena.1895987.
EndNote
Karakuş L, Alkan BB (June 1, 2026) Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi 9 1 19–44.
IEEE
[1]L. Karakuş and B. B. Alkan, “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”, Eğitim ve Yeni Yaklaşımlar Dergisi, vol. 9, no. 1, pp. 19–44, June 2026, doi: 10.52974/jena.1895987.
ISNAD
Karakuş, Leyla - Alkan, Bilal Barış. “Türkçe Metinlerde Metin Madenciliği Ile Pratik Içerik Analizi Uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi 9/1 (June 1, 2026): 19-44. https://doi.org/10.52974/jena.1895987.
JAMA
1.Karakuş L, Alkan BB. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026;9:19–44.
MLA
Karakuş, Leyla, and Bilal Barış Alkan. “Türkçe Metinlerde Metin Madenciliği Ile Pratik Içerik Analizi Uygulamaları”. Eğitim Ve Yeni Yaklaşımlar Dergisi, vol. 9, no. 1, June 2026, pp. 19-44, doi:10.52974/jena.1895987.
Vancouver
1.Leyla Karakuş, Bilal Barış Alkan. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026 Jun. 1;9(1):19-44. doi:10.52974/jena.1895987