EN
TR
Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları
Öz
Türkçe metinlerde metin madenciliği uygulamalarında en önemli güçlük, dilin sondan eklemeli yapısı nedeniyle ön işleme ve normalleştirme kararlarının analiz sonuçlarını doğrudan etkilemesidir. Buna rağmen R yazılımında; Türkçe metinler için veri hazırlama, dilsel normalleştirme, metin temsili oluşturma, tematik örüntü çıkarımı ve çıktıların raporlanması gibi adımları birlikte ve gerekçeleriyle açıklayan uygulama kılavuzları hala sınırlı düzeydedir. Bu çalışma, bu eksikliği azaltmak amacıyla, R yazılımı kullanılarak, Türkçe metinlerde metin istatistikleri üretme ve içerik analizi yürütme sürecini adım adım bir iş akışı olarak sunmuştur. Çalışmanın materyalini, aynı konu ekseninde üretilmiş, 30 Türkçe metinden oluşan bir yapı oluşturmuştur. Yöntemde, öncelikle potansiyel ön bilgi için; ham metinler için uzunluk, cümle yapısı, sözcüksel çeşitlilik, bağlaç, durak sözcük oranları ve noktalama profiline ilişkin göstergeler hesaplanmıştır. Ardından Türkçeye uygun ön işleme ve köke indirgeme adımları uygulanmış, belge–terim matrisleri oluşturulmuş ve tematik örüntü çıkarımı için aday çözümlerin birden fazla kalite göstergesiyle karşılaştırılması sonucunda gerekçeli bir seçim yapılmıştır. Bulgular, metinler arasında belirgin uzunluk ve tematik içerik yoğunluğu farklılıkları bulunduğunu ve ön işleme sonrasında analize giren token hacminde azalma gerçekleştiğini göstermiştir. Seçilen tematik yapının tekrarlı çalıştırmalarda orta düzeyde benzerlik ürettiği görülmüştür. Sonuç olarak çalışma, Türkçe metinlerde R yazılımı ile yürütülen metin analizi sürecinde kritik karar noktalarını görünür kılan ve aynı veri ile tekrarlandığında benzer çıktılar üretebilen bir uygulama çerçevesi sunmuştur.
Anahtar Kelimeler
Kaynakça
- Alkan, B. B., Karakuş, L., & Direkci, B. (2022). Generating a sentiment dictionary in R and dictionary-based sentiment analysis in Turkish texts. Digital Scholarship in the Humanities, 38(2), 461–476. https://doi.org/10.1093/llc/fqac093
- Alkan, B. B., Karakuş, L., & Direkci, B. (2023). Knowledge discovery from the texts of Nobel Prize winners in literature: sentiment analysis and Latent Dirichlet Allocation. Scientometrics, 128(9), 5311–5334. https://doi.org/10.1007/s11192-023-04783-6
- Belford, M., Mac Namee, B., & Greene, D. (2018). Stability of topic modeling via matrix factorization. Expert Systems with Applications, 91, 159–169. https://doi.org/10.1016/j.eswa.2017.08.047
- Benoit, K., Watanabe, K., Wang, H. P., Nulty, P., Obeng, A., Müller, S., … & Matsuo, A. (2018). quanteda: An R package for the quantitative analysis of textual data. The Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
- Benoit, K., Watanabe, K., Wang, H., Nulty, P., Obeng, A., Müller, S., & Matsuo, A. (2018). quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
- Denny, M. J., & Spirling, A. (2018). Text preprocessing for unsupervised learning: Why it matters, when it misleads, and what to do about it. Political Analysis, 26(2), 168–189. https://doi.org/10.1017/pan.2017.44
- Eryiğit, G., & Torunoğlu-Selamet, D. (2017). Social media text normalization for Turkish. Natural Language Engineering, 23(6), 835–875. https://doi.org/10.1017/s1351324917000134
- Feinerer, I., Hornik, K., & Meyer, D. (2008). Text Mining Infrastructure in R. Journal of Statistical Software, 25(5). https://doi.org/10.18637/jss.v025.i05
Ayrıntılar
Birincil Dil
Türkçe
Konular
Eğitimde Ölçme ve Değerlendirme (Diğer), Türkçe Eğitimi
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
30 Haziran 2026
Gönderilme Tarihi
23 Şubat 2026
Kabul Tarihi
27 Mart 2026
Yayımlandığı Sayı
Yıl 2026 Cilt: 9 Sayı: 1
APA
Karakuş, L., & Alkan, B. B. (2026). Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi, 9(1), 19-44. https://doi.org/10.52974/jena.1895987
AMA
1.Karakuş L, Alkan BB. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026;9(1):19-44. doi:10.52974/jena.1895987
Chicago
Karakuş, Leyla, ve Bilal Barış Alkan. 2026. “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi 9 (1): 19-44. https://doi.org/10.52974/jena.1895987.
EndNote
Karakuş L, Alkan BB (01 Haziran 2026) Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi 9 1 19–44.
IEEE
[1]L. Karakuş ve B. B. Alkan, “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”, Eğitim ve Yeni Yaklaşımlar Dergisi, c. 9, sy 1, ss. 19–44, Haz. 2026, doi: 10.52974/jena.1895987.
ISNAD
Karakuş, Leyla - Alkan, Bilal Barış. “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi 9/1 (01 Haziran 2026): 19-44. https://doi.org/10.52974/jena.1895987.
JAMA
1.Karakuş L, Alkan BB. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026;9:19–44.
MLA
Karakuş, Leyla, ve Bilal Barış Alkan. “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi, c. 9, sy 1, Haziran 2026, ss. 19-44, doi:10.52974/jena.1895987.
Vancouver
1.Leyla Karakuş, Bilal Barış Alkan. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 01 Haziran 2026;9(1):19-44. doi:10.52974/jena.1895987