Araştırma Makalesi

Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları

Cilt: 9 Sayı: 1 30 Haziran 2026
PDF İndir
EN TR

Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları

Öz

Türkçe metinlerde metin madenciliği uygulamalarında en önemli güçlük, dilin sondan eklemeli yapısı nedeniyle ön işleme ve normalleştirme kararlarının analiz sonuçlarını doğrudan etkilemesidir. Buna rağmen R yazılımında; Türkçe metinler için veri hazırlama, dilsel normalleştirme, metin temsili oluşturma, tematik örüntü çıkarımı ve çıktıların raporlanması gibi adımları birlikte ve gerekçeleriyle açıklayan uygulama kılavuzları hala sınırlı düzeydedir. Bu çalışma, bu eksikliği azaltmak amacıyla, R yazılımı kullanılarak, Türkçe metinlerde metin istatistikleri üretme ve içerik analizi yürütme sürecini adım adım bir iş akışı olarak sunmuştur. Çalışmanın materyalini, aynı konu ekseninde üretilmiş, 30 Türkçe metinden oluşan bir yapı oluşturmuştur. Yöntemde, öncelikle potansiyel ön bilgi için; ham metinler için uzunluk, cümle yapısı, sözcüksel çeşitlilik, bağlaç, durak sözcük oranları ve noktalama profiline ilişkin göstergeler hesaplanmıştır. Ardından Türkçeye uygun ön işleme ve köke indirgeme adımları uygulanmış, belge–terim matrisleri oluşturulmuş ve tematik örüntü çıkarımı için aday çözümlerin birden fazla kalite göstergesiyle karşılaştırılması sonucunda gerekçeli bir seçim yapılmıştır. Bulgular, metinler arasında belirgin uzunluk ve tematik içerik yoğunluğu farklılıkları bulunduğunu ve ön işleme sonrasında analize giren token hacminde azalma gerçekleştiğini göstermiştir. Seçilen tematik yapının tekrarlı çalıştırmalarda orta düzeyde benzerlik ürettiği görülmüştür. Sonuç olarak çalışma, Türkçe metinlerde R yazılımı ile yürütülen metin analizi sürecinde kritik karar noktalarını görünür kılan ve aynı veri ile tekrarlandığında benzer çıktılar üretebilen bir uygulama çerçevesi sunmuştur.

Anahtar Kelimeler

Kaynakça

  1. Alkan, B. B., Karakuş, L., & Direkci, B. (2022). Generating a sentiment dictionary in R and dictionary-based sentiment analysis in Turkish texts. Digital Scholarship in the Humanities, 38(2), 461–476. https://doi.org/10.1093/llc/fqac093
  2. Alkan, B. B., Karakuş, L., & Direkci, B. (2023). Knowledge discovery from the texts of Nobel Prize winners in literature: sentiment analysis and Latent Dirichlet Allocation. Scientometrics, 128(9), 5311–5334. https://doi.org/10.1007/s11192-023-04783-6
  3. Belford, M., Mac Namee, B., & Greene, D. (2018). Stability of topic modeling via matrix factorization. Expert Systems with Applications, 91, 159–169. https://doi.org/10.1016/j.eswa.2017.08.047
  4. Benoit, K., Watanabe, K., Wang, H. P., Nulty, P., Obeng, A., Müller, S., … & Matsuo, A. (2018). quanteda: An R package for the quantitative analysis of textual data. The Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
  5. Benoit, K., Watanabe, K., Wang, H., Nulty, P., Obeng, A., Müller, S., & Matsuo, A. (2018). quanteda: An R package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), 774. https://doi.org/10.21105/joss.00774
  6. Denny, M. J., & Spirling, A. (2018). Text preprocessing for unsupervised learning: Why it matters, when it misleads, and what to do about it. Political Analysis, 26(2), 168–189. https://doi.org/10.1017/pan.2017.44
  7. Eryiğit, G., & Torunoğlu-Selamet, D. (2017). Social media text normalization for Turkish. Natural Language Engineering, 23(6), 835–875. https://doi.org/10.1017/s1351324917000134
  8. Feinerer, I., Hornik, K., & Meyer, D. (2008). Text Mining Infrastructure in R. Journal of Statistical Software, 25(5). https://doi.org/10.18637/jss.v025.i05

Ayrıntılar

Birincil Dil

Türkçe

Konular

Eğitimde Ölçme ve Değerlendirme (Diğer), Türkçe Eğitimi

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

30 Haziran 2026

Gönderilme Tarihi

23 Şubat 2026

Kabul Tarihi

27 Mart 2026

Yayımlandığı Sayı

Yıl 2026 Cilt: 9 Sayı: 1

Kaynak Göster

APA
Karakuş, L., & Alkan, B. B. (2026). Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi, 9(1), 19-44. https://doi.org/10.52974/jena.1895987
AMA
1.Karakuş L, Alkan BB. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026;9(1):19-44. doi:10.52974/jena.1895987
Chicago
Karakuş, Leyla, ve Bilal Barış Alkan. 2026. “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi 9 (1): 19-44. https://doi.org/10.52974/jena.1895987.
EndNote
Karakuş L, Alkan BB (01 Haziran 2026) Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi 9 1 19–44.
IEEE
[1]L. Karakuş ve B. B. Alkan, “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”, Eğitim ve Yeni Yaklaşımlar Dergisi, c. 9, sy 1, ss. 19–44, Haz. 2026, doi: 10.52974/jena.1895987.
ISNAD
Karakuş, Leyla - Alkan, Bilal Barış. “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi 9/1 (01 Haziran 2026): 19-44. https://doi.org/10.52974/jena.1895987.
JAMA
1.Karakuş L, Alkan BB. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 2026;9:19–44.
MLA
Karakuş, Leyla, ve Bilal Barış Alkan. “Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları”. Eğitim ve Yeni Yaklaşımlar Dergisi, c. 9, sy 1, Haziran 2026, ss. 19-44, doi:10.52974/jena.1895987.
Vancouver
1.Leyla Karakuş, Bilal Barış Alkan. Türkçe metinlerde metin madenciliği ile pratik içerik analizi uygulamaları. Eğitim ve Yeni Yaklaşımlar Dergisi. 01 Haziran 2026;9(1):19-44. doi:10.52974/jena.1895987

Flag Counter