BERTopic ile Diyanet Hutbelerinin Ana Temalarının ve Zaman İçindeki Değişiminin Belirlenmesi: Dijital Çağ Perspektifi
Öz
Her hafta Cuma namazının icrası sırasında hutbe irat edilir. Hutbenin işlevsel yapısı, ana hatlarıyla üç temel bileşen arasındaki dinamik etkileşime dayanmaktadır. Bu bileşenleri hutbenin icra edeni, dinleyici kitlesi ve içeriği olarak belirlemek mümkündür. Bu bağlamda, elinizdeki çalışma, söz konusu üç temel bileşenden biri olan içerik unsuru üzerine odaklanmaktadır. Hutbe metinleri, bu analizin doğrudan konusu ve temel veri kaynağını teşkil etmektedir. Bununla birlikte metinlerin yapısal formatı, ele aldığı konuların niteliği ve toplumsal alaka düzeyi gibi hususlar kapsam dışı tutulmuştur. Türkiye Cumhuriyeti Diyanet İşleri Başkanlığı’na ait bu Cuma hutbelerinin içeriği ağırlıklı olarak dinî ve ahlâkî konularda öğütler ve bilgilendirici dinî konuşmalar şeklindedir. Bunun yanı sıra hutbelerin, toplumsal gereksinimlere ve beklentilere uygun, güncel ve nitelikli içerikte olması esastır. Geniş halk kitlelerini ilgilendirmesi ve her hafta düzenli bir şekilde okunması dolayısıyla hutbeler, ilgi uyandırmaktadır. Buna istinaden çalışmada hutbelerdeki söylemin tematik dağılımının nicel yöntemlerle ele alınması amaçlanmaktadır. Çalışmada, büyük metin yığınlarını incelemek için kullanılan Metin Madenciliği ve Doğal Dil İşleme alanlarındaki en güncel teknikleri bir araya getiren sistematik bir metodoloji uygulanmıştır. Hutbe metinlerini sayısal temsil haline doğru bir şekilde dönüştürmek için, Türkçe gramerine ve kültürel bağlama duyarlı olan “dbmdz/bert-base-turkish-cased” modeli kullanıldı. Bu model, bağlamsal ilişkileri bütünsel olarak değerlendirerek her hutbeyi ölçülebilir analiz için benzersiz bir anlamsal vektöre dönüştürür. HDBSCAN algoritması, önceden belirlenmiş bir küme sayısı olmadan tematik kümeleri tanımlamak için kullanıldı ve verilerin doğal yoğunluk dağılımlarına uyum sağladı. Çalışma, 01 Ocak 2021-28 Kasım 2025 tarihleri arasındaki 266 adet hutbe metnini kapsamaktadır. Verinin kaynağının resmî e-Devlet kanalı olması, çalışmanın güvenilirliğini ve doğrulanabilirliğini artırmaktadır. Hutbelerin 24 tematik kümede yoğunlaşan söyleminin, toplumsal ahlâkın muhafazası, dinî öğretilerin evrensel boyutu ve sosyal sorumluluklara rehberlik çabası olduğu görülmektedir.
Anahtar Kelimeler
Dijital Beşeri Bilimler, Diyanet İşleri Başkanlığı, Hutbe, BERTopic, Yapay Zeka, Büyük Dil Modelleri
Thematic Identification and Temporal Evolution in the Khutbahs of the Presidency of Religious Affairs: A BERTopic-Driven Analysis in the Digital Era
Öz
The delivery of the khutbah is an integral part of the weekly Friday prayer. The functional structure of the sermon rests upon a dynamic interplay between three core components: the orator, the audience, and the content. The present study focuses specifically on the latter, the element of content. While the sermon texts serve as the primary data source for this analysis, certain aspects namely their structural formatting, the specific nature of the topics addressed, and their level of social relevance remain outside the current scope. Issued by the Presidency of Religious Affairs of the Republic of Turkey, these Friday sermons predominantly consist of religious and moral exhortations, alongside informative theological discourse. Given their regular delivery and engagement with a broad public, it is essential that these sermons provide high-quality, contemporary content that aligns with societal needs and expectations. Accordingly, this study aims to quantitatively analyze the thematic distribution of the discourse within these sermons. To achieve this, a systematic methodology was employed, integrating state-of-the-art techniques from Text Mining and Natural Language Processing designed for large-scale textual corpora. To accurately convert sermon texts into numerical representations, the “dbmdz/bert-base-turkish-cased” model was utilized, which is sensitive to Turkish grammar and cultural context. This model evaluates contextual relationships holistically, transforming each sermon into a unique semantic vector for measurable analysis. The HDBSCAN algorithm was employed to identify thematic clusters without a predetermined number of clusters, adapting to the natural density distributions of the data. The study encompasses a corpus of 266 sermon texts published between January 1, 2021 and November 28, 2025. The utilization of the official e-Government (e-Devlet) portal as the data source ensures the reliability and verifiability of the research. The findings, concentrated across 24 thematic clusters, indicate that the discourse actively seeks to guide the preservation of social morality, highlight the universal dimensions of religious teachings, and promote social responsibility.
Anahtar Kelimeler
Digital Humanities, Presidency of Religious Affairs, Khutbahs, BERTopic, Artificial Intelligence, Large Language Models