This study adopts a corpus-based approach to examine word frequency in Middle Kurdish (Sorani) and aims to provide a scientific basis for designing data-driven educational materials. The data were collected from two corpora, including over 92 million word tokens from written texts and 21,000 samples from spoken data, and analyzed using AntConc software. Words were categorized based on frequency and range of usage, and educational word lists were derived. To evaluate the impact of word frequency on learning, three equivalent groups of Persian-speaking learners participated in a ten-session course, each with different access to high-frequency word lists. The results showed that the group with direct and regular access to these lists performed significantly better in the final test in terms of comprehension and application of vocabulary (average score: 87%). A comparison of the written and spoken corpora also indicated a high overlap of frequent words in both domains, confirming the importance of teaching high-frequency vocabulary for both speaking and writing skills. The findings suggest that a corpus-based approach can facilitate the design of targeted and effective educational resources for Middle Kurdish and contribute to improving the quality of instruction for low-resource languages.
Lexical frequency corpus linguistics central Kurdish (Sorani) language teaching educational word lists
ئەم توێژینەوە بە پێی بۆچوونی کۆرپستەوەر دەستی داوەتە لێکدانی فرەپاتیی وشە لە زمانی کوردی ناویندا (سۆرانی) و هەوڵ دەدا بنەمایێکی زانستی بۆ داڕشتنی سەرچاوە فێرکارییەکان لەسەر بنچینەی داتا پێک بهێنێت. لە دوو کۆرپسی زمانی بریتی لە ٩٢ میلیۆن نموونە وشە لە دەقە نووسراوەکان و ٢١ هەزار نموونە لە داتا ئاخاوتنییەکان، داتا کۆکراونەتەوە و بە نەرمئامێری AntConc لێکدراونەتەوە. وشەکان بەپێی ڕادەی دووپاتبوونەوە و بەرفراوانی بەکارهێنان پۆلێنبەندی کراون و لیستێک وشەی فێرکاری هێنراون. بۆ هەڵسەنگاندنی کاریگەریی فرەپاتیی وشەکان لە سەر فێربوون، سێ گرووپی هاوئاست لە فێرخوازانی فارسزمان لە خولێکی دە دانیشتنیدا بەشدارییان کردووە کە بەشێوەی جیاواز وشە فرەپاتەکان لە بەردەستیاندا بووە. ئەنجامەکان نیشاندەری ئەوە بوون گرووپێک کە ئەم لیستەی بەشێوەی ڕاستەوخۆ و بەردەوام لە بەردەست بووە، لە تاقیکاری کۆتاییدا تا ڕادەیێکی بەرچاو کاردانەوەی باشتری لە تێگەیشتن و بەکارهێنانی وشەکان نیشان داوە (تێکڕای نمرە ٪٨٧). بەراوردی دوو کۆرپسی نووسراو و ئاخاوتنیش نیشاندەری پێکگرتوویی بەرزی وشە فرەپاتەکان لە هەر دوو ئاقاردایە، کە جەخت دەخاتە سەر گرنگی فێرکاریی وشە فرەپاتەکان بۆ لێهاتوویی لە ئاخاوتن و نووسیندا. دەستکەوتەکان نیشاندەری ئەوەن بەکارهێنانی بۆچوونی کۆرپستەوەر دەتوانێ بۆ داڕشتنی سەرچاوە فێرکارییە مەبەستدار و کارامەکانی زمانی کوردیی ناوین ئاسانکاری بکات و یارمەتیدەری گەشە کردنی کوالێتی فێرکاری زمانە کەمسەرچاوەکان بێت.
فرەپاتیی وشەکان زمانناسی کۆرپستەوەر کوردی ناوین (سۆرانی) فێرکاری زمان لیستی وشە فێرکارییەکان
Bu çalışma, Orta Kürtçe'de (Sorani) kelimelerin sıklığını araştırmak için korpus tabanlı bir yaklaşım kullanır ve veriye dayalı eğitim kaynaklarının tasarımı için bilimsel bir temel sağlamaya çalışır. Veriler, yazılı metinlerden 92 milyondan fazla kelime örneği ve sözlü verilerden 21.000 örnek içeren iki korpustan toplandı ve AntConc yazılımı kullanılarak analiz edildi. Kelime bilgisi kategorize edildi ve eğitim listeleri kullanım sıklığına ve aralığına göre türetildi. Kelime bilgisi sıklığının öğrenme üzerindeki etkisini değerlendirmek için aynı seviyedeki üç grup Farsça konuşan öğrenci, yüksek frekanslı kelime listelerine farklı erişimleri olan on seanslık bir kursa katıldı. Sonuçlar, bu listeye doğrudan ve düzenli erişimi olan grubun son testte kelime anlama ve kullanma konusunda önemli ölçüde daha iyi performans gösterdiğini gösterdi (%87 ortalama puan). İki metin ve konuşma korpusunun karşılaştırılması, her iki alanda da yüksek frekanslı kelime dağarcığının yüksek oranda örtüştüğünü gösteriyor; bu da konuşma ve yazma becerilerinde yüksek frekanslı kelime bilgisi öğretmenin önemini doğruluyor. Bulgular, korpus temelli bir yaklaşımın kullanılmasının, orta düzey Kürtçe için hedefli ve etkili eğitim kaynakları tasarlamanın önünü açabileceğini ve düşük kaynaklı dillerin öğretim kalitesinin artırılmasına yardımcı olabileceğini göstermektedir.
Kelime sıklığı korpus dilbilimi Orta Kürtçe (Sorani) dil öğretimi eğitimsel kelime listesi
| Birincil Dil | Kürtçe |
|---|---|
| Konular | Kürt Dili, Edebiyatı ve Kültürü |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 15 Kasım 2025 |
| Kabul Tarihi | 27 Aralık 2025 |
| Yayımlanma Tarihi | 31 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Sayı: 24 |
Nûbihar Akademî Dergisi Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY NC) ile lisanslanmıştır.