Abstract
Metinler, birçok konuda yararlı bilgiler içerebilir. Metinleri analiz etmek, insanların daha iyi kararlar vermesine, daha etkili işler yapmasına ve daha fazla bilgiye ulaşmasına yardımcı olabilir. Sosyal medya gibi zengin kaynaklardan elde edilen veriler, bu metinlere ait büyük verilerdir. Bu verileri anlamak ve yorumlamak için çeşitli yöntemler kullanılmaktadır. Metin madenciliği ve veri analitiği gibi teknikler, en çok kullanılan yöntemlerdir. Ayrıca, bu metin verilerinin içerdiği bilgiyi ortaya çıkarabilmek için yapılandırılmış verilerden daha fazla veriye ihtiyaç duyulabilir. Bu çalışmada, Türkiye’de hazırlanmış sosyal medyadan sağlanan büyük veri yaklaşımı ile ilgili lisansüstü tezler incelenmiştir. Bu tezler, çeşitli anabilim dalları tarafından hazırlanmıştır ve bu nedenle büyük metinler ile ilgili pek çok boyut incelenmiştir. Bu bağlamda bu tezlerden bazılarına dair kısa özetler sunulmuştur. En fazla bilgisayar mühendisliği alanında konu ile ilgili tez yazıldığı gözlenmiştir. Ancak bu tezlerin nitelikleri birbirinden ayrışmaktadır. Bir kısmında hedef yazılım boyutuna yönelik olurken, bir kısmında ise sosyal medya informasyonu hakkında analiz yapılmasına yöneliktir. Bilgisayar mühendisliğinden sonra en fazla iletişim alanındaki çeşitli anabilim dallarında çok fazla tez yazılmıştır. Yıllara göre büyük veri konusunda yazılan tez sayısının giderek attığı gözlemlenmiştir. Çalışmada metin madenciliği yöntemi kullanılarak 2008-2022 yılları arasında yazılmış tezlere kelime analizi yapılmıştır. Analiz sonucunda tezlerin kelime dağılımlarının kuvvet yasası dağılımına uygun olduğu bulunmuştur.