Research Article

Bilgi Yönetimi Bağlamında Metin Madenciliği Teknikleri ile Dijital İçerik Analizi

Volume: 36 Number: 4 December 30, 2022
EN TR

Bilgi Yönetimi Bağlamında Metin Madenciliği Teknikleri ile Dijital İçerik Analizi

Öz

Amaç: Bu çalışmada, blockchain teknolojileri konusunda internet üzerinde içerik yayınlayan bir platformun içerik analizi yapılmıştır. Araştırmanın amacı, platformun Facebook’ta paylaştığı içerikler için başlık bazında okunma oranını etkileyen faktörlerin (kelime ve kelime gruplarının) tespit edilmesidir. Yöntem: Araştırma sınırlılıkları kapsamında belirlenen tarih aralığında yayınlanan 2206 içerikten 500 tanesi rastgele seçilmiştir. İçeriklerin başlıkları Python programlama dili kullanılarak bu çalışmadaki probleme özel olarak farklı bir yaklaşımla ve standart metin madenciliği teknikleriyle çözümlenmiş ve metinler üzerinden yapısallaştırılmış iki farklı veri kümesi elde edilmiştir. Elde edilen iki farklı veri kümesi üzerinde çoklu doğrusal regresyon yöntemi kullanılarak analizler gerçekleştirilmiştir. Bulgular: Analizler sonucunda içerik başlıklarında kullanılan bazı kelime ve kelime gruplarının, içeriklerin okunma oranını etkilediği tespit edilmiştir. Ayrıca uygulanan farklı yaklaşımın standart metin madenciliği tekniklerine göre daha yüksek performans sağladığı belirlenmiştir. Sonuç: Araştırmada ham veri işlenerek değerli bilgiler elde edilmiştir. Teorik olarak ortaya çıkarılan bilgiler, uygulama pratiğiyle karşılaştırılmış ve tutarlı sonuçlar elde edildiği gözlemlenmiştir. Uygulanan farklı yaklaşımın etkili bir şekilde benzer metin madenciliği problemlerinde kullanılabileceği saptanmıştır. Özgünlük: Araştırmada içerik başlığı bazında yapılan metin madenciliğine dayalı analiz, farklı bir yaklaşımla ele alınmıştır. Bu yönüyle çalışma özgün bir nitelik taşımaktadır.

Anahtar Kelimeler

metin madenciliği , veri madenciliği , çoklu doğrusal regresyon , içerik analizi , bilgi yönetimi

References

  1. Aggarwal, C.C. ve Zhai, C. (2012). Mining Text Data. Springer. https://doi.org/10.1007/978-1-4614-3223-4_1
  2. Albayrak, A.S. (2006). Uygulamalı Çok Değişkenli İstatistik Teknikleri. Ankara: Asil Yayın.
  3. Altınok, G., Karagöz, P., and Batmaz, İ. (2021). Learning to Rank by Using Multivariate Adaptive Regression Splines and Conic Multivariate Adaptive Regression Splines. Computational Intelligence, 37, 371-408. doi: 10.1111/coin.12413.
  4. Batmaz, İ. (2021). Doğrusal Regresyon. İnci Batmaz’a ait ders notları. Orta Doğu Teknik Üniversitesi İstatistik Bölümü, Ankara.
  5. Batmaz, İ., Danışoğlu, S., Kartal-Koç, E., and C. Yazıcı. (2017). A Data Mining Application to Deposit Pricing: Main Determinants and Prediction Models. Applied Soft Computing (for Business Analytics), 60, 808-819. https://doi.org/10.1016/j.asoc.2017.07.047
  6. Batmaz, İ., Karagöz, P. and G. Serdar. (2017). A Comparative Study on Learning to Rank with Computational Methods. 2017 IEEE International Conference on Big Data (IEEE Big Data 2017). Boston, USA. DOI: 10.1109/BigData.2017.8258135
  7. Berson, A., Smith, S.J. ve Thearling, K. (1999). Building Data Mining Applications for CRM. New York: McGraw-Hill.
  8. Bifet, A. (2013). Mining Big Data in Real Time. Informatica, 37(1), 15-20.
  9. Choi, S., Shin, H. ve Kang, S-S. (2021). Predicting Audience-Rated News Quality: Using Survey, Text Mining, and Neural Network Methods. Digital Journalism, 9(1), 84-105. https://doi.org/10.1080/21670811.2020.1842777
  10. Çakmak, T. ve Eroğlu, Ş. (2020). Sosyal Medyada Kullanıcı Etkileşimi ve İçerik Kategorizasyonu: Ankara’daki Halk Kütüphanelerinin Facebook Gönderilerinin Analizi. Türk Kütüphaneciliği, 34(2), 160-186. https://doi.org/10.24146/tk.706882
APA
Kurt, L., Gürdal, O., & Batmaz, İ. (2022). Bilgi Yönetimi Bağlamında Metin Madenciliği Teknikleri ile Dijital İçerik Analizi. Türk Kütüphaneciliği, 36(4), 472-494. https://doi.org/10.24146/tk.1152238