Purpose: In this study, a content analysis of a platform that publishes content on the internet about blockchain technologies was made. The study aims to determine the factors (word and word string) affecting the reading rate of the digital content -on a titles basis- posted by the platform on Facebook.
Method: 500 out of 2206 examples of content published between the specified dates were chosen randomly. The titles of the content were processed using standard text mining techniques and a new approach specific to the problem in this study on python programming language and then two different datasets were collected. The datasets were analysed using multiple linear regression.
Findings: As a result of the analysis, it was discovered that some words and phrases used in the content titles affected the reading rate of the content. In addition, it has been determined that the new approach provides higher performance than standard text mining techniques.
Implications: In this study, valuable information was obtained by processing raw data. As a result of the study, the theory was compared with the practice, and it was observed consistent results. It is determined that the new approach can be used effectively in similar text mining problems.
Originality: The research relying on text mining was handled with a new approach on the basis of the content title. In this respect, the study has a unique quality.
Text mining data mining multiple linear regression content analysis information management
Amaç: Bu çalışmada, blockchain teknolojileri konusunda internet üzerinde içerik yayınlayan bir platformun içerik analizi yapılmıştır. Araştırmanın amacı, platformun Facebook’ta paylaştığı içerikler için başlık bazında okunma oranını etkileyen faktörlerin (kelime ve kelime gruplarının) tespit edilmesidir.
Yöntem: Araştırma sınırlılıkları kapsamında belirlenen tarih aralığında yayınlanan 2206 içerikten 500 tanesi rastgele seçilmiştir. İçeriklerin başlıkları Python programlama dili kullanılarak bu çalışmadaki probleme özel olarak farklı bir yaklaşımla ve standart metin madenciliği teknikleriyle çözümlenmiş ve metinler üzerinden yapısallaştırılmış iki farklı veri kümesi elde edilmiştir. Elde edilen iki farklı veri kümesi üzerinde çoklu doğrusal regresyon yöntemi kullanılarak analizler gerçekleştirilmiştir.
Bulgular: Analizler sonucunda içerik başlıklarında kullanılan bazı kelime ve kelime gruplarının, içeriklerin okunma oranını etkilediği tespit edilmiştir. Ayrıca uygulanan farklı yaklaşımın standart metin madenciliği tekniklerine göre daha yüksek performans sağladığı belirlenmiştir.
Sonuç: Araştırmada ham veri işlenerek değerli bilgiler elde edilmiştir. Teorik olarak ortaya çıkarılan bilgiler, uygulama pratiğiyle karşılaştırılmış ve tutarlı sonuçlar elde edildiği gözlemlenmiştir. Uygulanan farklı yaklaşımın etkili bir şekilde benzer metin madenciliği problemlerinde kullanılabileceği saptanmıştır.
Özgünlük: Araştırmada içerik başlığı bazında yapılan metin madenciliğine dayalı analiz, farklı bir yaklaşımla ele alınmıştır. Bu yönüyle çalışma özgün bir nitelik taşımaktadır.
metin madenciliği veri madenciliği çoklu doğrusal regresyon içerik analizi bilgi yönetimi
Birincil Dil | Türkçe |
---|---|
Konular | Kütüphane ve Bilgi Çalışmaları |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 30 Aralık 2022 |
Gönderilme Tarihi | 1 Ağustos 2022 |
Kabul Tarihi | 27 Aralık 2022 |
Yayımlandığı Sayı | Yıl 2022 Cilt: 36 Sayı: 4 |
Bu dergi içeriği CC BY 4.0 ile lisanslanmaktadır.