Sosyal medya kullanımında sürekli bir artış yaşanmakta ve kullanıcılar arasında büyük bir etkileşim gerçekleşmektedir. Bu bağlamda yalan haber sirkülasyonu veya yayılımı, sosyal medya kullanıcıları için çeşitli açılardan gerçek bir tehdit haline gelmektedir. Yalan haber, yanıltıcı bilgilerin doğru haber gibi sunulması olarak tanımlanmaktadır. Bu görüşe göre, sahte haber, bir çıkar elde etmek için kamuoyunu manipüle etmeyi amaçlayan uydurma haberlerdir. Örneğin, tıklama tuzakları yoluyla kâr elde etmek için okuyucu sayısını artırmak böyle bir amaçtır. Sosyal medya kullanıcıları, ziyaretçi sayısını artırmak için dikkat çekici başlıklar veya web bağlantıları aracılığıyla manipüle edilmektedir. Bu nedenle, sosyal medya kullanıcıları tarafından yanlışlıkla web trafiğini filtrelemek için otomatik bir sahte haber tanımlama modeli kullanılabilir. Bu amaçla literatürde sahte haber problemine çözüm olarak makine öğrenmesi algoritmaları kullanılmaktadır. Makine öğrenimi literatüründe, temel modellerin performansını geliştirmek kritik öneme sahiptir. Topluluk öğrenimi, model performansını artırmanın temel çözümlerinden biridir. Bu çalışmada, önce bir dizi temel makine öğrenmesi algoritması oluşturulmuş ve bu algoritmalar sahte haber tanımlama yetenekleri bağlamında test edilmiştir. Daha sonra elde edilen sonuçları daha da geliştirmek için topluluk öğrenme stratejisi kullanılmıştır. Diğer bir ifade ile %96.74 doğrulukla en iyi sahte haber tahmincisi olarak Naïve Bayes Multinomial sınıflandırıcısını elde edilmiştir. Daha sonra bir AdaBoost topluluğu öğrenme stratejisi uygulanarak bu tahmin yeteneği daha da geliştirilmiş ve başarım %98,2'ye çıkarılmıştır.
Sahte Haber Tespiti Topluluk Öğrenmesi Makine Öğrenmesi Metin Madenciliği Sosyal Medya.
There is a continuous increase in social media usage and a huge interaction takes place between users. In this context, fake news circulation or flood becomes a real thread for social media users from various perspectives. Fake news is defined as presentation of misleading information as true news. In this view, fake news is fabricated news that aims to manipulate public opinion to obtain a benefit. For example, increasing readership for profiting through clickbaits is such an aim. Social media users are manipulated through attention grabbing headlines or web-links to increase number of visitors. Therefore, an automated fake news identification model can be used by social media users to filter inadvertent web-traffic. For this goal machine learning algorithms are used in the literature as a solution for fake news problem. In machine learning literature, advancing performance of the base models is crucial. Ensemble learning is one of the key solutions to enhance model efficiency. In this work, we first generated a set of baseline machine learning algorithms and we tested them in terms of their fake news identification ability. We then made use of ensemble learning strategy to further enhance obtained results. More precisely, we obtained Naïve Bayes Multinomial classifier as the best fake news predictor having 96.74 % accuracy. We then further improved this prediction ability to 98.2 % by applying an AdaBoost ensemble learning strategy.
Fake News Identification Ensemble Learning Machine Learning Text Mining Social Media
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Kasım 2021 |
Yayımlandığı Sayı | Yıl 2021 Sayı: 28 |