Sosyal medyada yayılan sahte haberler ve yanlış bilgiler, toplum algısını ve davranışlarını önemli ölçüde çarpıta-bilir ve ciddi sorunlara yol açabilir. Bu yanıltıcı içerikler, bireylerin yanlış bilgilere dayanarak kararlar almasına neden olarak toplumsal kutuplaşmayı artırma potansiyeline sahiptir. Kriz zamanlarında, sahte haberlerin yayılması halk sağlığını tehlikeye atabilir, ekonomiyi istikrarsızlaştırabilir ve demokratik kurumlara olan güveni zedeleyebil-ir. Bu önemli sorunu ele almak amacıyla, günümüzde birçok çalışma makine öğrenimi ve derin öğrenme modelleri-ni kullanmaktadır. Bu çalışmada, doğal dil işleme alanında yaygın olarak kullanılan transformer mimarisi tercih edilmiştir. Uzun metinlerin daha istikrarlı bir şekilde işlenmesi için modelde Bidirectional LSTM'ler (İki Yönlü Uzun-Kısa Vadeli Bellek) transformer mimarisiyle hibrit hale getirilmiştir. Sahte tweetlerin daha kolay tespit edile-bilmesi amacıyla, veri setindeki hedef kategoriler dengelenmiş ve sınıflama başarımının artırılması için TomekLinks kütüphanesi kullanılmıştır. Model performansını artırmak için bir parametre havuzu oluşturulmuş ve Grid Search metodu ile en başarılı sonuçları veren parametreler belirlenmiştir. Yapılan testlerde, en iyi 10 modelin tamamı %99 doğruluk oranına ulaşmıştır. En yüksek performans gösteren model, %99.908 doğruluk oranı elde etmiştir.
sahte haber tespiti doğal dil işleme bert uzun-kısa süreli bellek
Fake news and misinformation disseminated on social media can significantly distort public perception and behav-ior, leading to serious issues. These deceptive contents have the potential to increase societal polarization by caus-ing individuals to make decisions based on false information. During crises, the spread of fake news can endanger public health, destabilize the economy, and undermine trust in democratic institutions. To address this critical issue, numerous studies today employ machine learning and deep learning models. In this study, the transformer architec-ture, widely used in natural language processing, was utilized. To process longer texts more reliably, Bidirectional LSTMs were hybridized with the transformer architecture in the model. For easier detection of fake tweets, the target categories in the dataset were balanced, and the TomekLinks algorithm was employed to enhance classification performance. To improve model performance, a parameter pool was established, and Grid Search was used to identi-fy parameters yielding the most successful results. In our tests, all top 10 models achieved an accuracy of 99%. The highest-performing model achieved an impressive accuracy of 99.908%.
fake news detection natural language processing bert long-short term memory
Birincil Dil | İngilizce |
---|---|
Konular | Derin Öğrenme, Nöral Ağlar, Makine Öğrenme (Diğer) |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Ocak 2025 |
Gönderilme Tarihi | 24 Temmuz 2024 |
Kabul Tarihi | 21 Ekim 2024 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 18 Sayı: 1 |