Şüpheli Haberlerin Tespitine Yönelik Derin Öğrenme Tabanlı Haber Teyit Sisteminin Gerçekleştirilmesi
Yıl 2025,
Cilt: 16 Sayı: 2, 357 - 367, 30.06.2025
Nurcan Yardımcı
,
Burhan Ergen
,
Hatice Karaoğlu
Öz
Dijital medyanın yaygınlaşması, sahte haberlerin toplumu olumsuz etkilemesine yol açmaktadır. Özellikle sosyal medya platformları, yanlış bilgilerin hızla yayılmasına sebep olmaktadır. Bu durum bireylerin yanlış yönlendirilmesine, toplumsal kutuplaşmaya ve güven kaybına yol açmaktadır. Bu nedenle, sahte haberlerin hızlı ve güvenilir bir şekilde tespiti çağımızın en önemli sorunlarından biri haline gelmiştir. Bu çalışmada, derin öğrenme ve doğal dil işleme (NLP) tabanlı yenilikçi bir haber teyit sistemi geliştirilmiştir. Sistem, dijital haber içeriklerinin doğruluğunu analiz ederek, kullanıcıları yanlış bilgilendirmeden korumayı hedeflemektedir. Geliştirilen model, haber metinlerini Zemberek kütüphansiyle işleyerek optimize etmekte, ardından BERT tabanlı özetleme yöntemleriyle metinlerin anlamını zenginleştirmektedir. Zemberek, Türkçe metinlerin doğal dil işleme süreçlerini kolaylaştırırken, SBERT modeli ise haber içeriklerinin daha derin anlamsal analizini gerçekleştirmektedir. Ayrıca YAKE algoritması haber içeriklerinden anahtar kelimeler çıkararak güvenilir kaynaklarla karşılaştırılmasını kolaylaştırmaktadır. Metinler arasındaki anlamsal benzerlik SBERT modeli kullanılarak ölçülmektedir. Kelime bazlı benzerlikler ise N-gram yöntemiyle ölçülmektedir. Bu iki yöntemden elde edilen sonuçlar birleştirilerek, haberin doğruluk skoru hesaplanmakta ve kullanıcıya sunulmaktadır. Önerilen sistem, sahte haberlerin tespitinde yüksek doğruluk oranları sunmakta ve gerçek zamanlı veri analizi sayesinde güncel olaylardaki yanlış bilgileri hızla belirlemektedir. Çok dilli ve çok modaliteli bir yapıya kavuşturulması hedeflenen sistemin uluslararası sahte haber tespiti için de etkili bir çözüm sunması hedeflenmektedir.
Etik Beyan
Bu makalenin yazarları, bu çalışmada kullanılan materyal ve yöntemlerin etik kurul izni veya yasal-özel izin gerektirmediğini beyan etmektedir.
Destekleyen Kurum
TÜBİTAK
Teşekkür
Bu çalışma TÜBİTAK 1002-A Hızlı Destek Modülü, 124E844 numaralı proje kapsamında desteklenmektedir.
Kaynakça
-
[1] M. F. Çömlekçi, “Sosyal medyada dezenformasyon ve haber doğrulama platformlarinin pratikleri,” Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, vol. 7, no. 3, pp. 1549-1563, Dec. 2019.
-
[2] S. G. Taşkın, E. U. Küçüksille, and K. Topal, “Twitter üzerinde Türkçe sahte haber tespiti,” Balıkesir Üniversitesi Fen Bilimleri Enstitüsü Dergisi, vol. 23, no. 1, pp. 151-172, 2021, DOI:10.25092/baunfbed.843909
-
[3] A. M. Kırık, and N. Samadli, “Fake News Spread in Online Media During The Second Karabakh War” RESS Journal, vol. 11, no. 5, pp. 97-108, Sep. 2024, DOI: 10.17121/ressjournal.3571.
-
[4] S. S. Akyüz, and M. Özkan, “Kriz Dönemlerinde Enformasyon Süreçleri: Ukrayna-Rusya Savaşında Dolaşıma Giren Sahte Haberlerin Analizi” Uluslararası Kültürel ve Sosyal Araştırmalar Dergisi, vol. 8, no. 2, pp. 66-82, Dec. 2022, DOI: 10.46442/intjcss.1213993.
-
[5] N. Reimers, and I. Gurevych “Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks” arXiv preprint arXiv vol. 1908, pp. 10084, Aug. 2019.
-
[6] Y. Chu et al., “Refined SBERT: Representing sentence BERT in manifold space,” Neurocomputing, vol. 555, pp. 126453, Jul. 2023.
-
[7] I. Lopez-Gazpio et al., “Word n-gram attention models for sentence similarity and inference,” Expert Systems with Applications, vol. 132, pp. 1-11, Apr. 2019.
-
[8] M. Sudhakar, and K. P. Kaliyamurthie, “Detection of fake news from social media using support vector machine learning algorithms,” Measurement: Sensors, vol. 32, pp. 101028, Feb. 2024.
-
[9] R. Campos, et al., “YAKE! Keyword extraction from single documents using multiple local features,” Information Sciences, vol. 509, pp. 257-289, Sep. 2019.
-
[10] Z. Xu, and J. Zhang, “Extracting keywords from texts based on word frequency and association features,” Procedia Computer Science, vol. 187, pp. 77-82, 2021.
-
[11] G. Yavuz, “Web kazıma ve duygu analizi temelli ürün analiz sistemi/Web scraping and sentiment analysis based product analysis system,” M.S. thesis, Aksaray Üniversitesi Sosyal Bilimler Enstitüsü, 2023.
-
[12] V. Nair, J. Pareek, and S. Bhatt, “A Knowledge-Based Deep Learning Approach for Automatic Fake News Detection using BERT on Twitter,” Procedia Computer Science, vol. 235, pp. 1870-1882, 2024.
-
[13] M. N. Awan, and M. O. Beg, “Top-rank: a topicalpostionrank for extraction and classification of keyphrases in text,” Computer Speech & Language, vol. 65, pp. 101116, Jun. 2020.
-
[14] E. Ş. Dinçer, D. Kayaoğlu, and S. Safarlı, “Metin madenciliği ve duygu analizi ile siber zorbalık tespiti,” Eskişehir Türk Dünyası Uygulama ve Araştırma Merkezi Bilişim Dergisi, vol. 3, no. 2, pp. 38-45, Apr. 2022.
-
[15] L. Syed, et al., “Hybrid weakly supervised learning with deep learning technique for detection of fake news from cyber propaganda,” Array, vol. 19, pp. 100309, Jul. 2023.
-
[16] G. K. Koru and Ç. Uluyol, “Detection of Turkish fake news from tweets with BERT models,” .IEEE Access, vol. 12, pp. 14918-14931, 2024, DOI: 10.1109/ACCESS.2024.3354165
-
[17] F. A. Özbay and B. Alataş, “Çevrimiçi sosyal medyada sahte haber tespiti,” Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, vol. 11, no. 1, pp. 91-103, 2020, DOI: 10.24012/dumf.629368
-
[18] İ. Kulaksız, “Doğal Dil İşleme Kullanılarak Ana Akım Medyada Türkçe Sahte Haber Tespiti” Yüksek Lisans Tezi, Bilgisayar Mühendisliği ABD, Atatürk Üniversitesi Fen Bilimleri Enstitüsü, Erzurum, Türkiye, 2025.
-
[19] N. Z. KAYALI and S. İ. OMURCA, "Candidate Summary Elimination Approach for Turkish Hybrid Text Summarization," Innovations in Intelligent Systems and Applications Conference (ASYU), pp. 1-6, 2024, DOI: 10.1109/ASYU62119.2024.10756999.
-
[20] T. Uçkan, and K. Karabulut, “The Effectiveness of Machine Learning Algorithms in Extractive Text Summarization: A Comparative Analysis of K-Means, Random Forest, GBM, Logistic Regression, and SVM,” Doğu Fen Bilimleri Dergisi, vol. 7 no. 2, pp. 77-91, 2024, DOI: 10.57244/dfbd.1538959.
-
[21] A. Nenkova, and K. McKeown, “A survey of text summarization techniques,” Mining text data, pp. 43-76, Jan. 2012.
-
[22] A. C. Akdeniz, “Makine öğrenmesi yöntemleri kullanılarak uzaktan eğitim konulu Türkçe tweetlerin duygu analizi,” M.S. thesis, Konya Teknik Üniversitesi, Apr. 2022.
-
[23] C. Hark, et al., “Metin özetlemesi için düğüm merkezliklerine dayalı denetimsiz bir yaklaşım,” Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, vol. 8, no.3, pp. 1109-1118, 2019.
-
[24] A. İ. Kısayol, and M. Turan, “Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması,” Düzce Üniversitesi Bilim ve Teknoloji Dergisi, vol.6, no. 4, pp. 1047-1057, 2018.
-
[25] G. Soğancıoğlu, “A semantic sentence similarity estimation approach for the biomedical domain,” Doctoral dissertation, Boğaziçi University, 2013.
-
[26] Y. Liu, and M. Lapata, “Text summarization with pretrained encoders,” arXiv preprint arXiv 1908.08345, Sep. 2019.
-
[27] A. S. Birdevrim, A. Boyacı, and D. A. S. Al Thani, “İYİLEŞTİRİLMİŞ OTOMATİK ANAHTAR KELİME ÇIKARIMI BRAKE,” İstanbul Ticaret Üniversitesi Teknoloji ve Uygulamalı Bilimler Dergisi, vol. 1, no. 1, pp. 11-19, 2018.
-
[28] A. Çelikten, H. Bulut, and A. Onan, “A semantic Similarity-Based approach to extract respiratory disease-symptom relations from biomedical literature,” Journal of the Faculty of Engineering and Architecture of Gazi University, vol. 40, no. 1, pp. 121-134, 2025.
-
[29] L. Soykan, C. Karsak and İ. D. El-Kahlout, "Adult Content Detection in Search Engine Queries," 2022 30th Signal Processing and Communications Applications Conference (SIU), pp. 1-4, 2022, DOI: 10.1109/SIU55565.2022.9864759.
-
[30] A. Karaca, and Ö. Aydın, “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme,” Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol. 39, no. 1, pp. 485-496, 2024, DOI: 10.17341/gazimmfd.963240
-
[31] E. Erdağı, and V. Tunali, “Comparison of feature-based sentence ranking methods for extractive summarization of turkish news texts,” Sigma Journal of Engineering and Natural Sciences, vol. 42, no. 2, pp. 321-334, Apr. 2024, DOI: 10.14744/sigma.2023.00076.
-
[32] S. D. Myla, E. R. Saini and E. N. Kapoor, "Auto Text Summarization in Natural Language Processing: Review," 2nd International Conference on Intelligent Data Communication Technologies and Internet of Things (IDCIoT), pp. 1258-1267, Jan. 2024, DOI: 10.1109/IDCIoT59759.2024.10467376.
-
[33] T. Zhang, et al., “Bertscore: Evaluating text generation with bert,” arXiv preprint arXiv:1904.09675, 2019.
-
[34] W. Zhao, et al., “MoverScore: Text generation evaluating with contextualized embeddings and earth mover distance,” arXiv preprint arXiv:1909.02622, Sep. 2019.
-
[35] D. Demirbilek and M. Ersoy, “Sosyal Medya Paylaşımlarında Karar Mekanizmalarının Öğrenme Algoritmalarıyla Karşılaştırmalı Analizi,” Uluslararası Sürdürülebilir Mühendislik ve Teknoloji Dergisi, vol. 8, no. 1, pp. 8–25, 2024, DOI: 10.62301/usmtd.1462808.
Development of a Deep Learning Based News Verification System for The Detection of Suspicious News
Yıl 2025,
Cilt: 16 Sayı: 2, 357 - 367, 30.06.2025
Nurcan Yardımcı
,
Burhan Ergen
,
Hatice Karaoğlu
Öz
The proliferation of digital media causes fake news to negatively affect society. Social media platforms, in particular, cause false information to spread rapidly. This situation leads to misdirection of individuals, social polarization and loss of trust. Therefore, rapid and reliable detection of fake news has become one of the most important problems of our time. In this study, an innovative news verification system based on deep learning and natural language processing (NLP) has been developed. The system aims to protect users from misinformation by analyzing the accuracy of digital news content. The developed model optimizes news texts by processing them with the Zemberek library, and then enriches the meaning of the texts with BERT-based summarization methods. While Zemberek facilitates the natural language processing of Turkish texts, the SBERT model performs deeper semantic analysis of news content. Moreover, the YAKE algorithm extracts keywords from news content, thereby facilitating its comparison with reliable sources. Semantic similarity between texts is measured using the SBERT model. Word-based similarities are measured with the N-gram method. By combining the results obtained from these two methods, the accuracy score of the news is calculated and presented to the user. The proposed system offers high accuracy rates in detecting fake news and quickly identifies misleading information in current events thanks to real-time data analysis. The system, which is intended to be enhanced with a multilingual and multimodal structure, is also expected to provide an effective solution for international fake news detection.
Kaynakça
-
[1] M. F. Çömlekçi, “Sosyal medyada dezenformasyon ve haber doğrulama platformlarinin pratikleri,” Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, vol. 7, no. 3, pp. 1549-1563, Dec. 2019.
-
[2] S. G. Taşkın, E. U. Küçüksille, and K. Topal, “Twitter üzerinde Türkçe sahte haber tespiti,” Balıkesir Üniversitesi Fen Bilimleri Enstitüsü Dergisi, vol. 23, no. 1, pp. 151-172, 2021, DOI:10.25092/baunfbed.843909
-
[3] A. M. Kırık, and N. Samadli, “Fake News Spread in Online Media During The Second Karabakh War” RESS Journal, vol. 11, no. 5, pp. 97-108, Sep. 2024, DOI: 10.17121/ressjournal.3571.
-
[4] S. S. Akyüz, and M. Özkan, “Kriz Dönemlerinde Enformasyon Süreçleri: Ukrayna-Rusya Savaşında Dolaşıma Giren Sahte Haberlerin Analizi” Uluslararası Kültürel ve Sosyal Araştırmalar Dergisi, vol. 8, no. 2, pp. 66-82, Dec. 2022, DOI: 10.46442/intjcss.1213993.
-
[5] N. Reimers, and I. Gurevych “Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks” arXiv preprint arXiv vol. 1908, pp. 10084, Aug. 2019.
-
[6] Y. Chu et al., “Refined SBERT: Representing sentence BERT in manifold space,” Neurocomputing, vol. 555, pp. 126453, Jul. 2023.
-
[7] I. Lopez-Gazpio et al., “Word n-gram attention models for sentence similarity and inference,” Expert Systems with Applications, vol. 132, pp. 1-11, Apr. 2019.
-
[8] M. Sudhakar, and K. P. Kaliyamurthie, “Detection of fake news from social media using support vector machine learning algorithms,” Measurement: Sensors, vol. 32, pp. 101028, Feb. 2024.
-
[9] R. Campos, et al., “YAKE! Keyword extraction from single documents using multiple local features,” Information Sciences, vol. 509, pp. 257-289, Sep. 2019.
-
[10] Z. Xu, and J. Zhang, “Extracting keywords from texts based on word frequency and association features,” Procedia Computer Science, vol. 187, pp. 77-82, 2021.
-
[11] G. Yavuz, “Web kazıma ve duygu analizi temelli ürün analiz sistemi/Web scraping and sentiment analysis based product analysis system,” M.S. thesis, Aksaray Üniversitesi Sosyal Bilimler Enstitüsü, 2023.
-
[12] V. Nair, J. Pareek, and S. Bhatt, “A Knowledge-Based Deep Learning Approach for Automatic Fake News Detection using BERT on Twitter,” Procedia Computer Science, vol. 235, pp. 1870-1882, 2024.
-
[13] M. N. Awan, and M. O. Beg, “Top-rank: a topicalpostionrank for extraction and classification of keyphrases in text,” Computer Speech & Language, vol. 65, pp. 101116, Jun. 2020.
-
[14] E. Ş. Dinçer, D. Kayaoğlu, and S. Safarlı, “Metin madenciliği ve duygu analizi ile siber zorbalık tespiti,” Eskişehir Türk Dünyası Uygulama ve Araştırma Merkezi Bilişim Dergisi, vol. 3, no. 2, pp. 38-45, Apr. 2022.
-
[15] L. Syed, et al., “Hybrid weakly supervised learning with deep learning technique for detection of fake news from cyber propaganda,” Array, vol. 19, pp. 100309, Jul. 2023.
-
[16] G. K. Koru and Ç. Uluyol, “Detection of Turkish fake news from tweets with BERT models,” .IEEE Access, vol. 12, pp. 14918-14931, 2024, DOI: 10.1109/ACCESS.2024.3354165
-
[17] F. A. Özbay and B. Alataş, “Çevrimiçi sosyal medyada sahte haber tespiti,” Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, vol. 11, no. 1, pp. 91-103, 2020, DOI: 10.24012/dumf.629368
-
[18] İ. Kulaksız, “Doğal Dil İşleme Kullanılarak Ana Akım Medyada Türkçe Sahte Haber Tespiti” Yüksek Lisans Tezi, Bilgisayar Mühendisliği ABD, Atatürk Üniversitesi Fen Bilimleri Enstitüsü, Erzurum, Türkiye, 2025.
-
[19] N. Z. KAYALI and S. İ. OMURCA, "Candidate Summary Elimination Approach for Turkish Hybrid Text Summarization," Innovations in Intelligent Systems and Applications Conference (ASYU), pp. 1-6, 2024, DOI: 10.1109/ASYU62119.2024.10756999.
-
[20] T. Uçkan, and K. Karabulut, “The Effectiveness of Machine Learning Algorithms in Extractive Text Summarization: A Comparative Analysis of K-Means, Random Forest, GBM, Logistic Regression, and SVM,” Doğu Fen Bilimleri Dergisi, vol. 7 no. 2, pp. 77-91, 2024, DOI: 10.57244/dfbd.1538959.
-
[21] A. Nenkova, and K. McKeown, “A survey of text summarization techniques,” Mining text data, pp. 43-76, Jan. 2012.
-
[22] A. C. Akdeniz, “Makine öğrenmesi yöntemleri kullanılarak uzaktan eğitim konulu Türkçe tweetlerin duygu analizi,” M.S. thesis, Konya Teknik Üniversitesi, Apr. 2022.
-
[23] C. Hark, et al., “Metin özetlemesi için düğüm merkezliklerine dayalı denetimsiz bir yaklaşım,” Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, vol. 8, no.3, pp. 1109-1118, 2019.
-
[24] A. İ. Kısayol, and M. Turan, “Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması,” Düzce Üniversitesi Bilim ve Teknoloji Dergisi, vol.6, no. 4, pp. 1047-1057, 2018.
-
[25] G. Soğancıoğlu, “A semantic sentence similarity estimation approach for the biomedical domain,” Doctoral dissertation, Boğaziçi University, 2013.
-
[26] Y. Liu, and M. Lapata, “Text summarization with pretrained encoders,” arXiv preprint arXiv 1908.08345, Sep. 2019.
-
[27] A. S. Birdevrim, A. Boyacı, and D. A. S. Al Thani, “İYİLEŞTİRİLMİŞ OTOMATİK ANAHTAR KELİME ÇIKARIMI BRAKE,” İstanbul Ticaret Üniversitesi Teknoloji ve Uygulamalı Bilimler Dergisi, vol. 1, no. 1, pp. 11-19, 2018.
-
[28] A. Çelikten, H. Bulut, and A. Onan, “A semantic Similarity-Based approach to extract respiratory disease-symptom relations from biomedical literature,” Journal of the Faculty of Engineering and Architecture of Gazi University, vol. 40, no. 1, pp. 121-134, 2025.
-
[29] L. Soykan, C. Karsak and İ. D. El-Kahlout, "Adult Content Detection in Search Engine Queries," 2022 30th Signal Processing and Communications Applications Conference (SIU), pp. 1-4, 2022, DOI: 10.1109/SIU55565.2022.9864759.
-
[30] A. Karaca, and Ö. Aydın, “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme,” Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol. 39, no. 1, pp. 485-496, 2024, DOI: 10.17341/gazimmfd.963240
-
[31] E. Erdağı, and V. Tunali, “Comparison of feature-based sentence ranking methods for extractive summarization of turkish news texts,” Sigma Journal of Engineering and Natural Sciences, vol. 42, no. 2, pp. 321-334, Apr. 2024, DOI: 10.14744/sigma.2023.00076.
-
[32] S. D. Myla, E. R. Saini and E. N. Kapoor, "Auto Text Summarization in Natural Language Processing: Review," 2nd International Conference on Intelligent Data Communication Technologies and Internet of Things (IDCIoT), pp. 1258-1267, Jan. 2024, DOI: 10.1109/IDCIoT59759.2024.10467376.
-
[33] T. Zhang, et al., “Bertscore: Evaluating text generation with bert,” arXiv preprint arXiv:1904.09675, 2019.
-
[34] W. Zhao, et al., “MoverScore: Text generation evaluating with contextualized embeddings and earth mover distance,” arXiv preprint arXiv:1909.02622, Sep. 2019.
-
[35] D. Demirbilek and M. Ersoy, “Sosyal Medya Paylaşımlarında Karar Mekanizmalarının Öğrenme Algoritmalarıyla Karşılaştırmalı Analizi,” Uluslararası Sürdürülebilir Mühendislik ve Teknoloji Dergisi, vol. 8, no. 1, pp. 8–25, 2024, DOI: 10.62301/usmtd.1462808.