Araştırma Makalesi
BibTex RIS Kaynak Göster

Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti

Yıl 2025, Cilt: 14 Sayı: 1, 1 - 1
https://doi.org/10.28948/ngumuh.1551734

Öz

Bu çalışmada, Türkçe sosyal medya paylaşımlarındaki tehdit ve hakaret içeriklerinin tespiti amaçlanmıştır. Doğal Dil İşleme teknikleri kullanılarak sosyal medya verileri üzerinde derin öğrenme algoritmalarıyla modeller geliştirilmiş ve bu modeller makine öğrenmesi algoritmaları ile karşılaştırılmıştır. Türkçe sosyal medya verilerinden toplanan veri kümesi etiketlenerek Uzun Kısa Süreli Bellek ve BERT derin öğrenme modelleri ile suç tespiti amacıyla kullanılmıştır. Derin öğrenme modelleri, makine öğrenmesi modellerinden Destek Vektör Makineleri, Rastgele Orman ve Gradyan Artırma modelleri ile karşılaştırılmıştır. Önerilen derin öğrenme modelleri, %90 doğruluk oranıyla tehdit ve hakaret içeriklerini başarılı bir şekilde tespit ederek makine öğrenmesi modellerine kıyasla daha üstün performans sergilemiştir.

Kaynakça

  • İ. Mayda, B. Diri ve T. Yıldız. Türkçe tweetler üzerinde makine öğrenmesi ile nefret söylemi tespiti. Avrupa Bilim Ve Teknoloji Dergisi (24), 328-334. https://doi.org/10.31590/ejosat.903854
  • Türkiye Cumhuriyeti, 5237 sayılı Türk Ceza Kanunu. Resmî Gazete, 12 Ekim 2004, sayı 25611.
  • A. Bozyiğit, S. Utku, and E. Nasiboğlu. Cyberbullying detection by using artificial neural network models. 4th International Conference on Computer Science and Engineering (UBMK), 2019. https://doi.org/10.1109/UBMK.2019.8907118
  • H. Karayigit, C. Aci, and A. Akdagli. Detecting abusive instagram comments in Turkish using convolutional neural network and machine learning methods. Expert Systems with Applications, 114802, 2021. https://doi.org/10.1016/J.ESWA.2021.114802
  • S. Küçük, and İ. Şahin. Facebook zorbalığı ve mağduriyeti ölçeklerinin Türkçeye uyarlanması, Eğitim ve Bilim Dergisi, vol. 40, no. 178, pp. 1-15, 2015.
  • O. Kaynar, B. A. Erdoğan, and M. Kaya. Makine öğrenmesi ve öznitelik seçim yöntemleriyle saldırı tespiti, Bilgisayar Mühendisliği ve Bilimleri Dergisi, 11 (2), 56-68, 2018.
  • F. Beyhan, B. Çarık, İ. Arın, A. Terzioğlu, B. Yanikoglu ve R. Yeniterzi. A Turkish hate speech dataset and detection system. In Proceedings of the Thirteenth Language Resources and Evaluation Conference, pages 4177–4185, Marseille, France. European Language Resources Association, 2022.
  • A. Najafi ve O. Varol. Turkish hate speech detection online with TurkishBERTweet. In Proceedings of the 7th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2024), pages 185–189, St. Julians, Malta. ACL, 2024.
  • S. Dehghan ve B. Yanikoglu. Evaluating ChatGPT’s ability to detect hate speech in Turkish tweets. In Proceedings of the 7th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2024), pages 54–59, St. Julians, Malta, ACL, 2024.
  • Ş. Bayrak, A. Karaca, F. Toson, A. Kocabey ve F. B. Arslanoglu. Detection of hate speech in Turkish social media posts with BERT-Base model. 31st Signal Processing and Communications Applications Conference (SIU), pp. 1-4, Istanbul, Turkiye, 2023.
  • Z. M. Husunbeyi, D. Akar ve A. Ozgur. Identifying hate speech using neural networks and discourse analysis techniques. In Proceedings of the First Workshop on Language Technologies and Resources for a Fair, Inclusive, and Safe Society within the 13th Language Resources and Evaluation Conference, pp. 32–41, Marseille, France. European Language Resources Association, 2022.
  • S. Özar. Türk hukukunda nefret suçlarına Avrupa güvenlik ve iş birliği teşkilatı taahhütleri çerçevesinde- genel bir bakış. TAAD, (1009196), 2021. https://doi.org/10.54049/taad.1009196
  • Ç. Çöltekin, Ç. A Corpus of Turkish offensive language on social media. Proceedings of the 12th Language Resources and Evaluation Conference (LREC), 2020.
  • Kemik Doğal Dil İşleme Grubu Veri Kümeleri. http://www.kemik.yildiz.edu.tr/veri_kumelerimiz.html, Erişildi 11 Eylül 2024.
  • A. Akın, zemberek-nlp. https://github.com/ahmetaa/zemberek-nlp, Erişildi 11 Eylül 2024.
  • C. Cortes, V. Vapnik. Support-vector networks. Machine Learning, pp. 273–297, 1995 https://doi.org/10.1007/BF00994018
  • J. Yang, A.J. Awan, & G. Vall-llosera. Support vector machines on noisy intermediate-scale quantum computers. 2019, ArXiv, abs/1909.11988.
  • L. Breiman. Random Forests. Machine Learning. 45. 5-32, 2001.
  • T. Zhang. Improving convection trigger functions in deep convective parameterisation schemes using machine learning, Journal of Advances in Modeling Earth Systems, vol. 13, no. 5, 2021.
  • F. Jerome. Greedy Function Approximation: A Gradient Boosting Machine. The Annals of Statistics. 29, 2000. 10.1214/aos/1013203451.
  • S. Hochreiter and J. Schmidhuber. (1997). Long short-term memory. Neural Computation, 9(8), pp. 1735-1780, 1997.
  • J. Devlin, M. W. Chang, K. Lee, and K. Toutanova. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT, 2019

Crime detection on social media data using deep learning and machine learning methods

Yıl 2025, Cilt: 14 Sayı: 1, 1 - 1
https://doi.org/10.28948/ngumuh.1551734

Öz

This study aims to detect threats and insults in Turkish social media posts. Models have been developed using Natural Language Processing techniques and deep learning algorithms, and the proposed models have been compared with machine learning algorithms. The dataset, collected from Turkish social media posts, has been labelled and used for crime detection in social media using Long Short-Term Memory and BERT deep learning models. The deep learning models have been compared with machine learning models such as Support Vector Machines, Random Forest, and Gradient Boosting. The proposed deep learning models have outperformed the machine learning models, successfully detecting threatening content with an accuracy of 90%.

Kaynakça

  • İ. Mayda, B. Diri ve T. Yıldız. Türkçe tweetler üzerinde makine öğrenmesi ile nefret söylemi tespiti. Avrupa Bilim Ve Teknoloji Dergisi (24), 328-334. https://doi.org/10.31590/ejosat.903854
  • Türkiye Cumhuriyeti, 5237 sayılı Türk Ceza Kanunu. Resmî Gazete, 12 Ekim 2004, sayı 25611.
  • A. Bozyiğit, S. Utku, and E. Nasiboğlu. Cyberbullying detection by using artificial neural network models. 4th International Conference on Computer Science and Engineering (UBMK), 2019. https://doi.org/10.1109/UBMK.2019.8907118
  • H. Karayigit, C. Aci, and A. Akdagli. Detecting abusive instagram comments in Turkish using convolutional neural network and machine learning methods. Expert Systems with Applications, 114802, 2021. https://doi.org/10.1016/J.ESWA.2021.114802
  • S. Küçük, and İ. Şahin. Facebook zorbalığı ve mağduriyeti ölçeklerinin Türkçeye uyarlanması, Eğitim ve Bilim Dergisi, vol. 40, no. 178, pp. 1-15, 2015.
  • O. Kaynar, B. A. Erdoğan, and M. Kaya. Makine öğrenmesi ve öznitelik seçim yöntemleriyle saldırı tespiti, Bilgisayar Mühendisliği ve Bilimleri Dergisi, 11 (2), 56-68, 2018.
  • F. Beyhan, B. Çarık, İ. Arın, A. Terzioğlu, B. Yanikoglu ve R. Yeniterzi. A Turkish hate speech dataset and detection system. In Proceedings of the Thirteenth Language Resources and Evaluation Conference, pages 4177–4185, Marseille, France. European Language Resources Association, 2022.
  • A. Najafi ve O. Varol. Turkish hate speech detection online with TurkishBERTweet. In Proceedings of the 7th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2024), pages 185–189, St. Julians, Malta. ACL, 2024.
  • S. Dehghan ve B. Yanikoglu. Evaluating ChatGPT’s ability to detect hate speech in Turkish tweets. In Proceedings of the 7th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2024), pages 54–59, St. Julians, Malta, ACL, 2024.
  • Ş. Bayrak, A. Karaca, F. Toson, A. Kocabey ve F. B. Arslanoglu. Detection of hate speech in Turkish social media posts with BERT-Base model. 31st Signal Processing and Communications Applications Conference (SIU), pp. 1-4, Istanbul, Turkiye, 2023.
  • Z. M. Husunbeyi, D. Akar ve A. Ozgur. Identifying hate speech using neural networks and discourse analysis techniques. In Proceedings of the First Workshop on Language Technologies and Resources for a Fair, Inclusive, and Safe Society within the 13th Language Resources and Evaluation Conference, pp. 32–41, Marseille, France. European Language Resources Association, 2022.
  • S. Özar. Türk hukukunda nefret suçlarına Avrupa güvenlik ve iş birliği teşkilatı taahhütleri çerçevesinde- genel bir bakış. TAAD, (1009196), 2021. https://doi.org/10.54049/taad.1009196
  • Ç. Çöltekin, Ç. A Corpus of Turkish offensive language on social media. Proceedings of the 12th Language Resources and Evaluation Conference (LREC), 2020.
  • Kemik Doğal Dil İşleme Grubu Veri Kümeleri. http://www.kemik.yildiz.edu.tr/veri_kumelerimiz.html, Erişildi 11 Eylül 2024.
  • A. Akın, zemberek-nlp. https://github.com/ahmetaa/zemberek-nlp, Erişildi 11 Eylül 2024.
  • C. Cortes, V. Vapnik. Support-vector networks. Machine Learning, pp. 273–297, 1995 https://doi.org/10.1007/BF00994018
  • J. Yang, A.J. Awan, & G. Vall-llosera. Support vector machines on noisy intermediate-scale quantum computers. 2019, ArXiv, abs/1909.11988.
  • L. Breiman. Random Forests. Machine Learning. 45. 5-32, 2001.
  • T. Zhang. Improving convection trigger functions in deep convective parameterisation schemes using machine learning, Journal of Advances in Modeling Earth Systems, vol. 13, no. 5, 2021.
  • F. Jerome. Greedy Function Approximation: A Gradient Boosting Machine. The Annals of Statistics. 29, 2000. 10.1214/aos/1013203451.
  • S. Hochreiter and J. Schmidhuber. (1997). Long short-term memory. Neural Computation, 9(8), pp. 1735-1780, 1997.
  • J. Devlin, M. W. Chang, K. Lee, and K. Toutanova. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT, 2019
Toplam 22 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Derin Öğrenme, Nöral Ağlar, Doğal Dil İşleme
Bölüm Makaleler
Yazarlar

Sultan Zeybek 0000-0002-1298-9499

Erken Görünüm Tarihi 10 Aralık 2024
Yayımlanma Tarihi
Gönderilme Tarihi 18 Eylül 2024
Kabul Tarihi 14 Kasım 2024
Yayımlandığı Sayı Yıl 2025 Cilt: 14 Sayı: 1

Kaynak Göster

APA Zeybek, S. (2024). Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, 14(1), 1-1. https://doi.org/10.28948/ngumuh.1551734
AMA Zeybek S. Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti. NÖHÜ Müh. Bilim. Derg. Aralık 2024;14(1):1-1. doi:10.28948/ngumuh.1551734
Chicago Zeybek, Sultan. “Derin öğrenme Ve Makine öğrenmesi yöntemleri Ile Sosyal Medya Verilerinden Suç Tespiti”. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi 14, sy. 1 (Aralık 2024): 1-1. https://doi.org/10.28948/ngumuh.1551734.
EndNote Zeybek S (01 Aralık 2024) Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi 14 1 1–1.
IEEE S. Zeybek, “Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti”, NÖHÜ Müh. Bilim. Derg., c. 14, sy. 1, ss. 1–1, 2024, doi: 10.28948/ngumuh.1551734.
ISNAD Zeybek, Sultan. “Derin öğrenme Ve Makine öğrenmesi yöntemleri Ile Sosyal Medya Verilerinden Suç Tespiti”. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi 14/1 (Aralık 2024), 1-1. https://doi.org/10.28948/ngumuh.1551734.
JAMA Zeybek S. Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti. NÖHÜ Müh. Bilim. Derg. 2024;14:1–1.
MLA Zeybek, Sultan. “Derin öğrenme Ve Makine öğrenmesi yöntemleri Ile Sosyal Medya Verilerinden Suç Tespiti”. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, c. 14, sy. 1, 2024, ss. 1-1, doi:10.28948/ngumuh.1551734.
Vancouver Zeybek S. Derin öğrenme ve makine öğrenmesi yöntemleri ile sosyal medya verilerinden suç tespiti. NÖHÜ Müh. Bilim. Derg. 2024;14(1):1-.

download