With the widespread use of social media, it is seen that negative posts such as hate speech towards various groups can spread uncontrollably through social networks. The migration to Turkey following the Syrian Civil War has brought hate speech towards refugees to the agenda. Hate speech is described as an important disease that must be prevented in order to ensure social peace. Considering the lack of studies conducted in Turkish on the detection of hate speech and the lack of a comprehensive data set that can be used in the detection of hate speech, this research has been studied on the detection of hate speech against refugees using machine learning methods in Turkish language posts on social networks. Experimental results are presented comparatively by applying logistic regression (LR), Artificial Neural Network (ANN), Support Vector Machines (SVM), Decision Trees and Random Forest models. It has been revealed that the performance values obtained with Random Forest, ANN and LR are higher than the SVM and Decision Tree models.
Sosyal medya kullanımının yaygınlaşması ile birlikte sosyal ağlar üzerinden çeşitli gruplara yönelik nefret söylemi gibi olumsuz paylaşımların kontrolsüzce yayılabildiği görülmektedir. Suriye İç Savaşı’nı takiben Türkiye’ye yaşanan göç, mültecilere yönelik nefret söylemini gündeme getirmiştir. Nefret söylemi, toplumsal huzurun sağlanabilmesi için önüne geçilmesi gereken önemli bir hastalık olarak betimlenmektedir. Nefret söyleminin tespiti konusunda Türkçe dilinde yapılan çalışmaların ve nefret söyleminin tespitinde kullanılabilecek kapsamlı bir veri setinin eksikliği göz önüne alınarak bu araştırmada sosyal ağlarda Türkçe dilinde yapılan paylaşımlarda mültecilere yönelik nefret söyleminin makine öğrenmesi yöntemleri ile tespiti üzerine çalışılmıştır. Lojistik regresyon (LR), Yapay Sinir Ağı (YSA), Destek Vektör Makineleri (DVM), Karar Ağaçları ve Rastgele Orman modelleri uygulanarak deneysel sonuçlar karşılaştırmalı olarak sunulmuştur. Rastgele Orman, YSA ve LR ile elde edilen performans değerlerinin DVM ve Karar Ağaçları modellerinden daha yüksek olduğu ortaya konmuştur.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 28 Şubat 2023 |
Yayımlandığı Sayı | Yıl 2023 |