Araştırma Makalesi

Türkçe Tweetler üzerinde Makine Öğrenmesi ile Nefret Söylemi Tespiti

Sayı: 24 15 Nisan 2021
PDF İndir
TR EN

Türkçe Tweetler üzerinde Makine Öğrenmesi ile Nefret Söylemi Tespiti

Öz

Sosyal medya ağlarının sayısının ve kullanımının artması beraberinde nefret söylemi içeriklerinin de daha çok paylaşılması problemini doğurmuştur. Gerek kamu otoriteleri gerekse sosyal medya ağlarının kendileri, artan nefret söylemiyle mücadele kapsamında çeşitli politikalar üretmektedir. Kullanıcılar tarafından üretilen verinin hacminin oldukça büyük olması nedeniyle nefret söylemi tespitinde otomatik sistemlere ihtiyaç duyulmaktadır. Özellikle son yıllarda başta İngilizce olmak üzere birçok dil üzerinde otomatik nefret söylemi çalışması yapılmış olmasına rağmen Türkçe üzerine kapsamlı bir çalışma henüz sunulmamıştır. Bu çalışma bu ihtiyaca karşılık vermek amacıyla yapılmıştır. Farklı hedef gruplara dair anahtar kelimelerin geçtiği 1000 adet Türkçe tweet toplanmış ve iki değerlendirici tarafından üç sınıflı (nefret söylemi, saldırgan ifade, hiçbiri) olarak ayrı ayrı etiketlenmiştir. Oluşturulan Türkçe nefret söylemi veri seti sonraki çalışmalarda kullanılabilmesi için kamuya açık olarak paylaşılmıştır. Bu veri seti üzerinde farklı özellik kümeleri ve farklı makine öğrenmesi algoritmaları kullanılarak çeşitli testler gerçekleştirilmiştir. Üç sınıflı veri seti üzerinde en yüksek performans %79,9 F-ölçüm değeri ile SMO (Sıralı Minimal Optimizasyon) algoritmasının kullanıldığı testte elde edilmiştir. Türkçe nefret söylemi tespitinde daha başarılı sonuçlar almak için veri seti boyutunun artırılması gerekirken, sunulan bu çalışmanın gelecekte yapılacak çalışmalara öncü niteliğinde olması beklenmektedir.

Anahtar Kelimeler

Kaynakça

  1. Akın, M. D., & Akın, A. A. (2007, Ağustos). Türk Dilleri İçin Açık Kaynaklı Doğal Dil İşleme Kütüphanesi: Zemberek. Elektrik Mühendisliği, (431), 38-44.
  2. Alp, H. (2016). Çingenelere Yönelik Nefret Söyleminin Ekşi Sözlük’te Yeniden Üretilmesi. Ankara Üniversitesi İLEF Dergisi, 3(2), 143-172. https://doi.org/10.24955/ilef.305520
  3. Alp, H. (2018). Suriyeli Sığınmacılara Yönelik Ayrımcı ve Ötekileştirici Söylemin Yerel Medyada Yeniden Üretilmesi. Karadeniz Teknik Üniversitesi İletişim Fakültesi Elektronik Dergisi, 5(15), 22-37.
  4. Arcan, H. E., (2013). Interrupted Social Peace: Hate Speech in Turkish Media. The IAFOR Journal of Media, Communication and Film, 1(1), 43-56. https://doi.org/10.22492/ijmcf.1.1.04
  5. Çelik, E. (2013). Nefret Söylemi İfade Özgürlüğünün Neresinde?. İnönü Üniversitesi Hukuk Fakültesi Dergisi, 4(2), 205-239. https://doi.org/10.21492/inuhfd.239845
  6. Djuric, N., Zhou, J., Morris, R., Grbovic, M., Radosavljevic, V., & Bhamidipati, N. (2015, Mayıs). Hate Speech Detection with Comment Embeddings. Proceedings of the 24th International Conference on World Wide Web (WWW’15) (pp. 29-30). https://doi.org/10.1145/2740908.2742760
  7. Fortuna, P., & Nunes, S. (2018, Temmuz). A Survey on Automatic Detection of Hate Speech in Text. ACM Computing Surveys (CSUR), 51(4). https://doi.org/10.1145/3232676
  8. Gagliardone, I., Gal, D., Alves, T., & Martinez, G. (2015). Countering Online Hate Speech. Paris: UNESCO Publishing.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

15 Nisan 2021

Gönderilme Tarihi

26 Mart 2021

Kabul Tarihi

6 Nisan 2021

Yayımlandığı Sayı

Yıl 1970 Sayı: 24

Kaynak Göster

APA
Mayda, İ., Diri, B., & Yıldız, T. (2021). Türkçe Tweetler üzerinde Makine Öğrenmesi ile Nefret Söylemi Tespiti. Avrupa Bilim ve Teknoloji Dergisi, 24, 328-334. https://doi.org/10.31590/ejosat.903854

Cited By