Research Article

Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli

Volume: 6 Number: 1 June 30, 2023
TR EN

Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli

Abstract

İnsanların çevrimiçi dünyada, özellikle sosyal medya platformlarında iletişim kurmasıyla birlikte, kullanıcılar tarafından oluşturulan içeriklerin internet üzerindeki miktarı artmıştır. Bu platformların anonim yapısı nedeniyle, kullanıcılar hakaret ve nefret içeren düşünceleri paylaşabilmektedir. Bu istenmeyen içerikler, hem bireyler hem de toplumlar üzerinde olumsuz etkilere neden olabilir. Bu nedenle, hakaret ve nefret içeren içeriklerin tespit edilmesi ve filtrelenmesi önemlidir. Bu tür içeriklerin manuel olarak tespit edilmesi zordur, bu yüzden otomatik yöntemlere ihtiyaç duyulmaktadır. Son yıllarda, çevrimiçi hakaret ve nefret söylemlerinin tespitiyle ilgili akademik araştırmalarda artış görülmektedir. BERT gibi transfer öğrenme modelleriyle İngilizce hakaret ve nefret söylemlerinin otomatik tespiti konusunda umut verici sonuçlar elde edilmiştir. Ancak, Türkçe gibi sınırlı kaynaklara sahip dillerde hakaret ve nefret söyleminin otomatik tespiti üzerine yapılan araştırma sayısı oldukça azdır. Bu çalışmada, Türkçe dili için hakaret ve nefret söylemi otomatik tespit sistemi geliştirme çabalarının sonuçları paylaşılmıştır. İlk olarak, Türkçe veri seti oluşturmak için otomatik etiketleme yöntemi önerilmiş ve bu yöntemle Türkçe hakaret ve nefret söylemi veri seti oluşturulmuştur. Doğal dil işleme alanında en iyi sonuçlar veren BERT modelinin farklı varyantları ve çeşitli Türkçe hakaret ve nefret söylemi veri setleri kullanılarak deneyler gerçekleştirilmiştir. Yapılan deneyler sonucunda, en iyi performansa sahip olan XLM-RoBERTa modeli için hiperparametre optimizasyonu yapılmış ve en kapsamlı veri setleri kullanılarak nihai Türkçe hakaret ve nefret söylemi otomatik tespit sistemi oluşturulmuştur. Oluşturulan Türkçe hakaret ve nefret söylemi otomatik tespit modeli, diğer çalışmalarla aynı test veri setini kullanarak karşılaştırılmıştır.

Keywords

References

  1. Sap, M., Card, D., Gabriel, S., Choi, Y., A, N., 2019. The risk of racial bias in hate speech detection. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics , 1668– 1678.
  2. Mathew, B., Dutt, R., Goyal, P., Mukherjee, A., 2019. Spread of hate speech in online social media. In Proceedings of WebSci. ACM.
  3. Das, M., Mathew, B., Saha, P., Goyal, P., Mukherjee, A., 2020. Hate speech in online social media. ACM SIGWEB Newsletter, (Autumn) , 1–8.
  4. Rizwan, H., Shakeel, M.H., Karim, A., 2020. Hatespeech and offensive language detection in roman urdu. In Proceedings of the 2020 conference on empirical methods in natural language processing (EMNLP) , 2512–2522.
  5. https://www.theguardian.com/world/2018/mar/14/facebook-accused-by-sri-lanka-of-failing-tocontrol-hate-speech. (15.07.2022)
  6. https://www.reuters.com/investigates/specialreport/myanmar-facebook-hate. (15.07.2022)
  7. https://money.cnn.com/2017/06/01/technology/twitter-facebook-hate-speech-europe/index.html (15.07.2022)
  8. https://help.twitter.com/tr/rules-andpolicies/hateful-conduct-policy. (17.07.2022)

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

June 30, 2023

Submission Date

May 22, 2023

Acceptance Date

June 22, 2023

Published in Issue

Year 2023 Volume: 6 Number: 1

APA
Kurt, M. S., & Yücel Demirel, E. (2023). Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilimi, 6(1), 61-73. https://izlik.org/JA83CD66TR
AMA
1.Kurt MS, Yücel Demirel E. Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Data Sci. J. 2023;6(1):61-73. https://izlik.org/JA83CD66TR
Chicago
Kurt, Mehmet Salih, and Eylem Yücel Demirel. 2023. “Türkçe Hakaret Ve Nefret Söylemi Otomatik Tespit Modeli”. Veri Bilimi 6 (1): 61-73. https://izlik.org/JA83CD66TR.
EndNote
Kurt MS, Yücel Demirel E (June 1, 2023) Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilimi 6 1 61–73.
IEEE
[1]M. S. Kurt and E. Yücel Demirel, “Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli”, Data Sci. J., vol. 6, no. 1, pp. 61–73, June 2023, [Online]. Available: https://izlik.org/JA83CD66TR
ISNAD
Kurt, Mehmet Salih - Yücel Demirel, Eylem. “Türkçe Hakaret Ve Nefret Söylemi Otomatik Tespit Modeli”. Veri Bilimi 6/1 (June 1, 2023): 61-73. https://izlik.org/JA83CD66TR.
JAMA
1.Kurt MS, Yücel Demirel E. Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Data Sci. J. 2023;6:61–73.
MLA
Kurt, Mehmet Salih, and Eylem Yücel Demirel. “Türkçe Hakaret Ve Nefret Söylemi Otomatik Tespit Modeli”. Veri Bilimi, vol. 6, no. 1, June 2023, pp. 61-73, https://izlik.org/JA83CD66TR.
Vancouver
1.Mehmet Salih Kurt, Eylem Yücel Demirel. Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Data Sci. J. [Internet]. 2023 Jun. 1;6(1):61-73. Available from: https://izlik.org/JA83CD66TR