TR
EN
Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli
Öz
İnsanların çevrimiçi dünyada, özellikle sosyal medya platformlarında iletişim kurmasıyla birlikte, kullanıcılar tarafından oluşturulan içeriklerin internet üzerindeki miktarı artmıştır. Bu platformların anonim yapısı nedeniyle, kullanıcılar hakaret ve nefret içeren düşünceleri paylaşabilmektedir. Bu istenmeyen içerikler, hem bireyler hem de toplumlar üzerinde olumsuz etkilere neden olabilir. Bu nedenle, hakaret ve nefret içeren içeriklerin tespit edilmesi ve filtrelenmesi önemlidir. Bu tür içeriklerin manuel olarak tespit edilmesi zordur, bu yüzden otomatik yöntemlere ihtiyaç duyulmaktadır. Son yıllarda, çevrimiçi hakaret ve nefret söylemlerinin tespitiyle ilgili akademik araştırmalarda artış görülmektedir. BERT gibi transfer öğrenme modelleriyle İngilizce hakaret ve nefret söylemlerinin otomatik tespiti konusunda umut verici sonuçlar elde edilmiştir. Ancak, Türkçe gibi sınırlı kaynaklara sahip dillerde hakaret ve nefret söyleminin otomatik tespiti üzerine yapılan araştırma sayısı oldukça azdır.
Bu çalışmada, Türkçe dili için hakaret ve nefret söylemi otomatik tespit sistemi geliştirme çabalarının sonuçları paylaşılmıştır. İlk olarak, Türkçe veri seti oluşturmak için otomatik etiketleme yöntemi önerilmiş ve bu yöntemle Türkçe hakaret ve nefret söylemi veri seti oluşturulmuştur. Doğal dil işleme alanında en iyi sonuçlar veren BERT modelinin farklı varyantları ve çeşitli Türkçe hakaret ve nefret söylemi veri setleri kullanılarak deneyler gerçekleştirilmiştir. Yapılan deneyler sonucunda, en iyi performansa sahip olan XLM-RoBERTa modeli için hiperparametre optimizasyonu yapılmış ve en kapsamlı veri setleri kullanılarak nihai Türkçe hakaret ve nefret söylemi otomatik tespit sistemi oluşturulmuştur. Oluşturulan Türkçe hakaret ve nefret söylemi otomatik tespit modeli, diğer çalışmalarla aynı test veri setini kullanarak karşılaştırılmıştır.
Anahtar Kelimeler
Kaynakça
- Sap, M., Card, D., Gabriel, S., Choi, Y., A, N., 2019. The risk of racial bias in hate speech detection. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics , 1668– 1678.
- Mathew, B., Dutt, R., Goyal, P., Mukherjee, A., 2019. Spread of hate speech in online social media. In Proceedings of WebSci. ACM.
- Das, M., Mathew, B., Saha, P., Goyal, P., Mukherjee, A., 2020. Hate speech in online social media. ACM SIGWEB Newsletter, (Autumn) , 1–8.
- Rizwan, H., Shakeel, M.H., Karim, A., 2020. Hatespeech and offensive language detection in roman urdu. In Proceedings of the 2020 conference on empirical methods in natural language processing (EMNLP) , 2512–2522.
- https://www.theguardian.com/world/2018/mar/14/facebook-accused-by-sri-lanka-of-failing-tocontrol-hate-speech. (15.07.2022)
- https://www.reuters.com/investigates/specialreport/myanmar-facebook-hate. (15.07.2022)
- https://money.cnn.com/2017/06/01/technology/twitter-facebook-hate-speech-europe/index.html (15.07.2022)
- https://help.twitter.com/tr/rules-andpolicies/hateful-conduct-policy. (17.07.2022)
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
30 Haziran 2023
Gönderilme Tarihi
22 Mayıs 2023
Kabul Tarihi
22 Haziran 2023
Yayımlandığı Sayı
Yıl 2023 Cilt: 6 Sayı: 1
APA
Kurt, M. S., & Yücel Demirel, E. (2023). Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilimi, 6(1), 61-73. https://izlik.org/JA83CD66TR
AMA
1.Kurt MS, Yücel Demirel E. Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilim Derg. 2023;6(1):61-73. https://izlik.org/JA83CD66TR
Chicago
Kurt, Mehmet Salih, ve Eylem Yücel Demirel. 2023. “Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli”. Veri Bilimi 6 (1): 61-73. https://izlik.org/JA83CD66TR.
EndNote
Kurt MS, Yücel Demirel E (01 Haziran 2023) Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilimi 6 1 61–73.
IEEE
[1]M. S. Kurt ve E. Yücel Demirel, “Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli”, Veri Bilim Derg, c. 6, sy 1, ss. 61–73, Haz. 2023, [çevrimiçi]. Erişim adresi: https://izlik.org/JA83CD66TR
ISNAD
Kurt, Mehmet Salih - Yücel Demirel, Eylem. “Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli”. Veri Bilimi 6/1 (01 Haziran 2023): 61-73. https://izlik.org/JA83CD66TR.
JAMA
1.Kurt MS, Yücel Demirel E. Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilim Derg. 2023;6:61–73.
MLA
Kurt, Mehmet Salih, ve Eylem Yücel Demirel. “Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli”. Veri Bilimi, c. 6, sy 1, Haziran 2023, ss. 61-73, https://izlik.org/JA83CD66TR.
Vancouver
1.Mehmet Salih Kurt, Eylem Yücel Demirel. Türkçe Hakaret ve Nefret Söylemi Otomatik Tespit Modeli. Veri Bilim Derg [Internet]. 01 Haziran 2023;6(1):61-73. Erişim adresi: https://izlik.org/JA83CD66TR