Regardless of whether they are young or old, people have quickly stepped into the internet world with phones, tablets, computers and smart devices, which are among today's communication technologies. With the increase in the number of social media users, some negativities are encountered. The most important problem encountered on social media is cyber bullying. Although cyberbullying may seem like daily dialogues between social media users or groups, the incidence of cyberbullying increases day by day with the diversification of shared information, content, and agenda in social media environments. This paper evaluates the performance of a GPT-3 classification model for the task of classifying tweets from tweeters as those that contain cyberbullying or those that do not. The model was first trained and tested on Turkish tweets. It resulted in an accuracy of 55% in total. After the data was translated to English and the model was retrained and tested, accuracy was increased to 66%. Precision, recall, and F1 score for both classes of tweets were 0.65, 0.68, and 0.67, respectively, for tweets without cyberbullying and 0.67, 0.64, and 0, respectively, for tweets with cyberbullying. It was found to be 65. Cyberbullying The confusion matrix of the model showed that 17 tweets correctly contained cyberbullying, while 9 tweets incorrectly contained cyberbullying. The results of this paper show that GPT-3 can be used for the task of classifying tweets into those that contain cyberbullying and those that do not with a reasonable degree of accuracy.
İnsanlar genç yaşlı fark etmeksizin günümüz iletişim teknolojilerinden olan telefon, tablet, bilgisayar ve akıllı cihazlar ile internet dünyasına hızlı bir şekilde adım atmışlardır. İnternetin insanların hayatında yeri arttıkça sosyal medya platformlarını çeşitlenmekte ve kullanıcılar bu platformlarda yer almak istemektedirler. Sosyal medya kullanıcı sayısının artışı ile de bazı olumsuzluklarla karşılaşılmaktadır. Sosyal medya da karşılaşılan en önemli sorun da siber zorbalık durumlardır. Siber zorbalık sosyal medya kullanıcıları ya da gruplar arasında gerçekleşen günlük diyaloglar gibi görünse de paylaşılan bilgi, içerik, gündem sosyal medya ortamlarının çeşitlenmesi ile günden güne karşılaşma durumu artmaktadır. Bu makale, tweet'leri siber zorbalık içerenler ve içermeyenler olarak sınıflandırma görevi için bir GPT-3 sınıflandırma modelinin performansını değerlendirmektedir. Model ilk olarak Türkçe tweet'ler üzerinde eğitildi ve test edildi ve toplamda %55'lik bir doğrulukla sonuçlandı. Veriler İngilizce'ye çevrildikten ve model yeniden eğitilip test edildikten sonra doğruluk %66'ya yükseltildi. Her iki tweet sınıfı için kesinlik, hatırlama ve F1 puanı, siber zorbalık içermeyen tweet'ler için sırasıyla 0,65, 0,68 ve 0,67 ve siber zorbalık içeren tweet'ler için sırasıyla 0,67, 0,64 ve 0,65 olarak bulundu. siber zorbalık Modelin karışıklık matrisi, 17 tweet'in doğru bir şekilde siber zorbalık içerdiğini, 9'unun ise yanlış bir şekilde siber zorbalık içerdiğini gösterdi. Bu makalenin sonuçları, GPT-3'ün tweet'leri siber zorbalık içerenler ve makul bir doğruluk derecesi ile içermeyenler olarak sınıflandırma görevi için kullanılabileceğini göstermektedir.
Primary Language | Turkish |
---|---|
Subjects | Software Engineering (Other) |
Journal Section | Research Articles |
Authors | |
Publication Date | December 31, 2023 |
Submission Date | November 21, 2023 |
Acceptance Date | December 20, 2023 |
Published in Issue | Year 2023 Volume: 9 Issue: 4 |