EN
TR
Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi
Öz
Twitter gibi sosyal ağlar, insanların iletişim kurması için popüler bir platform haline gelmiştir. Bireysel kullanıcıların yanı sıra kurumlar ve şirketler de ürün tanıtımı, pazarlama ya da herhangi bir konu hakkında geri bildirim alma gibi daha birçok nedenden dolayı bu sahaya ilgi duymaktadır. Kurumların ve şirketlerin hedefi, kişilerin ilgilendikleri ürün ve alanlar dışında gereksiz bilgiler ile rahatsız edilmemesini sağlamaktır. Bunun için de kurum ve şirketler, paylaşım yapanın kadın veya erkek oluşu, tweetin ilgili olduğu alan gibi bilgilere ihtiyaç duymakta ve bu bilgilere bağlı olarak, kendi hedef kitlelerine ulaşmak için çeşitli çalışmalar yapmaktadır. Bu çalışmada Twitter’da üretilen içeriklerden yola çıkılarak, paylaşım yapanın cinsiyeti ve paylaşılan tweetin ilgi alanı için tahmin yapılmıştır. Bu amaçla, Twitter Uygulama Programlama Arayüzü (API- Application Programming Interface) kullanan bir uygulama geliştirilmiştir. Bu uygulama kullanılarak, iki farklı eğitim seti oluşturmaya yönelik veriler toplanmıştır. Cinsiyet tespitine yönelik eğitim seti için, tweetler filtreleme yapılmadan toplanmıştır. İlgi alanı tespitine yönelik eğitim seti için, tweetler farklı ilgi alanları için belirlenmiş anahtar kelime kümeleri yardımıyla, filtreleme yapılarak toplanmıştır. Daha sonra, bu tweetler, etiketleme çalışmasına kolaylık sağlaması amacıyla uygulama kullanılarak el ile etiketlenmiştir. Çeşitli denemeler yapılarak, özniteliklerin belirlenmesinin ardından, gözetimli makine öğrenmesinde kullanılacak iki farklı eğitim seti oluşturulmuştur. Oluşturulan bu eğitim setleri kullanılarak; Naive Bayes, K-En Yakın Komşu Algoritması (KNN- K-Nearest Neighbors), C4.5, Destek Vektör Makineleri (SVM- Support Vector Machine) ve Ardışık Minimal Optimizasyon algoritmaları (SMO- Sequential Minimal Optimization) için modeller oluşturulmuştur. Modellerin başarımı, kappa istatistik ve doğruluk ölçütleri dikkate alınarak değerlendirilmiştir. Elde edilen modellerin başarımları değerlendirildiğinde; cinsiyet tahmini için oluşturulan modeller içinde, en düşük başarıma %44,6 doğruluk ve 0.17 kappa değeri ile SVM algoritması sahipken en yüksek başarımı %99,9 doğruluk ve 0.99 kappa değeri ile SMO algoritması sağlamıştır. Aynı şekilde ilgi alanı için oluşturulan modeller içinde en düşük başarımı %47,9 doğruluk ve 0.37 kappa değeri ile SVM algoritması vermişken en yüksek başarım %93,18 doğruluk ve 0.91 kappa değeri ile KNN algoritması tarafından sağlanmıştır. Doğruluk değerleri ve kappa değerlerinin birbiri ile uyumlu olduğu görülmüştür.
Anahtar Kelimeler
Kaynakça
- Parantapa Bhattacharya, Muhammad Bilal Zafar, Niloy Ganguly, Saptarshi Ghos, Krishna P. Gummadi, “Inferring User interests in the Twitter Social Network”, In: Proceedings of the 8th ACM conference on recommender systems. ACM, pp 357–360, 2019.
- Mounica Arroju, Aftab Hassan, Golnoosh Farnadi, “Age, Gender and Personality Recognation using Tweets in a Multilingual Settings”, in CLEF 2015 working notes, Toulouse, France, 2015.
- Zach Wood-Doughty, Nicholas Andrews, Rebecca Marvin, Mark Dredze, “Predicting Twitter User Demographics from Names Alone”, Association for Computational Linguistics, USA, pp. 105-111, 2018.
- J.V.P.S Avinash and Rakshith Muniraju and Shreyas Shaligraman, “Gender Classification using Twitter Feeds”, CS-552-Advanced Data Mining – Final Project, Illinois Institute of Technology, Chicago, 2017.
- Mohsen Sayyadiharikandeh, Giovanni Luca Ciampaglia, Alessandro Flammini, “Cross-domain gender detection in Twitter”, Indiana University, School of Informatics and Computing, USA, pp. 39-54, 2019.
- A. McCallum, and K. Nigam, “A comparison of event models for Naïve Bayes text classification,” AAAI-98 Workshop on Learning for Text Categorization, pp. 41–48, 1998.
- C. Cortes, and V. Vapnik, “Support-vector networks,” Machine Learning, vol. 20, pp. 273-297, 1995.
- S. Zhang1, M. Zong1, X. Zhu1, X. Li2, R. Wang3, “Efficient KNN Classification With Different Numbers of Nearest Neighbors”, IEEE Transactions on Neural Networks and Learning Systems, vol. 29, Issue: 5, May 2018.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
30 Kasım 2020
Gönderilme Tarihi
4 Kasım 2020
Kabul Tarihi
7 Kasım 2020
Yayımlandığı Sayı
Yıl 2020
APA
Günçe, E., & Carus, A. (2020). Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi. Avrupa Bilim ve Teknoloji Dergisi, 187-194. https://doi.org/10.31590/ejosat.819722
AMA
1.Günçe E, Carus A. Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi. EJOSAT. Published online 01 Kasım 2020:187-194. doi:10.31590/ejosat.819722
Chicago
Günçe, Enes, ve Aydin Carus. 2020. “Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi”. Avrupa Bilim ve Teknoloji Dergisi, Kasım 1, 187-94. https://doi.org/10.31590/ejosat.819722.
EndNote
Günçe E, Carus A (01 Kasım 2020) Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi. Avrupa Bilim ve Teknoloji Dergisi 187–194.
IEEE
[1]E. Günçe ve A. Carus, “Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi”, EJOSAT, ss. 187–194, Kas. 2020, doi: 10.31590/ejosat.819722.
ISNAD
Günçe, Enes - Carus, Aydin. “Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi”. Avrupa Bilim ve Teknoloji Dergisi. 01 Kasım 2020. 187-194. https://doi.org/10.31590/ejosat.819722.
JAMA
1.Günçe E, Carus A. Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi. EJOSAT. 2020;:187–194.
MLA
Günçe, Enes, ve Aydin Carus. “Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi”. Avrupa Bilim ve Teknoloji Dergisi, Kasım 2020, ss. 187-94, doi:10.31590/ejosat.819722.
Vancouver
1.Enes Günçe, Aydin Carus. Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi. EJOSAT. 01 Kasım 2020;187-94. doi:10.31590/ejosat.819722
Cited By
Twitter üzerinden ideolojik söylemler ve etkileşimler: AK Parti ve CHP'nin sosyal medya stratejileri üzerine bir inceleme
Nevşehir Hacı Bektaş Veli Üniversitesi SBE Dergisi
https://doi.org/10.30783/nevsosbilen.1520926