In today's business models, institutions or organizations want to know users’ opinions to improve their decision-making processes. Millions of people all around the world express their daily comments and thoughts using text messages, videos, or photos via social network applications. The rapid growth of social networking applications such as Facebook, Instagram, Twitter, and YouTube provides an attractive field for researchers to investigate the content of big data shared here and analyze user behavior. This enormous amount of data from social networks is used for effective marketing, personalized recommendation systems, finding opinion leaders, the pharmaceutical industry, or political policy making. A big amount of data obtained through social network applications is analyzed by machine learning methods. In this study, feature selection method is used to improve the automatic gender classification performance of Twitter users. The performance of the feature selection method that is applied on three datasets: user descriptions, tweets and where both are used together is evaluated with naive bayes and logistic regression classifiers. The results of the experiments show that the classification success of the selected features using chi-square feature selection method is much better with logistic regression classifier.
Bu çalışma ICSAR 2022 (1st International Conference on Scientific and Academic Research) konferansında sunulmuştur.
Günümüz iş modellerinde kurum veya kuruluşlar, karar alma süreçlerini iyileştirmek için kullanıcıların görüşlerini bilmek istemektedir. Dünyanın dört bir yanındaki milyonlarca insan, sosyal ağ uygulamaları aracılığıyla metin mesajları, videolar veya fotoğraflar kullanarak günlük yorumlarını ve düşüncelerini ifade etmektedir. Facebook, Instagram, Twitter ve YouTube gibi sosyal ağ uygulamalarının hızla büyümesi, burada paylaşılan büyük verilerin içeriğini araştırmak ve kullanıcı davranışlarını analiz etmek için araştırmacılara çekici bir alan sunmaktadır. Sosyal ağlardan gelen bu muazzam miktardaki veri, etkili pazarlama, kişiselleştirilmiş öneri sistemleri, fikir liderleri bulma, ilaç endüstrisi veya politik analizler için kullanılmaktadır. Sosyal ağ uygulamaları aracılığıyla elde edilen büyük miktarda veri, makine öğrenme yöntemleriyle analiz edilmektedir. Bu çalışmada Twitter kullanıcılarının otomatik cinsiyet sınıflandırması performansını artırmak için nitelik seçim yöntemi kullanılmıştır. Twitter kullanıcı tanımları, twit metinleri ve her ikisinin bir arada kullanıldığı üç veri kümesi üzerinde uygulanan nitelik seçim yönteminin performansı naive bayes ve lojistik regresyon sınıflayıcıları ile değerlendirilmiştir. Deney sonuçları ki-kare nitelik seçim yöntemi ile seçilen niteliklerin lojistik regresyon ile sınıflandırma başarısının çok daha üstün olduğunu göstermektedir.
Cinsiyet sınıflandırması makine öğrenme nitelik seçimi sosyal ağlar Twitter Feature selection gender classification machine learning social networks Twitter
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | December 31, 2022 |
Submission Date | December 3, 2022 |
Published in Issue | Year 2022 Volume: 14 Issue: 3 |
All Rights Reserved. Kırıkkale University, Faculty of Engineering and Natural Science.