Araştırma Makalesi

Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini

Sayı: 40 30 Eylül 2022
PDF İndir
EN TR

Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini

Öz

Sosyal medya platformlarının yaygınlaşması ve kullanıcı sayılarının hızla artmaya devam etmesiyle birlikte sosyal medyada üretilen veri miktarı da hızlı bir şekilde büyümektedir. Bu veriden bilgi çıkarmaya yönelik yapılan bilimsel çalışmaların hedeflerinden biri de meslek tahminidir. Sosyal medya kullanıcılarının meslek bilgisi, akıllı öneri sistemleri başta olmak üzere birçok farklı alanda kullanılabilmektedir. Bu çalışmada da Türkçe tweetler kullanılarak meslek tahmini yapılması amaçlanmıştır. Çalışma kapsamında öncelikle 25.000 Türkçe tweetten oluşan meslek veri kümesi oluşturulmuş ve kamuya açık olarak paylaşılmıştır. Bu veri kümesi üzerinde çeşitli önişleme adımları uygulanmış, hem kelimelerin kendileri hem de kelime kökleri kullanılarak özellik kümeleri çıkarılmıştır. Yapılan testlerde tweetler hem tekil olarak hem de 5’li ve 10’lu gruplar halinde birleştirilerek kullanılmıştır. Destek Vektör Makinesi ve Lojistik Regresyon yöntemlerinin uygulandığı deneylerde özellik seçimi yapılarak testler tekrar edilmiştir. Tekil tweetlerle yapılan deneylerde en iyi sonuç %74,90 doğruluk oranı olarak elde edilirken, 5’li gruplar halinde birleştirilmiş tweetlerle yapılan deneylerde %96,20 ve 10’lu gruplar halinde birleştirilmiş tweetlerle yapılan deneylerde %99,00 doğruluk oranları en iyi performanslar olarak raporlanmıştır. Testlerde kelime köklerinin kullanılmasının kelimelerin kendilerini kullanmaya göre daha yüksek başarı gösterdiği ve özellik seçiminin genel olarak başarıyı yükselttiği görülmüştür. Çalışmanın sonunda, alınan bu sonuçlar tartışılmış ve gelecek çalışmalara dair öneriler sunulmuştur.

Anahtar Kelimeler

Teşekkür

Veri toplama aşamasındaki desteklerinden dolayı Murat Karabulut’a teşekkür ediyorum.

Kaynakça

  1. Akın, M. D., & Akın, A. A. (2007). Türk Dilleri İçin Açık Kaynaklı Doğal Dil İşleme Kütüphanesi: Zemberek. Elektrik Mühendisliği, 431, 38-44.
  2. Chu, W., & Chiu, C. (2014, Aralık). Predicting Occupation from Single Facial Images. IEEE International Symposium on Multimedia, Taichung, Tayvan. https://doi.org/10.1109/ISM.2014.13
  3. Chu, W., & Chiu, C. (2016). Predicting Occupation from Images by Combining Face and Body Context Information. ACM Transactions on Multimedia Computing, Communications, and Applications, 13(1), 1-21. https://doi.org/10.1145/3009911
  4. Hu, T., Xiao, H., Luo, J., & Nguyen, T. T. (2016, Mayıs). What the Language You Tweet Says About Your Occupation. The Tenth International AAAI Conference on Web and Social Media (ICWSM), Köln, Almanya. https://www.aaai.org/ocs/index.php/ICWSM/ICWSM16/paper/view/13020
  5. Huang, Y., Yu, L., Wang, X., & Cui, B. (2015). A multi-source integration framework for user occupation inference in social media systems. World Wide Web, 18, 1247-1267. https://doi.org/10.1007/s11280-014-0300-6
  6. Kepios. (2022, Temmuz). Global Social Media Statistics. https://datareportal.com/social-media-users
  7. Kumar, P., Gupta, M., Gupta, M., & Sharma, A. (2020). Profession Identification Using Handwritten Text Images. Computer Vision and Image Processing (CVIP 2019), Communications in Computer and Information Science, 1148, 25-35. https://doi.org/10.1007/978-981-15-4018-9_3
  8. Lv, X., Jin, P., Mu, L., Wan, S., & Yue, L. (2017). Detecting User Occupations on Microblogging Platforms: An Experimental Study. Web and Big Data, APWeb-WAIM 2017, Lecture Notes in Computer Science (LNCS), 10366, 331-345. https://doi.org/10.1007/978-3-319-63579-8_26

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

30 Eylül 2022

Gönderilme Tarihi

29 Ağustos 2022

Kabul Tarihi

23 Eylül 2022

Yayımlandığı Sayı

Yıl 2022 Sayı: 40

Kaynak Göster

APA
Mayda, İ. (2022). Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini. Avrupa Bilim ve Teknoloji Dergisi, 40, 55-60. https://doi.org/10.31590/ejosat.1168269
AMA
1.Mayda İ. Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini. EJOSAT. 2022;(40):55-60. doi:10.31590/ejosat.1168269
Chicago
Mayda, İslam. 2022. “Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini”. Avrupa Bilim ve Teknoloji Dergisi, sy 40: 55-60. https://doi.org/10.31590/ejosat.1168269.
EndNote
Mayda İ (01 Eylül 2022) Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini. Avrupa Bilim ve Teknoloji Dergisi 40 55–60.
IEEE
[1]İ. Mayda, “Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini”, EJOSAT, sy 40, ss. 55–60, Eyl. 2022, doi: 10.31590/ejosat.1168269.
ISNAD
Mayda, İslam. “Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini”. Avrupa Bilim ve Teknoloji Dergisi. 40 (01 Eylül 2022): 55-60. https://doi.org/10.31590/ejosat.1168269.
JAMA
1.Mayda İ. Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini. EJOSAT. 2022;:55–60.
MLA
Mayda, İslam. “Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini”. Avrupa Bilim ve Teknoloji Dergisi, sy 40, Eylül 2022, ss. 55-60, doi:10.31590/ejosat.1168269.
Vancouver
1.İslam Mayda. Türkçe Tweetlerden Makine Öğrenmesi ile Meslek Tahmini. EJOSAT. 01 Eylül 2022;(40):55-60. doi:10.31590/ejosat.1168269