Sohbet ortamları günümüzde iletişim aracı olarak yaygın bir biçimde kullanılmaktadır. Sohbet ortamlarındaki konuşmaların içerikleri kişinin cinsiyetine, alışkanlıklarına, sosyal davranış ve eğilimlerine göre şekillenebilmektedir. Bu çalışmada, Türkçe sohbet ortamlarından konuşmacıların cinsiyetlerinin belirlenmesine yönelik kayıt tabanlı bir bilgi çıkarım sistemi ortaya konulmuştur. Burada, cinsiyet belirleme sohbet ortamlarında bilgi madenciliği uygulaması olarak temel alınmıştır. Önerilen cinsiyet belirleme yöntemi veri madenciliği yöntemlerinden SVM ve Naive Bayes sonuçları ile karşılaştırılmıştır. Geliştirilen sistem, gerçek sohbet ortamlarında cinsiyet belirlemede %90'a yakın sonuçlara ulaşmıştır.
Bilgi Çıkarımı Cinsiyet Belirleme Türkçe Sohbet Ortamları Metin Madenciliği Makine Öğrenmesi
Chat mediums are widely-used as a communication tool nowadays. Contents of chat conversations may be shaped by sex, habit, social behaviors and tendency of the people. In this study, we have presented a log based information retrieval system that is designed to identify the sex of a person in Turkish chat mediums. Here, the sex identification is taken as a base study in the information mining in chat mediums. The proposed sex identification method is compared with the Support Vector Machine and Naïve Bayes methods. The proposed system has achieved accuracy about 90% in the sex identification in the real chat mediums.
Information Retrieval Sex Identification Turkish Chat Mediums Text Mining Machine Learning
Birincil Dil | Türkçe |
---|---|
Bölüm | Elektrik Makinaları |
Yazarlar | |
Yayımlanma Tarihi | 1 Nisan 2009 |
Yayımlandığı Sayı | Yıl 2009 Cilt: 4 Sayı: 3 |