Sohbet ortamları günümüzde iletişim aracı olarak yaygın bir biçimde kullanılmaktadır. Sohbet ortamlarındaki konuşmaların içerikleri kişinin cinsiyetine, alışkanlıklarına, sosyal davranış ve eğilimlerine göre şekillenebilmektedir. Bu çalışmada, Türkçe sohbet ortamlarından konuşmacıların cinsiyetlerinin belirlenmesine yönelik kayıt tabanlı bir bilgi çıkarım sistemi ortaya konulmuştur. Burada, cinsiyet belirleme sohbet ortamlarında bilgi madenciliği uygulaması olarak temel alınmıştır. Önerilen cinsiyet belirleme yöntemi veri madenciliği yöntemlerinden SVM ve Naive Bayes sonuçları ile karşılaştırılmıştır. Geliştirilen sistem, gerçek sohbet ortamlarında cinsiyet belirlemede %90'a yakın sonuçlara ulaşmıştır.
Chat mediums are widely-used as a communication tool nowadays. Contents of chat conversations may be shaped by sex, habit, social behaviors and tendency of the people. In this study, we have presented a log based information retrieval system that is designed to identify the sex of a person in Turkish chat mediums. Here, the sex identification is taken as a base study in the information mining in chat mediums. The proposed sex identification method is compared with the Support Vector Machine and Naïve Bayes methods. The proposed system has achieved accuracy about 90% in the sex identification in the real chat mediums.
Primary Language | Turkish |
---|---|
Journal Section | Electrical Machines |
Authors | |
Publication Date | April 1, 2009 |
Published in Issue | Year 2009 Volume: 4 Issue: 3 |