Doğal dil işleme alanı doküman sınıflandırma ve doğrulama işlemleri ile
ilgilenmektedir. Bir metnin yazarı tespit edilmek istenirse kuşkusuz en önemli
unsur kullanılacak özelliklerdir ve bu özellikler doğrudan başarıya etki
edecektir. Bu çalışmada dört farklı Türkçe gazetenin her birinden 10 adet yazar
rastgele olarak seçilmiş ve her bir yazarın da toplam 10 adet köşe yazısı
rastgele tespit edilmiştir. Yazarı tanımaya yönelik olarak belirlenen 30 adet
özellik yazar tanıma için belirlenmiş ve geri yayılımlı yapay sinir ağlarına
girdi olarak verilmiştir. Çıktı olarak ise yazar adı modelinin kurgulandığı bu
çalışmada eğitim ve test verileri altı farklı şekilde k-katlı çapraz doğrulama
yöntemi ile ayrıştırılmıştır. İç katmandaki sinir sayıları da farklı katman ve
değerlerde değiştirilerek denemeler yapılmış ve en iyi modele ulaşmak
hedeflenmiştir. Çalışma sonucunda her bir gazete için farklı doğruluk oranları
elde edilmiştir. En yüksek başarı oranı %86.9 iken, en düşük başarı oranı %75.0
elde edilmiştir. Başarı oranlarının birbirlerinden farklı çıkmasında ise her
gazetedeki yazarın yazarlık özelliklerinin ayırt ediciliği etkili olduğu
düşünülmektedir.
Primary Language | Turkish |
---|---|
Journal Section | Articles |
Authors | |
Publication Date | March 15, 2019 |
Submission Date | May 21, 2018 |
Published in Issue | Year 2019 |