Araştırma Makalesi

Türkçe Köşe Yazılarında Yapay Sinir Ağlarıyla Yazar ve Gazete Tahmin Etme

Cilt: 10 Sayı: 1 15 Mart 2019
PDF İndir

Türkçe Köşe Yazılarında Yapay Sinir Ağlarıyla Yazar ve Gazete Tahmin Etme

Öz

Doğal dil işleme alanı doküman sınıflandırma ve doğrulama işlemleri ile ilgilenmektedir. Bir metnin yazarı tespit edilmek istenirse kuşkusuz en önemli unsur kullanılacak özelliklerdir ve bu özellikler doğrudan başarıya etki edecektir. Bu çalışmada dört farklı Türkçe gazetenin her birinden 10 adet yazar rastgele olarak seçilmiş ve her bir yazarın da toplam 10 adet köşe yazısı rastgele tespit edilmiştir. Yazarı tanımaya yönelik olarak belirlenen 30 adet özellik yazar tanıma için belirlenmiş ve geri yayılımlı yapay sinir ağlarına girdi olarak verilmiştir. Çıktı olarak ise yazar adı modelinin kurgulandığı bu çalışmada eğitim ve test verileri altı farklı şekilde k-katlı çapraz doğrulama yöntemi ile ayrıştırılmıştır. İç katmandaki sinir sayıları da farklı katman ve değerlerde değiştirilerek denemeler yapılmış ve en iyi modele ulaşmak hedeflenmiştir. Çalışma sonucunda her bir gazete için farklı doğruluk oranları elde edilmiştir. En yüksek başarı oranı %86.9 iken, en düşük başarı oranı %75.0 elde edilmiştir. Başarı oranlarının birbirlerinden farklı çıkmasında ise her gazetedeki yazarın yazarlık özelliklerinin ayırt ediciliği etkili olduğu düşünülmektedir.

Anahtar Kelimeler

Kaynakça

  1. Amasyalı M.F., Diri B. (2006). Automatic Written Turkish Text Categorization in Terms of Author, Genre and Gender, 11th International Conference on Applications of Natural Language to Information Systems, Austria.
  2. Amasyalı, M. F., Diri, B., Türkoğlu, F. (2006). Farklı özellik vektörleri ile Türkçe dokümanların yazarlarının belirlenmesi. In The Fifteenth Turkish Symposium on Artificial Intelligence and Neural Networks (TAINN'2006).
  3. Aşlıyan, R., Günel, K. (2011). A Comparison of Syllabifying Algorithms for Turkish. Advanced Research in Computer Science, 3(1): 58-78.
  4. Brinegar, C.S. (1963). Mark Twain and the Quintus Curtius Snodgrass Letters: A Statistical Test of Authorship, Journal of the American Statistical Association, 58:85-96.
  5. Burrows, J.F. (1992). Not unless you ask nicely: the interpretative nexus between analysis and information, Literary Linguist Comput, 7:91-109.
  6. Cavnar, W. B. ve Trenkle, J. M. (1994). N-gram-based text categorization, Proceedings of SDAIR-94, 3rd Annual Symposium on Document Analysis and Information Retrieval. Information Systems Project Management, Jolyon E. Hallows, AMACOM Pres.
  7. Diri, B., Amasyalı M.F. (2003). Automatic Author Detection for Turkish Texts. Artificial Neural Networks and Neural Information Processing, pp. 138-141.
  8. Fung, G., Mangasarian, O. (2003). The Disputed Federalist Papers: SVM Feature Selection via Concave Minimization.In Proceedings of the 2003 Conference of Diversity in Computing, pp. 42-46, Atlanta, Georgia, USA.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

15 Mart 2019

Gönderilme Tarihi

21 Mayıs 2018

Kabul Tarihi

4 Haziran 2018

Yayımlandığı Sayı

Yıl 2019 Cilt: 10 Sayı: 1

Kaynak Göster

IEEE
[1]E. Aydemir, “Türkçe Köşe Yazılarında Yapay Sinir Ağlarıyla Yazar ve Gazete Tahmin Etme”, DÜMF MD, c. 10, sy 1, ss. 45–56, Mar. 2019, doi: 10.24012/dumf.425754.

Cited By

DUJE tarafından yayınlanan tüm makaleler, Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır. Bu, orijinal eser ve kaynağın uygun şekilde belirtilmesi koşuluyla, herkesin eseri kopyalamasına, yeniden dağıtmasına, yeniden düzenlemesine, iletmesine ve uyarlamasına izin verir. 24456