Research Article

Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi

Volume: 37 Number: 2 December 31, 2020
EN TR

Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi

Öz

Yazar tanıma, adli dilbilimin belki de en önemli uygulamalarından bir tanesidir. Türkçe alan yazınına bakıldığında ise bu konudaki çalışmaların nispeten kısa bir süredir yapıldığı ve bu çalışmalarda çok kısa metinlerin kullanılmadığı görülmektedir (Amasyalı ve Diri, 2006; Taş ve Görür, 2007; Doğan ve Diri, 2010). Oysaki adli dilbilim çerçevesinde sadece birkaç sözcükten ibaret olan metinler dahi bir inceleme konusu olabilmektedir. Geçmişte, Twitter isimli mikro-blog sitesinde yayınlanan metinler (tweet) üzerinde yapılan bir çalışma neticesinde Türkçe alan yazınında bir yöntem önerilmiştir (Tanrıvere, 2018). Bu çalışma kapsamında ise söz konusu yöntem, yine Twitter iletilerinden oluşan yeni bir bütünce ile sınanmış ve yöntemi oluşturan ölçütler sayıca arttırılıp nitel bağlamda da detaylandırılarak geliştirilmeye çalışılmıştır. Yöntem, yazarının kim olduğu bilinmeyen iletilerin yazarı bilinen iletilerle karşılaştırılması neticesinde olumlu sonuçlar vermiştir. Uygulama sürecinde öngörülmemiş başka birtakım ayırt edici ölçütlerin de varlığı gözlenmiş ve bunlar detaylıca sunularak, yöntemdeki ilgili ölçüt gruplarına dahil edilmeleri önerilmiştir. Elde edilen sonuçlar genel olarak, çok kısa metinlerde dahi yazar tespitinin mümkün olduğunu ve yöntemin adli bağlamlarda da kullanılabileceğini göstermektedir.

Anahtar Kelimeler

Adli dilbilim , yazar tanıma , yazar tespiti , bireydil , kısa metinler , sosyal medya

References

  1. Amasyalı, M. F. ve Diri, B. (2006). Automatic Turkish text categorization in terms of author, genre and gender. C. Kop, G. Fliedl, H. C. Mayr ve E. Métais (Eds.), 11th International Conference on Applications of Natural Language to Information Systems içinde (ss. 221-226). Berlin, Heidelberg: Springer.
  2. Bhargava, M., Mehndiratta, P. ve Asawa, K. (2013). Stylometric analysis for authorship attribution on Twitter. BDA 2013 Proceedings of the Second International Conference on Big Data Analytics, 8302, 37-47.
  3. Coulthard, M. (1998). Identifying the author. Cahiers de Linguistique Française, 20, 139-161.
  4. Coulthard, M. (2004). Author identification, idiolect and linguistic uniqueness. Applied Linguistics, 25 (4), 431-447.
  5. Coulthard, M. (2005). Some forensic applications of descriptive linguistics. Veredas - Revista de Estudos Linguísticos, 9, 9-28.
  6. Coulthard, M. ve Johnson, A. (2007). An introduction to forensic linguistics: Language in evidence. London, New York: Routledge.
  7. Doğan, S. ve Diri, B. (2010). Türkçe dokümanlar için n-gram tabanlı yeni bir sınıflandırma (ng-ind): Yazar, tür ve cinsiyet. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 3 (1), 11-19.
  8. Grant, T. (2008). Approaching questions in forensic authorship analysis. J. Gibbons ve M. T. Turell (Ed), Dimensions of Forensic Linguistics içinde (ss. 215-229). Amsterdam, Philadelphia: John Benjamins Publishing Company.
  9. Grant, T. ve MacLeod, N. (2018). Resources and constraints in linguistic identity performance: A theory of authorship. Language and Law / Linguagem e Direito, 5 (1), 80-96.
  10. MacLeod, N. ve Grant, T. (2012). Whose tweet? Authorship analysis of micro-blogs and other short-form messages. In S. Tomblin, N. MacLeod, R. Sousa-Silva ve M. Coulthard (Eds.), Proceedings of The International Association of Forensic Linguists’ Tenth Biennial Conference (ss. 210-224). Birmingham: Aston University.
APA
Tanrıvere, U. (2020). Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi. Hacettepe Üniversitesi Edebiyat Fakültesi Dergisi, 37(2), 246-262. https://doi.org/10.32600/huefd.656983