Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi
Öz
Verili bir metnin yazarını tespit etmek ve birkaç metnin arasından yazarı aynı olanları bulmak, adli dilbilimin önemli uygulama alanlarından biridir. Günümüze dek yapılan çalışmaların çoğu, gazetelerin köşe yazıları gibi uzun ve nispeten fazla miktarda dilsel veri içeren bütünce ile gerçekleştirildiğinden, kısa metinlerde yazar tanımaya ilişkin herhangi bir yöntem sunmamaktadır. Zira adli dilbilim kapsamında yapılan çalışmalarda, incelemelere konu edilen metinler oldukça kısadır. Bununla birlikte, mikro-blog siteleri de dahil olmak üzere, sosyal medya üzerinde yapılan paylaşımlar da çoğu kez ceza veya hukuk davalarının konusu olabilmektedir. Dolayısıyla kısa metinler üzerinde yazar tanımaya ilişkin birtakım yöntem ve yaklaşımlara ihtiyaç duyulmaktadır. Bu çalışma, özellikle karakter kısıtı gözetilerek seçilen Twitter adlı mikro-blog sitesinden toplanan çeşitli metinlerin; dilbilgisi, noktalama, sözcük ve bağlam özellikleri kullanılarak yazarlarının tespitine ilişkin bir yöntem önermeyi amaçlamaktadır. Ayırt edici olduğu veya olabileceği görülen özellikler paylaşılmakta ve çoğunlukla bütünceye göre biçimlendirilmesi gereken yöntemler, genel başlıklarıyla birlikte sunulmaktadır.
Anahtar Kelimeler
Kaynakça
- Amasyalı, M. F. ve Diri, B. (2006). Automatic Turkish text categorization in terms of author, genre and gender. 11th International Conference on Applications of Natural Language to Information Systems içinde (s. 221-226). Berlin, Heidelberg: Springer.
- Brückner, T. (2011). Gibt es einen "sprachlichen Fingerabdruck"?: Kritische Anmerkungen zum forensischen Textvergleich. Sprachwissenschaftliche Kriminalistik und Sprachprofiling: Anfänge, Kontroversen, Meilensteine, Fallbeispiele içinde (s. 49-54). Graz: Grazer Linguistische Monographien.
- Coulthard, M. (2005). Some forensic applications of descriptive linguistics. Veredas - Revista de Estudos Linguísticos, 9, 9-28.
- Coulthard, M. ve Johnson, A. (2007). An Introduction to Forensic Linguistics: Language in Evidence. Londra, New York: Routledge.
- Doğan, S. ve Diri, B. (2010). Türkçe dokümanlar için N-gram tabanlı yeni bir sınıflandırma (Ng-ind): yazar, tür ve cinsiyet. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 3(1), 11-19.
- Grant, T. (2008). Approaching questions in forensic authorship analysis. Dimensions of Forensic Linguistics içinde (s. 215-229). Amsterdam, Philadelphia: John Benhamins Publishing Company.
- MacLeod, N. ve Grant, T. (2012). Whose Tweet? Authorship analysis of micro-blogs and other short-form messages. Proceedings of The International Association of Forensic Linguists’ Tenth Biennial Conference içinde (s. 210-224). Birmingham: Aston University.
- McMenamin, G. R. (2002). Linguistic variation. Forensic Linguistics: Advances in Forensic Stylistics içinde (s. 44-65). Boca Raton, Londra, New York, Washington D.C.: CRC Press.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
Araştırma Makalesi
Yazarlar
Utku Tanrıvere
*
0000-0003-2534-1701
Türkiye
Yayımlanma Tarihi
22 Ekim 2018
Gönderilme Tarihi
1 Temmuz 2018
Kabul Tarihi
6 Ağustos 2018
Yayımlandığı Sayı
Yıl 2018 Cilt: 6 Sayı: 12
Cited By
Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanma ve Geliştirilmesi
Hacettepe Üniversitesi Edebiyat Fakültesi Dergisi
https://doi.org/10.32600/huefd.656983Adli Bilimlerde Ses Kayıtları Üzerinde Manipülasyon İncelemesi
Hacettepe Üniversitesi Edebiyat Fakültesi Dergisi
https://doi.org/10.32600/huefd.1106795






