Araştırma Makalesi
BibTex RIS Kaynak Göster

Author Identification in Short Texts: A Methodological Proposal for Twitter

Yıl 2018, Cilt: 6 Sayı: 12, 177 - 192, 22.10.2018
https://doi.org/10.20304/humanitas.439458

Öz

Determining a given text’s author and finding the texts, of those authors are same, through several texts is one of the most important application fields of forensic linguistics. Most of the studies, which are done up to the present, were conducted along with a long corpus, which also consists of relatively more linguistic data such as newspaper articles. Thus, they don’t suggest a method in terms of author identification of short texts. Yet, in forensic linguistic studies, the entreated texts are quite short. However, social media entries including the micro-blogs can be subject to criminal or law cases several times. Accordingly, there’s a need for some methods and aspects related to author identification. This study aims to suggest a method to determine authors by using grammar, punctuation, lexis and context features of texts, which were collected from the micro-blog named Twitter, with a special regard to its character constraint. The features, which are seen to be or to may be distinctive, are shared and the methods, which mostly need to be formatted related to the corpus, are presented along with their general titles.

Kaynakça

  • Amasyalı, M. F. ve Diri, B. (2006). Automatic Turkish text categorization in terms of author, genre and gender. 11th International Conference on Applications of Natural Language to Information Systems içinde (s. 221-226). Berlin, Heidelberg: Springer.
  • Brückner, T. (2011). Gibt es einen "sprachlichen Fingerabdruck"?: Kritische Anmerkungen zum forensischen Textvergleich. Sprachwissenschaftliche Kriminalistik und Sprachprofiling: Anfänge, Kontroversen, Meilensteine, Fallbeispiele içinde (s. 49-54). Graz: Grazer Linguistische Monographien.
  • Coulthard, M. (2005). Some forensic applications of descriptive linguistics. Veredas - Revista de Estudos Linguísticos, 9, 9-28.
  • Coulthard, M. ve Johnson, A. (2007). An Introduction to Forensic Linguistics: Language in Evidence. Londra, New York: Routledge.
  • Doğan, S. ve Diri, B. (2010). Türkçe dokümanlar için N-gram tabanlı yeni bir sınıflandırma (Ng-ind): yazar, tür ve cinsiyet. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 3(1), 11-19.
  • Grant, T. (2008). Approaching questions in forensic authorship analysis. Dimensions of Forensic Linguistics içinde (s. 215-229). Amsterdam, Philadelphia: John Benhamins Publishing Company.
  • MacLeod, N. ve Grant, T. (2012). Whose Tweet? Authorship analysis of micro-blogs and other short-form messages. Proceedings of The International Association of Forensic Linguists’ Tenth Biennial Conference içinde (s. 210-224). Birmingham: Aston University.
  • McMenamin, G. R. (2002). Linguistic variation. Forensic Linguistics: Advances in Forensic Stylistics içinde (s. 44-65). Boca Raton, Londra, New York, Washington D.C.: CRC Press.
  • Olsson, J. (2008). Forensic linguistics (2. baskı). Londra, New York: Continuum.
  • Svartvik, J. (1968). The Evans statements: a case for forensic linguistics. Göteborg: University of Göteborg.
  • Tanrıvere, U. (2016). İntihar Mektuplarının Psikodilbilimsel İçerik ve Tür Özellikleri Bağlamında İncelenmesi: Adli Dilbilimsel Bir Yaklaşım. (Yayımlanmamış Yüksek Lisans Tezi). Hacettepe Üniversitesi, Ankara.
  • Taş, T. ve Görür, A. K. (2007). Author identification for Turkish texts. Çankaya Üniversitesi Fen-Edebiyat Fakültesi, Journal of Arts and Sciences, 7, 151-161.
  • Toroslu, N. ve Feyzioğlu, M. (2016). Ceza Muhakemesi Hukuku (16. Baskı). Ankara: Savaş Yayınevi.
  • Türk Ceza Kanunu (TCK). (2004). http://www.mevzuat.gov.tr/MevzuatMetin/1.5.5237.pdf
  • Yıldırım Ş., Özdemir M. ve Alparslan E. (2018). Kullanımlar ve doyumlar kuramı çerçevesinde bir sosyal paylaşım ağı incelemesi: Facebook örneği. Intermedia International e-Journal, 5 (8), 42-65.

Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi

Yıl 2018, Cilt: 6 Sayı: 12, 177 - 192, 22.10.2018
https://doi.org/10.20304/humanitas.439458

Öz

Verili bir metnin yazarını tespit etmek ve birkaç metnin arasından yazarı aynı olanları bulmak, adli dilbilimin önemli uygulama alanlarından biridir. Günümüze dek yapılan çalışmaların çoğu, gazetelerin köşe yazıları gibi uzun ve nispeten fazla miktarda dilsel veri içeren bütünce ile gerçekleştirildiğinden, kısa metinlerde yazar tanımaya ilişkin herhangi bir yöntem sunmamaktadır. Zira adli dilbilim kapsamında yapılan çalışmalarda, incelemelere konu edilen metinler oldukça kısadır. Bununla birlikte, mikro-blog siteleri de dahil olmak üzere, sosyal medya üzerinde yapılan paylaşımlar da çoğu kez ceza veya hukuk davalarının konusu olabilmektedir. Dolayısıyla kısa metinler üzerinde yazar tanımaya ilişkin birtakım yöntem ve yaklaşımlara ihtiyaç duyulmaktadır. Bu çalışma, özellikle karakter kısıtı gözetilerek seçilen Twitter adlı mikro-blog sitesinden toplanan çeşitli metinlerin; dilbilgisi, noktalama, sözcük ve bağlam özellikleri kullanılarak yazarlarının tespitine ilişkin bir yöntem önermeyi amaçlamaktadır. Ayırt edici olduğu veya olabileceği görülen özellikler paylaşılmakta ve çoğunlukla bütünceye göre biçimlendirilmesi gereken yöntemler, genel başlıklarıyla birlikte sunulmaktadır.

Kaynakça

  • Amasyalı, M. F. ve Diri, B. (2006). Automatic Turkish text categorization in terms of author, genre and gender. 11th International Conference on Applications of Natural Language to Information Systems içinde (s. 221-226). Berlin, Heidelberg: Springer.
  • Brückner, T. (2011). Gibt es einen "sprachlichen Fingerabdruck"?: Kritische Anmerkungen zum forensischen Textvergleich. Sprachwissenschaftliche Kriminalistik und Sprachprofiling: Anfänge, Kontroversen, Meilensteine, Fallbeispiele içinde (s. 49-54). Graz: Grazer Linguistische Monographien.
  • Coulthard, M. (2005). Some forensic applications of descriptive linguistics. Veredas - Revista de Estudos Linguísticos, 9, 9-28.
  • Coulthard, M. ve Johnson, A. (2007). An Introduction to Forensic Linguistics: Language in Evidence. Londra, New York: Routledge.
  • Doğan, S. ve Diri, B. (2010). Türkçe dokümanlar için N-gram tabanlı yeni bir sınıflandırma (Ng-ind): yazar, tür ve cinsiyet. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 3(1), 11-19.
  • Grant, T. (2008). Approaching questions in forensic authorship analysis. Dimensions of Forensic Linguistics içinde (s. 215-229). Amsterdam, Philadelphia: John Benhamins Publishing Company.
  • MacLeod, N. ve Grant, T. (2012). Whose Tweet? Authorship analysis of micro-blogs and other short-form messages. Proceedings of The International Association of Forensic Linguists’ Tenth Biennial Conference içinde (s. 210-224). Birmingham: Aston University.
  • McMenamin, G. R. (2002). Linguistic variation. Forensic Linguistics: Advances in Forensic Stylistics içinde (s. 44-65). Boca Raton, Londra, New York, Washington D.C.: CRC Press.
  • Olsson, J. (2008). Forensic linguistics (2. baskı). Londra, New York: Continuum.
  • Svartvik, J. (1968). The Evans statements: a case for forensic linguistics. Göteborg: University of Göteborg.
  • Tanrıvere, U. (2016). İntihar Mektuplarının Psikodilbilimsel İçerik ve Tür Özellikleri Bağlamında İncelenmesi: Adli Dilbilimsel Bir Yaklaşım. (Yayımlanmamış Yüksek Lisans Tezi). Hacettepe Üniversitesi, Ankara.
  • Taş, T. ve Görür, A. K. (2007). Author identification for Turkish texts. Çankaya Üniversitesi Fen-Edebiyat Fakültesi, Journal of Arts and Sciences, 7, 151-161.
  • Toroslu, N. ve Feyzioğlu, M. (2016). Ceza Muhakemesi Hukuku (16. Baskı). Ankara: Savaş Yayınevi.
  • Türk Ceza Kanunu (TCK). (2004). http://www.mevzuat.gov.tr/MevzuatMetin/1.5.5237.pdf
  • Yıldırım Ş., Özdemir M. ve Alparslan E. (2018). Kullanımlar ve doyumlar kuramı çerçevesinde bir sosyal paylaşım ağı incelemesi: Facebook örneği. Intermedia International e-Journal, 5 (8), 42-65.
Toplam 15 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Bölüm Tüm Sayı
Yazarlar

Utku Tanrıvere 0000-0003-2534-1701

Yayımlanma Tarihi 22 Ekim 2018
Yayımlandığı Sayı Yıl 2018 Cilt: 6 Sayı: 12

Kaynak Göster

APA Tanrıvere, U. (2018). Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi. HUMANITAS - Uluslararası Sosyal Bilimler Dergisi, 6(12), 177-192. https://doi.org/10.20304/humanitas.439458