Year 2018, Volume 6, Issue 12, Pages 177 - 192 2018-10-22

Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi
Author Identification in Short Texts: A Methodological Proposal for Twitter

Utku Tanrıvere [1]

74 186

Verili bir metnin yazarını tespit etmek ve birkaç metnin arasından yazarı aynı olanları bulmak, adli dilbilimin önemli uygulama alanlarından biridir. Günümüze dek yapılan çalışmaların çoğu, gazetelerin köşe yazıları gibi uzun ve nispeten fazla miktarda dilsel veri içeren bütünce ile gerçekleştirildiğinden, kısa metinlerde yazar tanımaya ilişkin herhangi bir yöntem sunmamaktadır. Zira adli dilbilim kapsamında yapılan çalışmalarda, incelemelere konu edilen metinler oldukça kısadır. Bununla birlikte, mikro-blog siteleri de dahil olmak üzere, sosyal medya üzerinde yapılan paylaşımlar da çoğu kez ceza veya hukuk davalarının konusu olabilmektedir. Dolayısıyla kısa metinler üzerinde yazar tanımaya ilişkin birtakım yöntem ve yaklaşımlara ihtiyaç duyulmaktadır. Bu çalışma, özellikle karakter kısıtı gözetilerek seçilen Twitter adlı mikro-blog sitesinden toplanan çeşitli metinlerin; dilbilgisi, noktalama, sözcük ve bağlam özellikleri kullanılarak yazarlarının tespitine ilişkin bir yöntem önermeyi amaçlamaktadır. Ayırt edici olduğu veya olabileceği görülen özellikler paylaşılmakta ve çoğunlukla bütünceye göre biçimlendirilmesi gereken yöntemler, genel başlıklarıyla birlikte sunulmaktadır.

Determining a given text’s author and finding the texts, of those authors are same, through several texts is one of the most important application fields of forensic linguistics. Most of the studies, which are done up to the present, were conducted along with a long corpus, which also consists of relatively more linguistic data such as newspaper articles. Thus, they don’t suggest a method in terms of author identification of short texts. Yet, in forensic linguistic studies, the entreated texts are quite short. However, social media entries including the micro-blogs can be subject to criminal or law cases several times. Accordingly, there’s a need for some methods and aspects related to author identification. This study aims to suggest a method to determine authors by using grammar, punctuation, lexis and context features of texts, which were collected from the micro-blog named Twitter, with a special regard to its character constraint. The features, which are seen to be or to may be distinctive, are shared and the methods, which mostly need to be formatted related to the corpus, are presented along with their general titles.

  • Amasyalı, M. F. ve Diri, B. (2006). Automatic Turkish text categorization in terms of author, genre and gender. 11th International Conference on Applications of Natural Language to Information Systems içinde (s. 221-226). Berlin, Heidelberg: Springer.
  • Brückner, T. (2011). Gibt es einen "sprachlichen Fingerabdruck"?: Kritische Anmerkungen zum forensischen Textvergleich. Sprachwissenschaftliche Kriminalistik und Sprachprofiling: Anfänge, Kontroversen, Meilensteine, Fallbeispiele içinde (s. 49-54). Graz: Grazer Linguistische Monographien.
  • Coulthard, M. (2005). Some forensic applications of descriptive linguistics. Veredas - Revista de Estudos Linguísticos, 9, 9-28.
  • Coulthard, M. ve Johnson, A. (2007). An Introduction to Forensic Linguistics: Language in Evidence. Londra, New York: Routledge.
  • Doğan, S. ve Diri, B. (2010). Türkçe dokümanlar için N-gram tabanlı yeni bir sınıflandırma (Ng-ind): yazar, tür ve cinsiyet. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 3(1), 11-19.
  • Grant, T. (2008). Approaching questions in forensic authorship analysis. Dimensions of Forensic Linguistics içinde (s. 215-229). Amsterdam, Philadelphia: John Benhamins Publishing Company.
  • MacLeod, N. ve Grant, T. (2012). Whose Tweet? Authorship analysis of micro-blogs and other short-form messages. Proceedings of The International Association of Forensic Linguists’ Tenth Biennial Conference içinde (s. 210-224). Birmingham: Aston University.
  • McMenamin, G. R. (2002). Linguistic variation. Forensic Linguistics: Advances in Forensic Stylistics içinde (s. 44-65). Boca Raton, Londra, New York, Washington D.C.: CRC Press.
  • Olsson, J. (2008). Forensic linguistics (2. baskı). Londra, New York: Continuum.
  • Svartvik, J. (1968). The Evans statements: a case for forensic linguistics. Göteborg: University of Göteborg.
  • Tanrıvere, U. (2016). İntihar Mektuplarının Psikodilbilimsel İçerik ve Tür Özellikleri Bağlamında İncelenmesi: Adli Dilbilimsel Bir Yaklaşım. (Yayımlanmamış Yüksek Lisans Tezi). Hacettepe Üniversitesi, Ankara.
  • Taş, T. ve Görür, A. K. (2007). Author identification for Turkish texts. Çankaya Üniversitesi Fen-Edebiyat Fakültesi, Journal of Arts and Sciences, 7, 151-161.
  • Toroslu, N. ve Feyzioğlu, M. (2016). Ceza Muhakemesi Hukuku (16. Baskı). Ankara: Savaş Yayınevi.
  • Türk Ceza Kanunu (TCK). (2004). http://www.mevzuat.gov.tr/MevzuatMetin/1.5.5237.pdf
  • Yıldırım Ş., Özdemir M. ve Alparslan E. (2018). Kullanımlar ve doyumlar kuramı çerçevesinde bir sosyal paylaşım ağı incelemesi: Facebook örneği. Intermedia International e-Journal, 5 (8), 42-65.
Primary Language tr
Subjects Social
Journal Section Tüm Sayı
Authors

Orcid: 0000-0003-2534-1701
Author: Utku Tanrıvere (Primary Author)
Country: Turkey


Bibtex @research article { humanitas439458, journal = {HUMANITAS - Uluslararası Sosyal Bilimler Dergisi}, issn = {2147-088X}, eissn = {2645-8837}, address = {Namik Kemal University}, year = {2018}, volume = {6}, pages = {177 - 192}, doi = {10.20304/humanitas.439458}, title = {Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi}, key = {cite}, author = {Tanrıvere, Utku} }
APA Tanrıvere, U . (2018). Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi. HUMANITAS - Uluslararası Sosyal Bilimler Dergisi, 6 (12), 177-192. DOI: 10.20304/humanitas.439458
MLA Tanrıvere, U . "Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi". HUMANITAS - Uluslararası Sosyal Bilimler Dergisi 6 (2018): 177-192 <http://dergipark.org.tr/humanitas/issue/39880/439458>
Chicago Tanrıvere, U . "Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi". HUMANITAS - Uluslararası Sosyal Bilimler Dergisi 6 (2018): 177-192
RIS TY - JOUR T1 - Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi AU - Utku Tanrıvere Y1 - 2018 PY - 2018 N1 - doi: 10.20304/humanitas.439458 DO - 10.20304/humanitas.439458 T2 - HUMANITAS - Uluslararası Sosyal Bilimler Dergisi JF - Journal JO - JOR SP - 177 EP - 192 VL - 6 IS - 12 SN - 2147-088X-2645-8837 M3 - doi: 10.20304/humanitas.439458 UR - https://doi.org/10.20304/humanitas.439458 Y2 - 2018 ER -
EndNote %0 HUMANITAS - International Journal of Social Sciences Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi %A Utku Tanrıvere %T Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi %D 2018 %J HUMANITAS - Uluslararası Sosyal Bilimler Dergisi %P 2147-088X-2645-8837 %V 6 %N 12 %R doi: 10.20304/humanitas.439458 %U 10.20304/humanitas.439458
ISNAD Tanrıvere, Utku . "Kısa Metinlerde Yazar Tanıma: Twitter İçin Bir Yöntem Önerisi". HUMANITAS - Uluslararası Sosyal Bilimler Dergisi 6 / 12 (October 2018): 177-192. https://doi.org/10.20304/humanitas.439458