Author identification is probably one of the most important applications of forensic linguistics. Considering scientific literature in Turkish language, related studies have been carried out relatively recently and very short texts have not been used in these studies (Amasyalı & Diri, 2006; Taş & Görür, 2007; Doğan & Diri, 2010). However, texts involving only a few words may also be a subject of study in terms of forensic linguistics. In the past, as a result of a study on published texts (tweets) on a micro-blog site “Twitter”, a method in the scientific literature in the Turkish language had been proposed (Tanrıvere, 2018). In the present study, however, that very method has been tested with a new corpus consisting of tweets again, and the markers within the method were developed by increasing the number and making elaborations qualitatively. This method has brought about successful results by comparing texts with known and unknown authors. In the implementation process, there have been some distinctive but unpredicted markers. These were also given in detail and proposed to be added to the relevant marker group within the method. The results of the study have shown in general author identification is possible even in very short texts and the method may also be used in forensic contexts.
Forensic linguistics author identification authorship attribution idiolect short texts social media
Yazar tanıma, adli dilbilimin belki de en önemli uygulamalarından bir tanesidir. Türkçe alan yazınına bakıldığında ise bu konudaki çalışmaların nispeten kısa bir süredir yapıldığı ve bu çalışmalarda çok kısa metinlerin kullanılmadığı görülmektedir (Amasyalı ve Diri, 2006; Taş ve Görür, 2007; Doğan ve Diri, 2010). Oysaki adli dilbilim çerçevesinde sadece birkaç sözcükten ibaret olan metinler dahi bir inceleme konusu olabilmektedir. Geçmişte, Twitter isimli mikro-blog sitesinde yayınlanan metinler (tweet) üzerinde yapılan bir çalışma neticesinde Türkçe alan yazınında bir yöntem önerilmiştir (Tanrıvere, 2018). Bu çalışma kapsamında ise söz konusu yöntem, yine Twitter iletilerinden oluşan yeni bir bütünce ile sınanmış ve yöntemi oluşturan ölçütler sayıca arttırılıp nitel bağlamda da detaylandırılarak geliştirilmeye çalışılmıştır. Yöntem, yazarının kim olduğu bilinmeyen iletilerin yazarı bilinen iletilerle karşılaştırılması neticesinde olumlu sonuçlar vermiştir. Uygulama sürecinde öngörülmemiş başka birtakım ayırt edici ölçütlerin de varlığı gözlenmiş ve bunlar detaylıca sunularak, yöntemdeki ilgili ölçüt gruplarına dahil edilmeleri önerilmiştir. Elde edilen sonuçlar genel olarak, çok kısa metinlerde dahi yazar tespitinin mümkün olduğunu ve yöntemin adli bağlamlarda da kullanılabileceğini göstermektedir.
Primary Language | Turkish |
---|---|
Subjects | Linguistics |
Journal Section | Articles |
Authors | |
Publication Date | December 31, 2020 |
Submission Date | December 9, 2019 |
Acceptance Date | April 4, 2020 |
Published in Issue | Year 2020 |
Bu eser Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.