Determining a given text’s author and finding the texts, of those authors are same, through several texts is one of the most important application fields of forensic linguistics. Most of the studies, which are done up to the present, were conducted along with a long corpus, which also consists of relatively more linguistic data such as newspaper articles. Thus, they don’t suggest a method in terms of author identification of short texts. Yet, in forensic linguistic studies, the entreated texts are quite short. However, social media entries including the micro-blogs can be subject to criminal or law cases several times. Accordingly, there’s a need for some methods and aspects related to author identification. This study aims to suggest a method to determine authors by using grammar, punctuation, lexis and context features of texts, which were collected from the micro-blog named Twitter, with a special regard to its character constraint. The features, which are seen to be or to may be distinctive, are shared and the methods, which mostly need to be formatted related to the corpus, are presented along with their general titles.
Forensic linguistics author identification authorship attribution short texts social media
Verili bir metnin yazarını tespit etmek ve birkaç metnin arasından yazarı aynı olanları bulmak, adli dilbilimin önemli uygulama alanlarından biridir. Günümüze dek yapılan çalışmaların çoğu, gazetelerin köşe yazıları gibi uzun ve nispeten fazla miktarda dilsel veri içeren bütünce ile gerçekleştirildiğinden, kısa metinlerde yazar tanımaya ilişkin herhangi bir yöntem sunmamaktadır. Zira adli dilbilim kapsamında yapılan çalışmalarda, incelemelere konu edilen metinler oldukça kısadır. Bununla birlikte, mikro-blog siteleri de dahil olmak üzere, sosyal medya üzerinde yapılan paylaşımlar da çoğu kez ceza veya hukuk davalarının konusu olabilmektedir. Dolayısıyla kısa metinler üzerinde yazar tanımaya ilişkin birtakım yöntem ve yaklaşımlara ihtiyaç duyulmaktadır. Bu çalışma, özellikle karakter kısıtı gözetilerek seçilen Twitter adlı mikro-blog sitesinden toplanan çeşitli metinlerin; dilbilgisi, noktalama, sözcük ve bağlam özellikleri kullanılarak yazarlarının tespitine ilişkin bir yöntem önermeyi amaçlamaktadır. Ayırt edici olduğu veya olabileceği görülen özellikler paylaşılmakta ve çoğunlukla bütünceye göre biçimlendirilmesi gereken yöntemler, genel başlıklarıyla birlikte sunulmaktadır.
Adli dilbilim yazar tanıma yazar tespiti kısa metinler sosyal medya
Birincil Dil | Türkçe |
---|---|
Bölüm | Tüm Sayı |
Yazarlar | |
Yayımlanma Tarihi | 22 Ekim 2018 |
Yayımlandığı Sayı | Yıl 2018 Cilt: 6 Sayı: 12 |