Ses kayıtlarının adli olaylarda delil olarak kullanılması halinde, bu kayıtlarının içeriğinin değiştirilmesi suç teşkil etmektedir. Ses kopyala-yapıştır sahteciliği, konuşmanın içeriğini değiştirmek amacıyla yapılan sahteciliklerden en yaygın olanıdır. Bu sahtecilik, sesteki bir kelime ya da kelime grubunun kopyalanıp, aynı sesin içinde herhangi bir konuma yapıştırılmasıyla gerçekleştirilmektedir. Bu çalışmada ses kopyala-yapıştır sahteciliğini tespit etmek için görsel kelimelere dayalı sağlam ve yeni bir yöntem önerilmektedir. Önerilen yöntem, şüpheli ses dosyasındaki sahtecilik ipuçlarını tespit etmek için sesten elde edilen kelimelerin Mel-Spectogram görüntülerini kullanır. Bu amaçla ses dosyası öncelikle perde bazlı ses aktivite algılama (Voice Activity Detection-VAD) yöntemi kullanılarak kelimelere ayrılır. Daha sonra her kelime Mel Spectogram görüntüsüne dönüştürülür. Spectogram görüntüleri arasındaki benzerliği hesaplamak için yapısal farklılık (Structural Difference-DSSIM) kullanılır. Kelime görüntüleri arasındaki DSSIM değerlerine göre sahte kelimeler işaretlenir. Deneysel sonuçlar, önerilen yöntemin diğer çalışmalara kıyasla son işlem operasyonlarına karşı önemli ölçüde yüksek dayanıklılığa sahip olduğunu ve daha yüksek doğruluk değerini verdiğini göstermektedir.
Changing the content of these recordings constitutes a crime if speech recordings are used as evidence in judicial cases. Audio copy-move forgery is the most common forgery made to change the content of the conversation. This forgery is carried out by copying a word or group of words in the speech and pasting it to any position within the same speech. In this study, a robust new method based on visual words is proposed to detect audio copy-move forgery. The proposed method uses Mel-Spectogram images of words extracted from the audio to detect forgery clues in the suspicious audio file. For this purpose, the audio file is first separated into words using the pitch-based VAD method. Each word is then converted into a Mel Spectogram image. DSSIM is used to calculate the similarity between spectrogram images. Forgery segments are marked according to the DSSIM values between word images. Experimental results show that the proposed method has significantly higher robustness to post-processing operations and yields higher accuracy compared to other works.
Birincil Dil | Türkçe |
---|---|
Konular | Adli Bilişim |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Erken Görünüm Tarihi | 11 Ocak 2024 |
Yayımlanma Tarihi | 15 Ocak 2024 |
Gönderilme Tarihi | 19 Eylül 2023 |
Kabul Tarihi | 11 Aralık 2023 |
Yayımlandığı Sayı | Yıl 2024 |