Video-based steganography has attracted increasing attention due to its high payload capacity and improved imperceptibility compared to image-based approaches. In this study, a deep learning–based steganographic framework is proposed to embed and recover textual information within video content using the U-Net architecture. Unlike traditional least significant bit (LSB)–based techniques, the proposed method utilizes region-of-interest (ROI) selection and patch-based embedding to enhance robustness and visual quality. Textual data are first encoded into image patches and embedded into selected regions of video frames via a trained hiding network. A corresponding revealing network is employed to recover the hidden information, followed by an optical character recognition (OCR) pipeline for text extraction. Experimental results demonstrate character recovery accuracies between 81% and 88% while preserving high visual fidelity in the stego videos. This ROI-guided U-Net framework provides an effective and scalable solution for secure and imperceptible text hiding in video streams.
Ethics committee approval is not required for this study. “There is no conflict of interest with any person/institution in the prepared article.”
Video tabanlı steganografi, görüntü tabanlı yaklaşımlara kıyasla sunduğu yüksek veri taşıma kapasitesi ve gelişmiş görsel algılanamazlık özellikleri nedeniyle son yıllarda artan bir ilgi görmektedir. Bu çalışmada, U-Net mimarisi kullanılarak video içeriği içerisine metinsel bilgilerin gizlenmesi ve geri elde edilmesi amacıyla derin öğrenmeye dayalı bir steganografik yöntem önerilmektedir. Geleneksel en düşük anlamlı bit (LSB) tabanlı tekniklerden farklı olarak, önerilen yaklaşım; dayanıklılığı ve görsel kaliteyi artırmak amacıyla ilgi alanı (ROI) seçimi ve yama (patch) tabanlı yerleştirme stratejilerini kullanmaktadır. Metinsel veriler öncelikle görüntü tabanlı yamalara dönüştürülmekte ve eğitilmiş bir gizleme ağı aracılığıyla video karelerinin seçilen bölgelerine gömülmektedir. Gizlenen bilginin geri elde edilmesi için karşılık gelen bir çıkarım ağı kullanılmakta ve ardından metnin çıkarımı optik karakter tanıma (OCR) yöntemi ile gerçekleştirilmektedir. Deneysel sonuçlar, stego videolarda yüksek görsel bütünlük korunurken karakter geri kazanım doğruluğunun %81 ile %88 arasında değiştiğini göstermektedir. Önerilen ROI güdümlü U-Net tabanlı çerçeve, video akışlarında güvenli ve algılanamaz metin gizleme için etkili ve ölçeklenebilir bir çözüm sunmaktadır.
Bu çalışma için etik kurul onayı gerekmemektedir. "Hazırlanan makalede herhangi bir kişi/kurumla çıkar çatışması bulunmamaktadır."
| Birincil Dil | İngilizce |
|---|---|
| Konular | Yazılım Mühendisliği (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 9 Eylül 2025 |
| Kabul Tarihi | 27 Ocak 2026 |
| Yayımlanma Tarihi | 28 Şubat 2026 |
| DOI | https://doi.org/10.62520/fujece.1780558 |
| IZ | https://izlik.org/JA84MG47PB |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 5 Sayı: 1 |
Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY NC) ile lisanslanmıştır.