Derleme

Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti

Cilt: 3 Sayı: 2 30 Aralık 2019
PDF İndir
EN TR

Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti

Öz

Günümüzde doğadaki birçok doğal ses kaynağı yanısıra sentetik sesler de çoklu ortam sistemlerinde kullanılmaktadır. Bu seslerin bulunduğu ortamlar (sahneler) biyometrik yetkilendirme, güvenlik isterleri ve gürbüz/güvenli sesli/görüntülü iletişim için önem arz etmektedir. Konuşma/konuşmacı tanıma, doğrulama gibi özel kısıtlara sahip ses biçemleri haricinde çoklu seslerin ayrıştırılması, gürültü giderilmesi, ses sahnesi/ olaylarının tespiti ve ses etiketleme işlemleri siber güvenlik açısından daha güvenli bilişim sistemleri oluşturulması adına gün geçtikçe önem kazanmaktadır. Derin öğrenme katmanlı altyapısı gereği oldukça iyi bir biçimde ham verideki özniteliklerin ve anlamsal ilişkinin elde edilmesine olanak sunmasından dolayı son yılllarda siber güvenlik alanında da tercih edilir olmuştur. Bu çalışmada siber güvenlik kapsamında çoklu ortam verisi olarak ses (veya konuşma) analizi ve sınıflandırma/tahminleme ve tespit için derin öğrenme mimari modellerinin kullanımı irdelenmiştir. Çalışmamızda 2015 ilâ 2019 yılları arasındaki yayınlarda öne çıkan modeller olan derin sinir ağları, evrişimli sinir ağları, tekrarlayıcı sinir ağları, kısıtlanmış Boltzmann makinesi ve derin inanç ağları sistematik olarak incelenmiştir. Böylece siber güvenlikte ses/konuşma işleme, sesle aldatmayı önleme, tutarlı ve yüksek başarımlı sonuçları elde etmeye dair literatürdeki yönelim kırkı aşkın çalışma üzerinden bilimsel bulgulara dayanan tartışma ve yorumlarla açıkça ortaya konulmaktadır.

Anahtar Kelimeler

Kaynakça

  1. Alisamir, S., Ahadi, S. M., & Seyedin, S. (2018). An end-to-end deep learning model to recognize Farsi speech from raw input. In Proceedings of IEEE 4th Iranian Conference on Signal Processing and Intelligent Systems (ICSPIS) (pp. 1–5). Tehran, Iran: IEEE. http://dx.doi.org/10.1109/ICSPIS.2018.8700538
  2. Anand, P., Singh, A. K., Srivastava, S., & Lall, B. (2019). Few shot speaker recognition using deep neural networks. Electrical Engineering and Systems Science, Audio and Speech Processing(eess.AS), ArXiv. 1–5. Retrieved from https://arxiv.org/abs/1904.08775
  3. Babaee, E., Anuar, N. B., Wahab, A. W. A., Shamshirband, S., & Chronopoulos, A. T. (2017). An overview of audio event detection methods from feature extraction to classification, Applied Artificial Intelligence, 31(9–10), 661–714. http://dx.doi.org/10.1080/08839514.2018.1430469.
  4. Bhatt, G., Gupta, A., Arora, A., & Raman, B. (2018). Acoustic features fusion using attentive multi-channel deep architecture. Proceedings of CHIME 2018 Workshop on Speeech Processing in Everyday Environments, Hyderabad, India, 30–34. http://dx.doi.org/10.21437/CHiME.2018-7
  5. Boddapati, V., Petef, A., Rasmusson, J., & Lundberg, L. (2017). Classifying environmental sounds using image recognition networks. Procedia Computer Science, 112, 2048–2056. http://dx.doi.org/10.1016/j.procs.2017.08.250.
  6. Chen, K., Yan, Z-J., & Huo, Q. (2015). Training deep bidirectional LSTM acoustic model for LVCSR by a context-sensitive-chunk BPTT approach. In Proceedings of the INTERSPEECH 2015 16th Annual Conference of the International Speech Communication Association: Vol 1-5 (pp.3600–3604). Dresden, Germany: ISCA archive. Retrieved from https://www.isca-speech.org/archive/interspeech_2015/i15_3600.html
  7. Chollet, F. (2017). Deep learning with python. Newyork, NY: Manning Publication.
  8. Chung, H., Park, J. G., & Jung, H.-Y. (2019). Rank-weighted reconstruction feature for a robust deep neural network-based acoustic model. ETRI Journal, 41(2), 235–241. http://dx.doi.org/10.4218/etrij.2018-0189

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Yazılımı

Bölüm

Derleme

Yayımlanma Tarihi

30 Aralık 2019

Gönderilme Tarihi

11 Temmuz 2019

Kabul Tarihi

2 Aralık 2019

Yayımlandığı Sayı

Yıl 2019 Cilt: 3 Sayı: 2

Kaynak Göster

APA
Karasulu, B. (2019). Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti. Acta Infologica, 3(2), 60-82. https://izlik.org/JA56NU24UD
AMA
1.Karasulu B. Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti. ACIN. 2019;3(2):60-82. https://izlik.org/JA56NU24UD
Chicago
Karasulu, Bahadir. 2019. “Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti”. Acta Infologica 3 (2): 60-82. https://izlik.org/JA56NU24UD.
EndNote
Karasulu B (01 Aralık 2019) Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti. Acta Infologica 3 2 60–82.
IEEE
[1]B. Karasulu, “Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti”, ACIN, c. 3, sy 2, ss. 60–82, Ara. 2019, [çevrimiçi]. Erişim adresi: https://izlik.org/JA56NU24UD
ISNAD
Karasulu, Bahadir. “Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti”. Acta Infologica 3/2 (01 Aralık 2019): 60-82. https://izlik.org/JA56NU24UD.
JAMA
1.Karasulu B. Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti. ACIN. 2019;3:60–82.
MLA
Karasulu, Bahadir. “Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti”. Acta Infologica, c. 3, sy 2, Aralık 2019, ss. 60-82, https://izlik.org/JA56NU24UD.
Vancouver
1.Bahadir Karasulu. Çoklu Ortam Sistemleri İçin Siber Güvenlik Kapsamında Derin Öğrenme Kullanarak Ses Sahne ve Olaylarının Tespiti. ACIN [Internet]. 01 Aralık 2019;3(2):60-82. Erişim adresi: https://izlik.org/JA56NU24UD