— Captioning technique used to display speaking language or its translation or to give information about images or sounds on television, cinema or other images as text has been used since the beginning of the 1900s and has developed to take its contemporary form. The development of informatics has greatly contributed to the progress of captioning techniques; it has especially become easier to convert speech to text with the aid of speech recognition. Furthermore, the captions for the hearing impaired, especially with speech recognition technique, is an alternative to sign language on live events. This technique is commercial and predominantly used with special hardware and software, and increases costs for the individual usage or small-sized companies. The announcement of voice search of Google Chrome in 2011 has been the start of this work. In this study, an application converting the speech to the text and displaying the live captions on a video broadcasted live on a web page using Google supported open source Web Speech API with the help of a media server is represented. The broadcast of a video on a web page is performed by the HTML5 video element, and the web application is coded using JavaScript and PHP programming languages and jQuery library
— Automatic Speech Recognition Live Webcast Live Captions HTML5 Internet
Televizyon, sinema veya diğer farklı görüntülerde konuşulan dili, çevirisini gösterme veya görüntü ve ses hakkında metin şeklinde bilgi verme amaçlı uygulanan alt yazı tekniği 1900’lerin başlarında kullanılmaya başlanmış ve gelişerek günümüzdeki haline gelmiştir. Bilişimdeki gelişmeler ise alt yazı tekniklerinin ilerlemesine büyük katkı sağlamış, özellikle konuşmaların metne dönüştürülmesi konuşma tanıma teknikleri ile daha kolay bir hale gelmiştir. Bunun yanında, işitme engelliler için kullanılan alt yazılar ise özellikle canlı yayınlarda konuşma tanıma tekniği ile işaret diline alternatif olarak kullanılmaktadır. Bu teknik daha çok ticari amaçlı özel donanım ve yazılımlarla beraber kullanılmakta, bireysel kullanım veya küçük ölçekli kurumlar için maliyet oluşturmaktadır. 2011’de Google Chrome’un Türkçe’yi de destekleyen sesle aramayı dünyaya duyurması ise bu çalışmanın çıkış noktasını oluşturmuştur. Bu çalışmada, bir medya sunucusu yardımıyla internet sayfasında canlı yayınlanan bir videodaki konuşmaların Google’ın desteklediği açık kaynak kodlu Web Speech API kullanılarak metne dönüştürülmesi ve anlık alt yazı haline getirilmesi uygulaması anlatılmaktadır. Çalışmada, web sayfasında video yayını HTML5 dilinin getirdiği video elementi ile sağlanmakta, web uygulaması JavaScript ve PHP programlama dilleri ve jQuery kütüphanesi kullanılarak yazılmıştır. Ayrıca, geliştirilen bu web uygulamasının verimi insan ve teknik bazda irdelenmiştir.
Birincil Dil | Türkçe |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 11 Şubat 2015 |
Gönderilme Tarihi | 11 Şubat 2015 |
Yayımlandığı Sayı | Yıl 2015 Cilt: 8 Sayı: 2 |