Araştırma Makalesi
BibTex RIS Kaynak Göster

Güncel Biçimiyle Sözlü Türkçe Derlemi: Teknik ve İstatistiksel Bir Çözümleme

Yıl 2017, Cilt: 14 Sayı: 2, 1 - 14, 15.07.2017

Öz

Bu makalenin öncelikli amacı Prof. Dr. Şükriye Ruhi'nin öncülüğünde
geliştirilen ODTÜ Sözlü Türkçe Derlemi'nin (STD) oluşturulmasında
kullanılan teknolojileri ve iş akışlarını açıklamaktır. STD'nin
oluşturulmasında merkezi bir konumda olan Web Tabanlı Derlem Yönetim
Sistemi, kayıtların çeviriyazısı, kontrolü ve yayınlanmasını kolaylaştıran bir
dizi iş akışını, veri biçimini ve dışa aktarma seçeneklerini barındırmaktadır.
Derlem yönetim sistemi, proje araştırmacıları tarafından Python programlama
dili kullanılarak geliştirilmiş olup, farklı rollere sahip proje üyelerinin
çevrimiçi bir arayüzden uzaktan ortaklaşa çalışabilmelerini sağlamaktadır.
STD kapsamında 286,391 sözcüklük konuşmanın çeviriyazısı tamamlanmış
ve kontrolden geçmiş, 79,189 sözcüklük konuşma ise bütünüyle yayına hazır
hale getirilmiştir. Makalede derlemdeki bu kayıtlarla ilgili genel istatistikler
sunularak STD'nin daha geniş çaplı bir sürümü için yapılması gerekenler
tartışılmaktadır.

Kaynakça

  • Acar, M. G. C. & Eryılmaz, K. (2010). Sözlü Derlem İçin Web Tabanlı Yönetim Sistemi. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. 17-18 Mayıs 2010, 437-443.
  • DiPierro, M. (2009). Web2py Enterprise Web Framework. Wiley Publishing.
  • DiPierro, M. (2011). Web2py for scientific applications. Computing in Science & Engineering, 13(2), 64-69.
  • Schmidt, T. (2004). Transcribing and annotating spoken language with EXMARaLDA. In Proceedings of the LREC-Workshop on XML based richly annotated corpora, Lisbon 2004.
  • Ruhi, Ş., Işık-Güler, H., Hatipoğlu, Ç., Eröz-Tuğa, B., & Çokal Karadaş, D. (2010). Achieving representativeness through the parameters of spoken language and discursive features: the case of the Spoken Turkish Corpus. Language Windowing through Corpora. Visualización del lenguaje a través de corpus. Part II. Universidade da Coruna, 789-799.
  • TÜİK. İl, yaş grubu ve cinsiyete göre nüfus. Erişim Adresi: http://www.tuik.gov.tr/PreIstatistikTablo.do?istab_id=945. Erişim tarihi: 26/06/2017.
Yıl 2017, Cilt: 14 Sayı: 2, 1 - 14, 15.07.2017

Öz

Kaynakça

  • Acar, M. G. C. & Eryılmaz, K. (2010). Sözlü Derlem İçin Web Tabanlı Yönetim Sistemi. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. 17-18 Mayıs 2010, 437-443.
  • DiPierro, M. (2009). Web2py Enterprise Web Framework. Wiley Publishing.
  • DiPierro, M. (2011). Web2py for scientific applications. Computing in Science & Engineering, 13(2), 64-69.
  • Schmidt, T. (2004). Transcribing and annotating spoken language with EXMARaLDA. In Proceedings of the LREC-Workshop on XML based richly annotated corpora, Lisbon 2004.
  • Ruhi, Ş., Işık-Güler, H., Hatipoğlu, Ç., Eröz-Tuğa, B., & Çokal Karadaş, D. (2010). Achieving representativeness through the parameters of spoken language and discursive features: the case of the Spoken Turkish Corpus. Language Windowing through Corpora. Visualización del lenguaje a través de corpus. Part II. Universidade da Coruna, 789-799.
  • TÜİK. İl, yaş grubu ve cinsiyete göre nüfus. Erişim Adresi: http://www.tuik.gov.tr/PreIstatistikTablo.do?istab_id=945. Erişim tarihi: 26/06/2017.
Toplam 6 adet kaynakça vardır.

Ayrıntılar

Bölüm Makaleler
Yazarlar

Güneş Acar

Yayımlanma Tarihi 15 Temmuz 2017
Yayımlandığı Sayı Yıl 2017 Cilt: 14 Sayı: 2

Kaynak Göster

APA Acar, G. (2017). Güncel Biçimiyle Sözlü Türkçe Derlemi: Teknik ve İstatistiksel Bir Çözümleme. Dil Ve Edebiyat Dergisi, 14(2), 1-14.