Research Article
BibTex RIS Cite

Güncel Biçimiyle Sözlü Türkçe Derlemi: Teknik ve İstatistiksel Bir Çözümleme

Year 2017, Volume: 14 Issue: 2, 1 - 14, 15.07.2017

Abstract

Bu makalenin öncelikli amacı Prof. Dr. Şükriye Ruhi'nin öncülüğünde
geliştirilen ODTÜ Sözlü Türkçe Derlemi'nin (STD) oluşturulmasında
kullanılan teknolojileri ve iş akışlarını açıklamaktır. STD'nin
oluşturulmasında merkezi bir konumda olan Web Tabanlı Derlem Yönetim
Sistemi, kayıtların çeviriyazısı, kontrolü ve yayınlanmasını kolaylaştıran bir
dizi iş akışını, veri biçimini ve dışa aktarma seçeneklerini barındırmaktadır.
Derlem yönetim sistemi, proje araştırmacıları tarafından Python programlama
dili kullanılarak geliştirilmiş olup, farklı rollere sahip proje üyelerinin
çevrimiçi bir arayüzden uzaktan ortaklaşa çalışabilmelerini sağlamaktadır.
STD kapsamında 286,391 sözcüklük konuşmanın çeviriyazısı tamamlanmış
ve kontrolden geçmiş, 79,189 sözcüklük konuşma ise bütünüyle yayına hazır
hale getirilmiştir. Makalede derlemdeki bu kayıtlarla ilgili genel istatistikler
sunularak STD'nin daha geniş çaplı bir sürümü için yapılması gerekenler
tartışılmaktadır.

References

  • Acar, M. G. C. & Eryılmaz, K. (2010). Sözlü Derlem İçin Web Tabanlı Yönetim Sistemi. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. 17-18 Mayıs 2010, 437-443.
  • DiPierro, M. (2009). Web2py Enterprise Web Framework. Wiley Publishing.
  • DiPierro, M. (2011). Web2py for scientific applications. Computing in Science & Engineering, 13(2), 64-69.
  • Schmidt, T. (2004). Transcribing and annotating spoken language with EXMARaLDA. In Proceedings of the LREC-Workshop on XML based richly annotated corpora, Lisbon 2004.
  • Ruhi, Ş., Işık-Güler, H., Hatipoğlu, Ç., Eröz-Tuğa, B., & Çokal Karadaş, D. (2010). Achieving representativeness through the parameters of spoken language and discursive features: the case of the Spoken Turkish Corpus. Language Windowing through Corpora. Visualización del lenguaje a través de corpus. Part II. Universidade da Coruna, 789-799.
  • TÜİK. İl, yaş grubu ve cinsiyete göre nüfus. Erişim Adresi: http://www.tuik.gov.tr/PreIstatistikTablo.do?istab_id=945. Erişim tarihi: 26/06/2017.
Year 2017, Volume: 14 Issue: 2, 1 - 14, 15.07.2017

Abstract

References

  • Acar, M. G. C. & Eryılmaz, K. (2010). Sözlü Derlem İçin Web Tabanlı Yönetim Sistemi. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. 17-18 Mayıs 2010, 437-443.
  • DiPierro, M. (2009). Web2py Enterprise Web Framework. Wiley Publishing.
  • DiPierro, M. (2011). Web2py for scientific applications. Computing in Science & Engineering, 13(2), 64-69.
  • Schmidt, T. (2004). Transcribing and annotating spoken language with EXMARaLDA. In Proceedings of the LREC-Workshop on XML based richly annotated corpora, Lisbon 2004.
  • Ruhi, Ş., Işık-Güler, H., Hatipoğlu, Ç., Eröz-Tuğa, B., & Çokal Karadaş, D. (2010). Achieving representativeness through the parameters of spoken language and discursive features: the case of the Spoken Turkish Corpus. Language Windowing through Corpora. Visualización del lenguaje a través de corpus. Part II. Universidade da Coruna, 789-799.
  • TÜİK. İl, yaş grubu ve cinsiyete göre nüfus. Erişim Adresi: http://www.tuik.gov.tr/PreIstatistikTablo.do?istab_id=945. Erişim tarihi: 26/06/2017.
There are 6 citations in total.

Details

Journal Section Makaleler
Authors

Güneş Acar

Publication Date July 15, 2017
Published in Issue Year 2017 Volume: 14 Issue: 2

Cite

APA Acar, G. (2017). Güncel Biçimiyle Sözlü Türkçe Derlemi: Teknik ve İstatistiksel Bir Çözümleme. Dil Ve Edebiyat Dergisi, 14(2), 1-14.