Türkçe
Otomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemlerinde
kullanılan akustik model gürbüz bir dil modeli ile desteklenmediği durumlarda
kelime hata oranı yüksek çıkmaktadır. İyi dizayn edilmiş bir dil modeli ile
akustik modelin birlikte ASR’de kullanılması kelime hata oranını düşürmektedir.
ASR için gerekli dil modelinin eğitiminde düz metin verisi kullanılmaktadır.
Kullanılan metin verisinin doğruluğu ASR modellerinin eğitimi için oldukça
önemlidir. Bu çalışmada, doğal dil işlemeye dayalı bir yöntem kullanılarak
Türkçe ASR sisteminin eğitilmesinde kullanılan metin verisi içerisindeki yazım
hatalarının tespiti ve düzeltilmesi gerçekleştirilmiştir. Öncelikle metin
verisi içerisinde dil bilgisel olarak yanlış yazılmış olan kelimeler
bulunmuştur. Bir kelimedeki karakter eksikliği, karakter fazlalığı, karakterlerin
yer değiştirmesi veya karakteri yanlış yazılmış olan kelimeler hatalı olarak
kabul edilmiştir. Metin verisi içerisinde hatalı olarak kabul edilen kelimeler
morfolojik analiz ile tespit edilmiştir. Yanlış kelimelerin yerine atanacak
olan kelimeler belirlenmiştir. Yanlış yazılmış olan kelimeler doğru kelimeler
ile değiştirilmiştir. Gerçekleştirilen çalışma hatalı kelimeleri tespit etme ve
doğru kelimeler ile yer değiştirme işleminde %93 oranında başarı göstermiştir.
Konuşma Tanıma, Doğal Dil İşleme, Düz Metin Hataları, Gramatik Kelime Hatası
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar |
|
Yayımlanma Tarihi | 30 Aralık 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 2 Sayı: 2 |
Dergimizin Tarandığı Dizinler (İndeksler)
Academic Resource Index | Google Scholar | ASOS Index |
Rooting Index | The JournalTOCs Index | General Impact Factor (GIF) Index |
Directory of Research Journals Indexing | I2OR Index
|