<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20241031//EN"
        "https://jats.nlm.nih.gov/publishing/1.4/JATS-journalpublishing1-4.dtd">
<article  article-type="research-article"        dtd-version="1.4">
            <front>

                <journal-meta>
                                                                <journal-id>veri bilim derg</journal-id>
            <journal-title-group>
                                                                                    <journal-title>Veri Bilimi</journal-title>
            </journal-title-group>
                                        <issn pub-type="epub">2667-582X</issn>
                                                                                            <publisher>
                    <publisher-name>Murat GÖK</publisher-name>
                </publisher>
                    </journal-meta>
                <article-meta>
                                        <article-id/>
                                                                <article-categories>
                                            <subj-group  xml:lang="en">
                                                            <subject>Engineering</subject>
                                                    </subj-group>
                                            <subj-group  xml:lang="tr">
                                                            <subject>Mühendislik</subject>
                                                    </subj-group>
                                    </article-categories>
                                                                                                                                                        <title-group>
                                                                                                                        <article-title>Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi</article-title>
                                                                                                                                        </title-group>
            
                                                    <contrib-group content-type="authors">
                                                                        <contrib contrib-type="author">
                                                                <name>
                                    <surname>Polat</surname>
                                    <given-names>Hüseyin</given-names>
                                </name>
                                                                    <aff>GAZİ ÜNİVERSİTESİ</aff>
                                                            </contrib>
                                                    <contrib contrib-type="author">
                                                                <name>
                                    <surname>Sever</surname>
                                    <given-names>Hayri</given-names>
                                </name>
                                                                    <aff>ÇANKAYA ÜNİVERSİTESİ</aff>
                                                            </contrib>
                                                    <contrib contrib-type="author">
                                                                <name>
                                    <surname>Oyucu</surname>
                                    <given-names>Saadin</given-names>
                                </name>
                                                                    <aff>GAZİ ÜNİVERSİTESİ</aff>
                                                            </contrib>
                                                    <contrib contrib-type="author">
                                                                <name>
                                    <surname>Tekbaş</surname>
                                    <given-names>Şükran</given-names>
                                </name>
                                                                    <aff>Emfa Yazılım Danışmanlık A.Ş.</aff>
                                                            </contrib>
                                                                                </contrib-group>
                        
                                        <pub-date pub-type="pub" iso-8601-date="20191230">
                    <day>12</day>
                    <month>30</month>
                    <year>2019</year>
                </pub-date>
                                        <volume>2</volume>
                                        <issue>2</issue>
                                        <fpage>18</fpage>
                                        <lpage>24</lpage>
                        
                        <history>
                                    <date date-type="received" iso-8601-date="20191101">
                        <day>11</day>
                        <month>01</month>
                        <year>2019</year>
                    </date>
                                                    <date date-type="accepted" iso-8601-date="20191213">
                        <day>12</day>
                        <month>13</month>
                        <year>2019</year>
                    </date>
                            </history>
                                        <permissions>
                    <copyright-statement>Copyright © 2018, Veri Bilimi</copyright-statement>
                    <copyright-year>2018</copyright-year>
                    <copyright-holder>Veri Bilimi</copyright-holder>
                </permissions>
            
                                                                                                <abstract><p>TürkçeOtomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemlerindekullanılan akustik model gürbüz bir dil modeli ile desteklenmediği durumlardakelime hata oranı yüksek çıkmaktadır. İyi dizayn edilmiş bir dil modeli ileakustik modelin birlikte ASR’de kullanılması kelime hata oranını düşürmektedir.ASR için gerekli dil modelinin eğitiminde düz metin verisi kullanılmaktadır.Kullanılan metin verisinin doğruluğu ASR modellerinin eğitimi için oldukçaönemlidir. Bu çalışmada, doğal dil işlemeye dayalı bir yöntem kullanılarakTürkçe ASR sisteminin eğitilmesinde kullanılan metin verisi içerisindeki yazımhatalarının tespiti ve düzeltilmesi gerçekleştirilmiştir. Öncelikle metinverisi içerisinde dil bilgisel olarak yanlış yazılmış olan kelimelerbulunmuştur. Bir kelimedeki karakter eksikliği, karakter fazlalığı, karakterlerinyer değiştirmesi veya karakteri yanlış yazılmış olan kelimeler hatalı olarakkabul edilmiştir. Metin verisi içerisinde hatalı olarak kabul edilen kelimelermorfolojik analiz ile tespit edilmiştir. Yanlış kelimelerin yerine atanacakolan kelimeler belirlenmiştir. Yanlış yazılmış olan kelimeler doğru kelimelerile değiştirilmiştir. Gerçekleştirilen çalışma hatalı kelimeleri tespit etme vedoğru kelimeler ile yer değiştirme işleminde %93 oranında başarı göstermiştir.</p></abstract>
                                                                                    
            
                                                            <kwd-group>
                                                    <kwd>Konuşma Tanıma</kwd>
                                                    <kwd>  Doğal Dil İşleme</kwd>
                                                    <kwd>  Düz Metin Hataları</kwd>
                                                    <kwd>  Gramatik Kelime Hatası</kwd>
                                            </kwd-group>
                                                        
                                                                                                                                                    </article-meta>
    </front>
    <back>
                            <ref-list>
                                    <ref id="ref1">
                        <label>1</label>
                        <mixed-citation publication-type="journal">[1]	Delibas A. “Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi”. Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Bilgisayar Mühendisliği,  İstanbul, Türkiye, 2008 .</mixed-citation>
                    </ref>
                                    <ref id="ref2">
                        <label>2</label>
                        <mixed-citation publication-type="journal">[2]	 Starlander M, Popescu-Belis A. “Corpus-based Evaluation of A French Spelling and Grammer Checker”. Third International Conference On Language Resources And Evaluation, Las Palmas, Canary Islands, Spain, 29 -31 May 2002.</mixed-citation>
                    </ref>
                                    <ref id="ref3">
                        <label>3</label>
                        <mixed-citation publication-type="journal">[3]	 Gabriele K. “A Word Analysis System for German Hyphenation Full Text Search and Spell Checking with Regard to the Latest Reform of German Orthography” Institute of Computer Graphics, Algorithms and Data Structures Group, Vienna University of Technology, Vienna, Austria, 2011.</mixed-citation>
                    </ref>
                                    <ref id="ref4">
                        <label>4</label>
                        <mixed-citation publication-type="journal">[4]	 Dembitz S, Knezevich P, Sokele M. “Developing A Spell Checker As An Expert System” Journal of Computing and Information Technology, 1(4), 285- 291, 2004.</mixed-citation>
                    </ref>
                                    <ref id="ref5">
                        <label>5</label>
                        <mixed-citation publication-type="journal">[5]	 Dembitz S, Knezevich P, Sokele M. “Hascheck – the Croatian Academic Spelling Checker” 18th Annual International Conference of The British Computer Society Specialist Group on Expert System, Cambridge, England, December 1998.</mixed-citation>
                    </ref>
                                    <ref id="ref6">
                        <label>6</label>
                        <mixed-citation publication-type="journal">[6]	 Dhanabalan T, Parthasarathi R, Geetha TV. “Tamil Spell Checker” Tamil Internet, Chennai, India 2003.</mixed-citation>
                    </ref>
                                    <ref id="ref7">
                        <label>7</label>
                        <mixed-citation publication-type="journal">[7]	 Murata M, Utiyama M, Uchimoto K, Ma Q, Isahara H. “Correction of Errors in a Modality Corpus Used for Machine Translation Using Machine-learning”. Japan Communications Research Laboratory, Kyoto, Japan, 2001.</mixed-citation>
                    </ref>
                                    <ref id="ref8">
                        <label>8</label>
                        <mixed-citation publication-type="journal">[8]	 Cakiroglu U, Ozyurt, O. “Türkçe Metinlerdeki Yazım Yanlışlarına Yönelik Otomatik Düzeltme Modeli”, Eleco, Bursa, Türkiye, 7-9 Haziran 2016.</mixed-citation>
                    </ref>
                                    <ref id="ref9">
                        <label>9</label>
                        <mixed-citation publication-type="journal">[9]	 Zemberek. “Ağaç Performansı ve Kök Seçiciler”. http://zembereknlp.blogspot.com/2007/04/zemberek-nasl-alr-2aa-performans-ve-kk.html (15.04.20189).</mixed-citation>
                    </ref>
                                    <ref id="ref10">
                        <label>10</label>
                        <mixed-citation publication-type="journal">[10]	 Akgul O. “Türkçe Kelimelerin Morfolojik Analizi”.  https://akgulomer.wordpress.com/2011/01/23/turkce-kelimelerin-morfolojik-analizi/ (13.04.2019).</mixed-citation>
                    </ref>
                            </ref-list>
                    </back>
    </article>
