@article{article_74698, title={Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections}, journal={EMO Bilimsel Dergi}, volume={4}, pages={13–20}, year={2014}, author={Şahin, Gürkan and Amasyalı, Fatih}, keywords={Doğal Dil İşleme, Bilgi Çıkarımı, Şablonlar Yöntemi, Morfolojik Analiz, Anlamsal İlişki}, abstract={<p> <span style="font-family: "Times New Roman","serif"; font-size: 10pt; mso-fareast-font-family: "MS Mincho"; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">Geniş metinlerden bilgi çıkarımı konusunda çeşitli yöntemler bulunmaktadır. Bunlardan bir tanesi de şablonlar yöntemidir. Bu çalışmada şablonlar yöntemini kullanarak aralarında belli anlamsal ilişki bulunan ikililerin elde edilmesini sağlayan otomatik bir sistem geliştirilmiştir. Çalışma kapsamında morfolojik olarak çözümlenmiş ve çözümlenmemiş veri setleri üzerinde ayrı ayrı çalışılmıştır. Morfolojik olarak çözümlenmiş veri setinden daha iyi yapıda şablonlar elde edilmiştir. Yapılan denemeler sonucunda sürekli artan sayıda şablon kullanıldığı taktirde üretilen ikililerin doğruluklarının azaldığı görülmüştür. Sabit sayıda daha güvenilir şablonlardan büyüyen veri seti üzerinde daha iyi sonuçlar elde edilmiştir. </span> </p> <p>  </p> <p> <span style="font-family: "Times New Roman","serif"; font-size: 10pt; mso-fareast-font-family: "MS Mincho"; mso-ansi-language: EN-US; mso-fareast-language: ZH-CN; mso-bidi-language: AR-SA;">There are various methods about information extraction from large texts. One of them is method of templates. At this paper, we developed an automatic system that aims to produce pairs which have semantic relation between them using templates. In this study, we worked with morphological resolved and unresolved datasets. We obtained better templates from morphological resolved dataset. After experiments we observed that if many templates were used for producing pairs, accuracy of produced pairs was diminished.  Also, we obtain better results for fixed and more reliable templates with using growing datasets. <br /> </span> </p>}, number={7}, publisher={TMMOB Elektrik Mühendisleri Odası}