Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections

Cilt: 4 Sayı: 7 30 Aralık 2014
PDF İndir
EN TR

Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections

Öz

Geniş metinlerden bilgi çıkarımı konusunda çeşitli yöntemler bulunmaktadır. Bunlardan bir tanesi de şablonlar yöntemidir. Bu çalışmada şablonlar yöntemini kullanarak aralarında belli anlamsal ilişki bulunan ikililerin elde edilmesini sağlayan otomatik bir sistem geliştirilmiştir. Çalışma kapsamında morfolojik olarak çözümlenmiş ve çözümlenmemiş veri setleri üzerinde ayrı ayrı çalışılmıştır. Morfolojik olarak çözümlenmiş veri setinden daha iyi yapıda şablonlar elde edilmiştir. Yapılan denemeler sonucunda sürekli artan sayıda şablon kullanıldığı taktirde üretilen ikililerin doğruluklarının azaldığı görülmüştür. Sabit sayıda daha güvenilir şablonlardan büyüyen veri seti üzerinde daha iyi sonuçlar elde edilmiştir.

 

There are various methods about information extraction from large texts. One of them is method of templates. At this paper, we developed an automatic system that aims to produce pairs which have semantic relation between them using templates. In this study, we worked with morphological resolved and unresolved datasets. We obtained better templates from morphological resolved dataset. After experiments we observed that if many templates were used for producing pairs, accuracy of produced pairs was diminished.  Also, we obtain better results for fixed and more reliable templates with using growing datasets.

Anahtar Kelimeler

Kaynakça

  1. Miller, G. A., Beckwith, R., Fellbaum, C., Gross, D. and Miller, K., “Introduction to WordNet: An On-line Lexical Database”, 1993.
  2. Automatic Extraction of Semantic Relationships Using Turkish Dictionary Definitions", Emre Yazıcı, M.Fatih Amasyalı, EMO Bilimsel Dergi, Vol. 1, No. 1, pp. 1-13, 2011
  3. Amasyalı M. F., "Türkçe Wordnet'in Otomatik Olarak Oluşturulması", SIU 2005, 2005.
  4. http://lucene.apache.org/core/
  5. http://tr.wikipedia.org/wiki/Lucene
  6. Hearst, M., ``Automated Discovery of WordNet Relations,'' in WordNet: An Electronic Lexical Database, Christiane Fellbaum (ed.), MIT Press, 1998.
  7. htpp://maya.cs.depaul.edu/~classes/etc584/papers/brin.pdf
  8. http://rtw.ml.cmu.edu/rtw/

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

-

Yazarlar

Gürkan Şahin Bu kişi benim

Yayımlanma Tarihi

30 Aralık 2014

Gönderilme Tarihi

9 Ekim 2013

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2014 Cilt: 4 Sayı: 7

Kaynak Göster

APA
Şahin, G., & Amasyalı, F. (2014). Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections. EMO Bilimsel Dergi, 4(7), 13-20. https://izlik.org/JA48ZD89RC
AMA
1.Şahin G, Amasyalı F. Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections. EMO Bilimsel Dergi. 2014;4(7):13-20. https://izlik.org/JA48ZD89RC
Chicago
Şahin, Gürkan, ve Fatih Amasyalı. 2014. “Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections”. EMO Bilimsel Dergi 4 (7): 13-20. https://izlik.org/JA48ZD89RC.
EndNote
Şahin G, Amasyalı F (01 Aralık 2014) Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections. EMO Bilimsel Dergi 4 7 13–20.
IEEE
[1]G. Şahin ve F. Amasyalı, “Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections”, EMO Bilimsel Dergi, c. 4, sy 7, ss. 13–20, Ara. 2014, [çevrimiçi]. Erişim adresi: https://izlik.org/JA48ZD89RC
ISNAD
Şahin, Gürkan - Amasyalı, Fatih. “Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections”. EMO Bilimsel Dergi 4/7 (01 Aralık 2014): 13-20. https://izlik.org/JA48ZD89RC.
JAMA
1.Şahin G, Amasyalı F. Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections. EMO Bilimsel Dergi. 2014;4:13–20.
MLA
Şahin, Gürkan, ve Fatih Amasyalı. “Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections”. EMO Bilimsel Dergi, c. 4, sy 7, Aralık 2014, ss. 13-20, https://izlik.org/JA48ZD89RC.
Vancouver
1.Gürkan Şahin, Fatih Amasyalı. Geniş Metin Koleksiyonlarından İteratif Bilgi Çıkarımı Iterative Information Extraction from Large Text Collections. EMO Bilimsel Dergi [Internet]. 01 Aralık 2014;4(7):13-20. Erişim adresi: https://izlik.org/JA48ZD89RC

EMO BİLİMSEL DERGİ
Elektrik, Elektronik, Bilgisayar, Biyomedikal, Kontrol Mühendisliği Bilimsel Hakemli Dergisi
TMMOB ELEKTRİK MÜHENDİSLERİ ODASI 
IHLAMUR SOKAK NO:10 KIZILAY/ANKARA
TEL: +90 (312) 425 32 72 (PBX) - FAKS: +90 (312) 417 38 18
bilimseldergi@emo.org.tr