BibTex RIS Kaynak Göster

Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi

Yıl 2016, Cilt: 19 Sayı: 3, 325 - 332, 01.09.2016

Öz

Varlık ismi tanıma, doğal dil işleme araştırma alanında bir problemdir ve genellikle doğal dildeki metinlerden kişi, yer ve kurum isimlerinin otomatik çıkarılması olarak tanımlanmaktadır. Bu çalışmada, Türkçe için geliştirdiğimiz Wikipedia tabanlı bir varlık ismi tanıma sistemi tanıtılmıştır. Wikipedia gibi internet kullanıcıları tarafından oluşturulan kaynakların varlık ismi tanıma gibi konular için oldukça faydalı oldukları bilinmektedir. Öncelikle, Türkçe Wikipedia’dan otomatik olarak geniş bir insan ismi listesi derlenmiştir. Daha sonra, bu liste ile birlikte yine Türkçe Wikipedia’dan ve Türkçe için kural-tabanlı bir sistemden elde edilmiş kişi, yer ve kurum ismi listelerini de kullanarak Türkçe için Wikipedia-tabanlı bir varlık ismi tanıma sistemi geliştirilmiştir. Sistemimiz değişik veri kümeleri üzerinde test edilerek değerlendirilmiş ve umut verici sonuçlar elde edilmiştir. Türkçe metinlerde bilgi çıkarımı üzerinde yapılmış kısıtlı sayıda çalışma olduğundan bizim sistemimiz bu konuda önemli bir katkı teşkil etmektedir.

Wikipedia-based Named Entity Recognition System for Turkish

Yıl 2016, Cilt: 19 Sayı: 3, 325 - 332, 01.09.2016

Öz

Named entity recognition is a problem in the research area of natural language processing and is usually defined as the automatic extraction of the names of people, locations, and organizations in natural language texts. In this study, a Wikipedia-based named entity recognition system for Turkish is introduced. It is well-known that resources like Wikipedia, which are created by internet users, are considerably important for topics like named entity recognition. We have first automatically compiled a large list of person names from Turkish Wikipedia. Then, we have developed a Wikipedia-based named entity recognition system for Turkish which utilizes this large list with other lists of person, location and organization named obtained from Turkish Wikipedia and a former rule-based named entity recognizer for Turkish. We have evaluated our system on different types of datasets and obtained promising results. Our system is a significant contribution to information extraction on Turkish texts since there are limited number of related studies carried out so far

Toplam 0 adet kaynakça vardır.

Ayrıntılar

Diğer ID JA27BS46GU
Bölüm Araştırma Makalesi
Yazarlar

Doğan Küçük Bu kişi benim

Nursal Arıcı Bu kişi benim

Yayımlanma Tarihi 1 Eylül 2016
Gönderilme Tarihi 1 Eylül 2016
Yayımlandığı Sayı Yıl 2016 Cilt: 19 Sayı: 3

Kaynak Göster

APA Küçük, D., & Arıcı, N. (2016). Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi. Politeknik Dergisi, 19(3), 325-332.
AMA Küçük D, Arıcı N. Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi. Politeknik Dergisi. Eylül 2016;19(3):325-332.
Chicago Küçük, Doğan, ve Nursal Arıcı. “Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi”. Politeknik Dergisi 19, sy. 3 (Eylül 2016): 325-32.
EndNote Küçük D, Arıcı N (01 Eylül 2016) Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi. Politeknik Dergisi 19 3 325–332.
IEEE D. Küçük ve N. Arıcı, “Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi”, Politeknik Dergisi, c. 19, sy. 3, ss. 325–332, 2016.
ISNAD Küçük, Doğan - Arıcı, Nursal. “Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi”. Politeknik Dergisi 19/3 (Eylül 2016), 325-332.
JAMA Küçük D, Arıcı N. Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi. Politeknik Dergisi. 2016;19:325–332.
MLA Küçük, Doğan ve Nursal Arıcı. “Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi”. Politeknik Dergisi, c. 19, sy. 3, 2016, ss. 325-32.
Vancouver Küçük D, Arıcı N. Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi. Politeknik Dergisi. 2016;19(3):325-32.
 
TARANDIĞIMIZ DİZİNLER (ABSTRACTING / INDEXING)
181341319013191 13189 13187 13188 18016

download Bu eser Creative Commons Atıf-AynıLisanslaPaylaş 4.0 Uluslararası ile lisanslanmıştır.