Varlık
ismi tanıma; doğal dil işleme ve metin madenciliği alanlarının kapsamında yer
alan bir bilgi çıkarımı görevidir. Kapsam ve kullanılan metotlar açısından,
çalışmalar arasında farklılıklar görülse de temel olarak, bir metin
içerisindeki kişi, yer, kurum-kuruluş vb. belirten ifadelerin doğru şekilde
tespit edilmesini hedefler. Bu çalışmada, Türkçe yazılmış ders metinleri (tarih
ve coğrafya alanlarında) için bir varlık ismi tanıma yapısı geliştirilmiştir.
Tek başına ele aldığımızda bu yapı, bir bilgi çıkarımı görevi doğrultusunda
özelleştirilmiş bir projedir. Bunun yanı sıra çalışmanın eğitimsel bir değeri
de vardır; çünkü sistemden beklenen sonuç, verilen ders metninin içeriğinden
anlamlı kelime ya da kelime grupları bulunmasıdır ki; bu da farklı dersler ya
da ders konuları için terimler sözlüğü yapıları oluşturmak için kullanılabilir.
Oluşturulan sözlüklerin, bir ders metninin içeriğindeki soru değeri
taşıyabilecek ifadelerin tespitine ve sınav hazırlama sürecine yardımcı olması
hedeflenmektedir. Bu dokümanda, varlık ismi tanıma görevi ve görevin kapsamı
hakkında genel bilgi verilmiş; alanda yapılmış önceki çalışmalardan
bahsedilmiş; bu çalışma doğrultusunda geliştirilen sistem tanıtılmış; sistemin
başarısı, yapılan deney sonuçları üzerinden değerlendirilmiş ve
geliştirme-iyileştirme olanakları hakkında yorumlar paylaşılmıştır.
Named entity recognition
(NER) is an information extraction (IE) task that is in the scope of natural
language processing (NLP) and text mining. Its extent and methods may differ
between studies, but basically, it aims to detect expressions that indicates a
person, location, organization etc. In this study, a NER structure is developed
for Turkish lecture notes (for history and geography courses). Separately, this
structure is a project that is specialized for an information extraction task.
Besides, it also has an educational value, as the projected outcome from its
execution is meaningful words or word groups from the content of input lecture
notes, which can be used to construct glossary of terms structures for
individual courses or course subjects. With these glossary of terms structures,
it is aimed to detect expressions in the content of a lecture note that can be
used for questions and support a test preparation process. In this document,
general information about NER task and its scope is given; previous studies on
the field are mentioned; the system developed in line with this study is
introduced; success of the system is evaluated through experiment results and
some thoughts for enhancement are shared.
Computational linguistics Named entity recognition Natural language processing Information extraction Educational technology
Primary Language | English |
---|---|
Subjects | Computer Software |
Journal Section | Araştırma Articlessi \ Research Articles |
Authors | |
Publication Date | September 15, 2019 |
Submission Date | July 26, 2018 |
Acceptance Date | April 3, 2019 |
Published in Issue | Year 2019 Volume: 7 Issue: 3 |