Yakın anlamlı kavramların bulunması, kavramın
bir derlemdeki semantik anlamını yakalamamızı ve kavramın hangi bağlamda
kullanıldığını elde etmemizi sağlar. Kelime Uzayı Modeli; anlamsal olarak
benzer kelimeleri, vektör uzayında bir birine yakın dağılımla gösteren bir
modeldir. Her bir kelimenin bir vektörle temsil edildiği bu modelde oluşan
kelime vektörleri kelime yerleştirme (Word Embeddings) olarak adlandırılır. Kelime
vektörleri metin analizi gerçekleştiren özellikle yapay sinir ağlarını temel
alan Doğal Dil İşleme (DDİ) sistemlerinde girdi olarak kullanılır. Bu çalışmada,
veri seti olarak TBMM Genel Kurul görüşme tutanakları kullanılmış, Word2vec modeli ve GloVe modeli ile kelime
vektörleri çıkarılmıştır. Elde
edilen kelime vektörleri kullanılarak TBMM Genel Kurul tutanaklarında geçen
herhangi bir kavrama en yakın anlamlı kavramlar bulunmuştur. Literatürdeki
benzer çalışmalarda iki farklı kelime yerleştirme modellerinin bir kavramı
tamamen farklı bağlamda değerlendirdiği duruma rastlanılmamıştır. Bu çalışma
sonucunda, Word2vec ve GloVe modellerinin çıktılarının bir kavramın farklı
bağlamlarda kullanımını bulmak için değerlendirilebileceği görülmüştür. Çalışmada
derleme özgü analojilerin her iki modelde de bulunabildiği görülmüştür. Bu
çalışmadan elde edilen sonuçlar TBMM Genel Kurul tutanaklarında arama yaparken benzer kavramların
anahtar kelime olarak önerilmesi için kullanılacaktır.
kelime vektörü Word2vec modeli GloVe modeli sinir ağları doğal dil işleme
Birincil Dil | Türkçe |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Temmuz 2018 |
Gönderilme Tarihi | 6 Mart 2018 |
Yayımlandığı Sayı | Yıl 2018 Cilt: 11 Sayı: 3 |