Araştırma Makalesi

Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme

Cilt: 14 Sayı: 1 28 Haziran 2021
PDF İndir
EN TR

Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme

Öz

Yapay zekâ alanında son dönemlerde öne çıkan derin öğrenme mimarilerinin, doğal dil işleme konusunun önemli problemlerinden biri olan Anlam Belirsizliği Giderme (ABG) çalışmalarında kayda değer gelişmelere yol açtığı gözlemlenmektedir. Denetimli yöntemler rakiplerine göre daha yüksek performans sergilemektedirler. Bunun en büyük nedeni kullanılan eğitim verilerinin büyüklükleridir. ABG problemi için İngilizce dili üzerinde elle-etiketlenmiş çok miktarda veri çevrim içi olarak erişilebilir durumdadır. Ancak düşük-kaynaklı diller (DKD’ler) probleme uygun veri eksikliği yaşamaktadırlar. Yeterli derecede probleme uygun veri toplamak ve etiketlemek vakit alıcı ve yüksek maliyet gerektiren bir iştir. Bu probleme değinmek ve aşmak üzere, bu çalışmada yarı-denetimli bağlamsal anlam belirsizliği giderme yaklaşımının veri artırımı için (daha sonra denetimli öğrenmede eğitim verisi olarak kullanılmak üzere) kullanılabileceğinin gösterilmesi amaçlanmıştır. Bu bağlamda özellikle DKD’lerde ABG problemi için test verisi bulmanın zor olması nedeniyle yaklaşımın doğruluğunu ve ilerleyen dönemlerde DKD’lerde kullanılabilirliğini ispatlamak amacıyla çevrimiçi bulunan elle-etiketlenmiş İngilizce ABG verisi kullanılmıştır. Oluşturulan yarı-denetimli yöntemde öbek kümesi (seed set) ve bağlam vektörleri (context embeddings) kullanılmaktadır. Yapılan çalışma 9 farklı bağlamsal dil modelinde (ELMo, BERT, RoBERTa vb.) test edilmiş ve her bir dil modelinin ABG problemi üzerindeki etkileri raporlanmıştır. İlk temel yaklaşıma göre sonuçlar üzerinde %28 doğruluk oranında performans artışı sağlanmıştır. (ELMo ile ilk temel yaklaşım ile %50,39 ve ELMo Anlam Öbek Esaslı Ortalama Benzerlik Modeli ile %78,06). Alınan ilk sonuçlara neticesinde, önerilen yaklaşımın özellikle DKD’ler yönelik ABG veri kümesi oluşturmak için gelecek vaat eden ettiği gösterilmiştir. Bu makale [18]’deki çalışmamızın genişletilmiş bir versiyonudur.

Anahtar Kelimeler

Kaynakça

  1. Lesk, M. Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone, in Proceedings of the 5th annual international conference on Systems documentation. ACM, 1986, pp. 24 26.
  2. Agirre, E. ve Soroa, A. Personalizing pagerank for word sense disambiguation, in Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics. Association for Computational Linguistics, 2009, pp. 33–41.
  3. Yarowsky, D. Unsupervised word sense disambiguation rivaling supervised methods, in 33rd annual meeting of the association for computational linguistics, 1995, pp. 189–196.
  4. Zhong, Z. ve Ng, H. T. It makes sense: A wide-coverage word sense disambiguation system for free text, in Proceedings of the ACL 2010 system demonstrations, 2010, pp. 78–83.
  5. Iacobacci, I., Pilehvar, M. T. ve Navigli, R. Embeddings for word sense disambiguation: An evaluation study, in Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), vol. 1, 2016, pp. 897–907.
  6. Raganato, A., Bovi, C. D. ve Navigli, R. Neural sequence learning models for word sense disambiguation, in Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, 2017, pp. 1156–1167.
  7. Luo, F., Liu, T., Xia, Q., Chang, B. ve Sui, Z. Incorporating glosses into neural word sense disambiguation, arXiv preprint arXiv:1805.08028, 2018.
  8. Miller, G. A., Chodorow, M., Landes, S., Leacock, C. Ve Thomas, R. G. Using a semantic concordance for sense identification, in Proceedings of the workshop on Human Language Technology. Association for Computational Linguistics, 1994, pp. 240–243.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

28 Haziran 2021

Gönderilme Tarihi

4 Aralık 2020

Kabul Tarihi

22 Şubat 2021

Yayımlandığı Sayı

Yıl 2021 Cilt: 14 Sayı: 1

Kaynak Göster

APA
Torunoglu Selamet, D., & Cebiroğlu Eryiğit, G. (2021). Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 14(1), 34-46. https://doi.org/10.54525/tbbmd.835744
AMA
1.Torunoglu Selamet D, Cebiroğlu Eryiğit G. Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme. TBV-BBMD. 2021;14(1):34-46. doi:10.54525/tbbmd.835744
Chicago
Torunoglu Selamet, Dilara, ve Gülşen Cebiroğlu Eryiğit. 2021. “Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 14 (1): 34-46. https://doi.org/10.54525/tbbmd.835744.
EndNote
Torunoglu Selamet D, Cebiroğlu Eryiğit G (01 Haziran 2021) Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 14 1 34–46.
IEEE
[1]D. Torunoglu Selamet ve G. Cebiroğlu Eryiğit, “Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme”, TBV-BBMD, c. 14, sy 1, ss. 34–46, Haz. 2021, doi: 10.54525/tbbmd.835744.
ISNAD
Torunoglu Selamet, Dilara - Cebiroğlu Eryiğit, Gülşen. “Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 14/1 (01 Haziran 2021): 34-46. https://doi.org/10.54525/tbbmd.835744.
JAMA
1.Torunoglu Selamet D, Cebiroğlu Eryiğit G. Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme. TBV-BBMD. 2021;14:34–46.
MLA
Torunoglu Selamet, Dilara, ve Gülşen Cebiroğlu Eryiğit. “Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 14, sy 1, Haziran 2021, ss. 34-46, doi:10.54525/tbbmd.835744.
Vancouver
1.Dilara Torunoglu Selamet, Gülşen Cebiroğlu Eryiğit. Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme. TBV-BBMD. 01 Haziran 2021;14(1):34-46. doi:10.54525/tbbmd.835744

Cited By

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.