Araştırma Makalesi
BibTex RIS Kaynak Göster

Birliktelik Kuralı Temelinde Kısaltma Genişletme

Yıl 2020, Cilt: 1 Sayı: 1, 20 - 27, 22.08.2020

Öz

Metinlerde yaygın olarak kullanılan kısaltmaların açık karşılıklarının bulunması, bilginin elde edilmesi ve anlaşılması açısından önemli bir gerekliliktir. Metinde kullanılan kısaltmaları, herkesin bildiği düşünülüyorsa metinde bu kısaltmaların açık karşılıklarına yer verilmeyebilir. Bununla birlikte bazen kullanılan kısaltma birden fazla açık karşılığa sahip olabilir ve bu durum anlaşılabilirliği zorlaştırır. Kısaltmalardan doğru açılımın oluşturulabilmesi halen üzerinde çalışılan bir konu olarak farklı yöntemlerle incelenmektedir. İncelenen literatürde Apriori algoritmasının kısaltma açılımının bulunmasına yönelik kullanımına rastlanmaması nedeniyle, bu çalışmada PubMed özetlerinde bulunan kısaltmaların açık karşılıklarının elde edilmesi için Birliktelik Kuralı temelinde bir yöntem önerilmiştir. İncelenen veri kümesi ve kısaltmalar dahilinde kısaltmanın birden fazla açık karşılığı olsa dahi uygulanan yöntem, ortak bir minimum destek değeri ile %87,5, farklı minimum destek değerleri ile %87,5’dan daha yüksek doğrulukla kısaltmanın açılımını bulabilmektedir.

Kaynakça

  • Bird, S., Tan, L., Garrette, D., Ljunglöf, P., Nothman, J., Korobov, M., ve Dimitriadis, A. (2020). Natural Language Toolkit. 31 Mayıs 2020 tarihinde https://www.nltk.org/ adresinden erişildi.
  • Cournapeau, D., Brucher, M., Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V.,… Boisberranger, J. (2020). scikit-learn. 31 Mayıs 2020 tarihinde https://scikit-learn.org/stable/ adresinden erişildi.
  • Jin, Q., Liu, J., ve Lu, X. (2019). Deep Contextualized Biomedical Abbreviation Expansion. 31 Mayıs 2020 tarihinde https://arxiv.org/pdf/1906.03360.pdf adresinden erişildi.
  • Li, C., Ji, L., ve Yan, J., (2015). Acronym Disambiguation Using Word Embedding. Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence (ss. 4178–4179).
  • Liu, H., Lussier, Y. A., ve Friedman, C., (2001). A study of abbreviations in the UMLS. Proc AMIA Symp (ss. 393-397).
  • Mahgoub, H., Rösner, D., Ismail, N., ve Torkey, F. (2008). A Text Mining Technique Using Association Rules Extraction. 31 Mayıs 2020 tarihinde http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.212.8624&rep=rep1&type=pdf adresinden erişildi.
  • Medical Abbreviations, (2020). 31 Mayıs 2020 tarihinde https://www.tabers.com/tabersonline/view/Tabers-Dictionary/767492/all/Medical_Abbreviations adresinden erişildi.
  • Moon, S., Pakhomov, S., ve Melton, G.B., (2012). Automated Disambiguation of Acronyms and Abbreviations in Clinical Texts: Window and Training Size Considerations. AMIA Annu Symp Proc. (ss. 1310–1319).
  • Reátegui, R., ve Ratté, S., (2019). Analysis of Medical Documents with Text Mining and Association Rule Mining. International Conference on Information Technology & Systems (ss.744–753).
  • Stevenson, M., Guo, Y., Amri, A., ve Gaizauskas, R. (2009). Disambiguation of Biomedical Abbreviations. 31 Mayıs 2020 tarihinde https://dl.acm.org/doi/10.5555/1572364.1572374 adresinden erişildi.
  • Wu, Y., Xu, J., Zhang, Y., ve Xu, H., (2015). Clinical Abbreviation Disambiguation Using Neural Word Embeddings. Proceedings of the 2015 Workshop on Biomedical Natural Language Processing (BioNLP 2015) (ss.171–176).
  • Yu, H., Hripcsak, G., ve Friedman, C. (2002). Mapping Abbreviations to Full Forms in Biomedical Articles. Journal of the American Medical Informatics Associatio n, 9(3), 262–272.
  • Zheng, J., Xiao, X., Wang, B., Zhu, Y., ve Yang, L. (2019). A New Method for Abbreviation Prediction viaCNN-BLSTM-CRF. 31 Mayıs 2020 tarihinde https://iopscience.iop.org/article/10.1088/1742-6596/1267/1/012001 adresinden erişildi.

Abbreviation Expansion on the Basis of the Association Rule

Yıl 2020, Cilt: 1 Sayı: 1, 20 - 27, 22.08.2020

Öz

Finding clear expansion of abbreviations commonly used in the texts is an important requirement for obtaining and understanding the information. If the abbreviations used in the text are thought to be known to everyone, these abbreviations might not be used with clear expansion in the text. However, sometimes used the abbreviation can have more than one clear equivalents and this makes understanding difficult. To be able to create correct expansion from abbreviations is still examined by different methods on as a subject being studied. In the literature reviewed, since the use of the Apriori algorithm for abbreviation expansion is not encountered, in this study, a method is proposed based on the association rule to obtain the clear expansion of the abbreviations in PubMed abstracts. Within the examined data set and abbreviations, even if the abbreviation has more than one clear expansion, the applied method can find the clear expansion of the abbreviation with 87.5% accuracy by a common minimum support value or more than 87.5% accuracy by different minimum support values.

Kaynakça

  • Bird, S., Tan, L., Garrette, D., Ljunglöf, P., Nothman, J., Korobov, M., ve Dimitriadis, A. (2020). Natural Language Toolkit. 31 Mayıs 2020 tarihinde https://www.nltk.org/ adresinden erişildi.
  • Cournapeau, D., Brucher, M., Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V.,… Boisberranger, J. (2020). scikit-learn. 31 Mayıs 2020 tarihinde https://scikit-learn.org/stable/ adresinden erişildi.
  • Jin, Q., Liu, J., ve Lu, X. (2019). Deep Contextualized Biomedical Abbreviation Expansion. 31 Mayıs 2020 tarihinde https://arxiv.org/pdf/1906.03360.pdf adresinden erişildi.
  • Li, C., Ji, L., ve Yan, J., (2015). Acronym Disambiguation Using Word Embedding. Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence (ss. 4178–4179).
  • Liu, H., Lussier, Y. A., ve Friedman, C., (2001). A study of abbreviations in the UMLS. Proc AMIA Symp (ss. 393-397).
  • Mahgoub, H., Rösner, D., Ismail, N., ve Torkey, F. (2008). A Text Mining Technique Using Association Rules Extraction. 31 Mayıs 2020 tarihinde http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.212.8624&rep=rep1&type=pdf adresinden erişildi.
  • Medical Abbreviations, (2020). 31 Mayıs 2020 tarihinde https://www.tabers.com/tabersonline/view/Tabers-Dictionary/767492/all/Medical_Abbreviations adresinden erişildi.
  • Moon, S., Pakhomov, S., ve Melton, G.B., (2012). Automated Disambiguation of Acronyms and Abbreviations in Clinical Texts: Window and Training Size Considerations. AMIA Annu Symp Proc. (ss. 1310–1319).
  • Reátegui, R., ve Ratté, S., (2019). Analysis of Medical Documents with Text Mining and Association Rule Mining. International Conference on Information Technology & Systems (ss.744–753).
  • Stevenson, M., Guo, Y., Amri, A., ve Gaizauskas, R. (2009). Disambiguation of Biomedical Abbreviations. 31 Mayıs 2020 tarihinde https://dl.acm.org/doi/10.5555/1572364.1572374 adresinden erişildi.
  • Wu, Y., Xu, J., Zhang, Y., ve Xu, H., (2015). Clinical Abbreviation Disambiguation Using Neural Word Embeddings. Proceedings of the 2015 Workshop on Biomedical Natural Language Processing (BioNLP 2015) (ss.171–176).
  • Yu, H., Hripcsak, G., ve Friedman, C. (2002). Mapping Abbreviations to Full Forms in Biomedical Articles. Journal of the American Medical Informatics Associatio n, 9(3), 262–272.
  • Zheng, J., Xiao, X., Wang, B., Zhu, Y., ve Yang, L. (2019). A New Method for Abbreviation Prediction viaCNN-BLSTM-CRF. 31 Mayıs 2020 tarihinde https://iopscience.iop.org/article/10.1088/1742-6596/1267/1/012001 adresinden erişildi.
Toplam 13 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Araştırma Makaleleri
Yazarlar

Saadet Aytaç Arpacı 0000-0001-6226-4210

Banu Diri 0000-0002-4052-0049

Yayımlanma Tarihi 22 Ağustos 2020
Gönderilme Tarihi 31 Mayıs 2020
Kabul Tarihi 9 Ağustos 2020
Yayımlandığı Sayı Yıl 2020 Cilt: 1 Sayı: 1

Kaynak Göster

APA Arpacı, S. A., & Diri, B. (2020). Birliktelik Kuralı Temelinde Kısaltma Genişletme. İleri Mühendislik Çalışmaları Ve Teknolojileri Dergisi, 1(1), 20-27.
AMA Arpacı SA, Diri B. Birliktelik Kuralı Temelinde Kısaltma Genişletme. imctd. Ağustos 2020;1(1):20-27.
Chicago Arpacı, Saadet Aytaç, ve Banu Diri. “Birliktelik Kuralı Temelinde Kısaltma Genişletme”. İleri Mühendislik Çalışmaları Ve Teknolojileri Dergisi 1, sy. 1 (Ağustos 2020): 20-27.
EndNote Arpacı SA, Diri B (01 Ağustos 2020) Birliktelik Kuralı Temelinde Kısaltma Genişletme. İleri Mühendislik Çalışmaları ve Teknolojileri Dergisi 1 1 20–27.
IEEE S. A. Arpacı ve B. Diri, “Birliktelik Kuralı Temelinde Kısaltma Genişletme”, imctd, c. 1, sy. 1, ss. 20–27, 2020.
ISNAD Arpacı, Saadet Aytaç - Diri, Banu. “Birliktelik Kuralı Temelinde Kısaltma Genişletme”. İleri Mühendislik Çalışmaları ve Teknolojileri Dergisi 1/1 (Ağustos 2020), 20-27.
JAMA Arpacı SA, Diri B. Birliktelik Kuralı Temelinde Kısaltma Genişletme. imctd. 2020;1:20–27.
MLA Arpacı, Saadet Aytaç ve Banu Diri. “Birliktelik Kuralı Temelinde Kısaltma Genişletme”. İleri Mühendislik Çalışmaları Ve Teknolojileri Dergisi, c. 1, sy. 1, 2020, ss. 20-27.
Vancouver Arpacı SA, Diri B. Birliktelik Kuralı Temelinde Kısaltma Genişletme. imctd. 2020;1(1):20-7.