Araştırma Makalesi
BibTex RIS Kaynak Göster

Arşiv Belgelerinin Aranması Üzerine Anlamsal Arama Botu Geliştirilmesi ve Hukuki Terimler Üzerinden Değerlendirilmesi

Yıl 2021, , 56 - 79, 30.06.2021
https://doi.org/10.33721/by.868918

Öz

Arşivlerde tutulan belgeler tarihi öneme sahip olup; hukuki, siyasi, bilimsel, idari vb. nitelikte, maddi ve/veya manevi değeri olan ulusal ve hatta uluslararası niteliği olan veriler içerir. Günümüzde, arşivlerdeki belgeler, geleneksel belge arama zorlukları nedeniyle, dijital ortama aktarılarak, dijital arşiv katalogları, diğer adıyla arşiv yönetim sistemleri, oluşturulmuştur. Dijital kataloglar sayesinde, belgelerin yıpranmadan saklanması ve düzenlenmesi ve istenen bilgilere hızlı erişim için gerekli belgenin bulunması nispeten kolay hale geldi. Ayrıca, gerekli bir belgeyi talep eden diğer kuruluşlarla anında paylaşılabilmesi zaman ve usul ekonomisi sağlamış ve belge yönetimindeki sıkıntıları azaltmıştır. Ancak günümüz dijital kataloglar, Web 2.0 teknolojisi ile geliştirilmiş, sorgu tabanlı çalışan yazılımlardır. Bu tür sistemlerde ihtiyaç duyulan veriyi içeren belgenin taramasında söz dizimsel arama yapılmaktadır. Bu nedenle, ilgili belgenin bulunmasında ıskalamalar olabilmektedir. Özellikle, hukuki kavram içeren belge aramalarında, hem daha çok sayıda tarihsel nitelikli arşiv belgesi bulunması, hem de eski lügatlerin halen kullanılabilmesi nedeniyle, sistemden dönen belge sonuçları daha karmaşık veya ciddi belge ıskalamalarına neden olabilmekte ve bu durum, kullanıcıları ilgili belge bulmada zorlamaktadır. Oysa gelişen yapay zekâ teknolojisi sayesinde, bu katalogları akıllıca işletmek ve mevcut yapısını geliştirmek mümkündür. Anlamsal Web, meta veri depolamayı kolaylaştırarak ve bilgi alma sürecinin kalitesini artıran, anlamsal yetenekler ekleyerek mevcut dijital katalogları güçlendirebilir. Bu makalede, ontoloji ile biçimlendirilmiş olan arşiv belgeleri üzerinde anlamsal arama yapabilen bir yazılım botu sunulmaktadır. Bot, kural tabanlı çalışan anlamsal arama motoru olup, dijital kataloglar üzerinde yapılan veri taramasında kullanıcıların arama kelimelerini girdi kullanır. Bot, ontolojideki tüm kavramları, kavramsal bağları, türemiş kelime özelliği, eş anlamlı özelliği, tekil-çoğul ilişkisi vb. yapıları girdi kelimeler ile tarar ve aramayı zenginleştirir. Değerlendirme sürecinde, eski lügat dahil ederek hukuki terimler üzerinden bot ile çeşitli belge arama çalışmaları yapılmıştır. Daha sonra, söz dizimsel arama yapan başka iki dijital katalog üzerinde aynı terimler belge aramada tekrarlanmıştır, böylece; dönen sistem sonuçları kıyaslanmıştır. Elde edilen sonuçlar umut verici olup, bot ’un mevcut kataloglar üzerinde uygulanabilirliğini, etkililiğini ve verimliliğini göstermektedir.

Kaynakça

  • Ahonen, E. ve Hyvonen, E. (2009, September). Publishing Historical Texts on the Semantic Web a Case Study. In 2009 IEEE International Conference on Semantic Computing (pp. 167-173). IEEE.
  • Altay, A. (2002). İngilizce ve Türkçe Hukuk Dillerinin Özellikleri: Karşılaştırmalı Bir Çalışma. Hacettepe Üniversiteyi Edebiyat Fakültesi Dergisi, 2(19), 13-32.
  • Berners-Lee, T., Hendler, J. ve Lassila, O. (2001). The Semantic Web. Scientific American, 284(5), 34-43.
  • Domingue, J., Fensel, D. ve Hendler, J. A. (Eds.). (2011). Handbook of Semantic Web Technologies. Springer Science & Business Media.
  • Ertugrul, M., & Gunes, A. (2017). Arşiv Yönetim Sistemleri için Ontoloji Bilgi Tabanı Geliştirilmesi. Aksaray University Journal of Science and Engineering, 1(2), 85-109.
  • Gruber, T. (2009). Ontology. Encyclopedia of Database Systems, 1, 1963-1965.
  • Hitzler, P., Krötzsch, M., Parsia, B., Patel-Schneider, P. F. ve Rudolph, S. (2009). OWL 2 Web Ontology Language Primer. W3C Recommendation, 27(1), 123.
  • Horridge, M. ve Bechhofer, S. (2011). The Owl Api: A Java Api for Owl Ontologies. Semantic Web, 2(1), 11-21.
  • Horrocks, I., Patel-Schneider, P. F., Boley, H., Tabet, S., Grosof, B. ve Dean, M. (2004). SWRL: A Semantic Web Rule Language Combining OWL and RuleML. W3C Member Submission, 21(79), 1-31.
  • Hyvönen, E., Viljanen, K., Tuominen, J. ve Seppälä, K. (2008). Building a National Semantic Web Ontology and Ontology Service Infrastructure–the FinnONTO Approach. In European Semantic Web Conference (pp. 95-109). Springer, Berlin, Heidelberg.
  • Kişisel Verilerin Korunması Kanunu. (2016, 24 Mart). Resmi Gazete (6698). Erişim adresi: https://www.mevzuat.gov.tr/mevzuat?MevzuatNo=6698&MevzuatTur=1&MevzuatTertip=5
  • Levene, M. (2011). An Introduction to Search Engines and Web Navigation. John Wiley & Sons.
  • Madhu, G., Govardhan, D. A. ve Rajinikanth, D. T. (2011). Intelligent Semantic Web Search Engines: A Brief Survey. arXiv preprint arXiv:1102.0831.
  • McGuinness, D. L. ve Van Harmelen, F. (2004). OWL Web Ontology Language Overview. W3C Recommendation, 10(10), 2004.
  • Noy, N. F., Sintek, M., Decker, S., Crubézy, M., Fergerson, R. W. ve Musen, M. A. (2001). Creating Semantic Web Contents with Protege-2000. IEEE Intelligent Systems, 16(2), 60-71.
  • O'Connor, M. J. ve Das, A. K. (October). SQWRL: a Query Language for OWL. In OWLED, 2009(529).
  • O'reilly, T. (2009). What is Web 2.0. O'Reilly Media, Inc.
  • Preethi, N. ve Devi, T. (2012). Case and Relation (CARE) Based Page Rank Algorithm for Semantic Web Search Engines. International Journal of Computer Science Issues (IJCSI), 9(3), 329.
  • Protégé Ontology Editor. (1999). Stanford University School of Medicine: http://protege.stanford.edu/
  • Rose, D. E. ve Levinson, D. (2004, May). Understanding user goals in web search. In Proceedings of the 13th International Conference on World Wide Web (pp. 13-19).
  • The MUNIN Project-An overview, MUNIN Final Event. (2015). Dipl.-Wirtsch.-Ing. University MUNIN Project Coordinator: Hans-Christoph Burmeister, Hamburg, Germany. Erişim adresi: http://www.unmanned-ship.org/munin/wp-content/uploads/2015/06/MUNIN-Final-Event-B-1-CML-The-MUNIN-Project-An-Overview.pdf.
  • Winkler, W. E. (1999). The State of Record Linkage and Current Research Problems. In Statistical Research Division, US Census Bureau.
  • Winkler, W. E. ve Thibaudeau, Y. (1991). An Application of the Fellegi-Sunter Model of record Linkage to the 1990 US Decennial Census. Washington, DC: US Bureau of the Census.

Developing Semantic Search Bot for Searching Archive Documents and Evaluating Using Legal Terms

Yıl 2021, , 56 - 79, 30.06.2021
https://doi.org/10.33721/by.868918

Öz

Documents kept in the national archive are of historical importance and are the heritage of a nation. These documents can be legal, political, scientific, administrative etc., have material and / or moral value, may contain a variety of sensitive and important personal / national data. Today, documents in national archives have been transferred to digital environment due to traditional document search difficulties, and digital archive catalogs, also known as archive management systems, have been established. Thanks to digital catalogs, it has become relatively easy to store and organize documents without fraying and to find the necessary document for quick access to the desired information. In addition, the ability to instantly share a required document with other demanding organizations has provided time and procedure economy and reduced document management difficulties. However, these digital catalogs have been developed with today's Web 2.0 technology and are query-based systems. When searching for documents on such systems, syntactic search is performed. This situation may cause misses in searching and finding relevant documents. Especially in document searches with legal concepts, since there are more historical archive documents and old dictionaries can still be used, documents returned from the system may cause more complex results or serious document misses, which makes it difficult for users to find relevant documents. However, thanks to the developing artificial intelligence technology, it is possible to operate and develop these catalogs intelligently. Semantic Web technologies can enhance existing digital archive catalogs by facilitating metadata storage and adding semantic capabilities that improve the quality of the information retrieval process. In this article, a software bot capable of semantic search on archive documents which are previously formatted with ontology, is presented. Bot is a rule-based semantic search engine and uses users' search words as input for required data search on digital catalogs. Bot searches all the concepts, conceptual links, derived word features, synonym features, singular-plural relations etc. in ontology according to the entered keywords and enriches the current search process. During the evaluation phase, various document search studies were carried out on the bot, including the old dictionary and using legal terms. Next, the same terms are repeated in the document search on two other digital catalogs that perform syntactic search, so that returning system results were compared. The results of the sample document search studies applied are promising and show the applicability, effectiveness and efficiency of the proposed bot in existing archive catalogs.

Kaynakça

  • Ahonen, E. ve Hyvonen, E. (2009, September). Publishing Historical Texts on the Semantic Web a Case Study. In 2009 IEEE International Conference on Semantic Computing (pp. 167-173). IEEE.
  • Altay, A. (2002). İngilizce ve Türkçe Hukuk Dillerinin Özellikleri: Karşılaştırmalı Bir Çalışma. Hacettepe Üniversiteyi Edebiyat Fakültesi Dergisi, 2(19), 13-32.
  • Berners-Lee, T., Hendler, J. ve Lassila, O. (2001). The Semantic Web. Scientific American, 284(5), 34-43.
  • Domingue, J., Fensel, D. ve Hendler, J. A. (Eds.). (2011). Handbook of Semantic Web Technologies. Springer Science & Business Media.
  • Ertugrul, M., & Gunes, A. (2017). Arşiv Yönetim Sistemleri için Ontoloji Bilgi Tabanı Geliştirilmesi. Aksaray University Journal of Science and Engineering, 1(2), 85-109.
  • Gruber, T. (2009). Ontology. Encyclopedia of Database Systems, 1, 1963-1965.
  • Hitzler, P., Krötzsch, M., Parsia, B., Patel-Schneider, P. F. ve Rudolph, S. (2009). OWL 2 Web Ontology Language Primer. W3C Recommendation, 27(1), 123.
  • Horridge, M. ve Bechhofer, S. (2011). The Owl Api: A Java Api for Owl Ontologies. Semantic Web, 2(1), 11-21.
  • Horrocks, I., Patel-Schneider, P. F., Boley, H., Tabet, S., Grosof, B. ve Dean, M. (2004). SWRL: A Semantic Web Rule Language Combining OWL and RuleML. W3C Member Submission, 21(79), 1-31.
  • Hyvönen, E., Viljanen, K., Tuominen, J. ve Seppälä, K. (2008). Building a National Semantic Web Ontology and Ontology Service Infrastructure–the FinnONTO Approach. In European Semantic Web Conference (pp. 95-109). Springer, Berlin, Heidelberg.
  • Kişisel Verilerin Korunması Kanunu. (2016, 24 Mart). Resmi Gazete (6698). Erişim adresi: https://www.mevzuat.gov.tr/mevzuat?MevzuatNo=6698&MevzuatTur=1&MevzuatTertip=5
  • Levene, M. (2011). An Introduction to Search Engines and Web Navigation. John Wiley & Sons.
  • Madhu, G., Govardhan, D. A. ve Rajinikanth, D. T. (2011). Intelligent Semantic Web Search Engines: A Brief Survey. arXiv preprint arXiv:1102.0831.
  • McGuinness, D. L. ve Van Harmelen, F. (2004). OWL Web Ontology Language Overview. W3C Recommendation, 10(10), 2004.
  • Noy, N. F., Sintek, M., Decker, S., Crubézy, M., Fergerson, R. W. ve Musen, M. A. (2001). Creating Semantic Web Contents with Protege-2000. IEEE Intelligent Systems, 16(2), 60-71.
  • O'Connor, M. J. ve Das, A. K. (October). SQWRL: a Query Language for OWL. In OWLED, 2009(529).
  • O'reilly, T. (2009). What is Web 2.0. O'Reilly Media, Inc.
  • Preethi, N. ve Devi, T. (2012). Case and Relation (CARE) Based Page Rank Algorithm for Semantic Web Search Engines. International Journal of Computer Science Issues (IJCSI), 9(3), 329.
  • Protégé Ontology Editor. (1999). Stanford University School of Medicine: http://protege.stanford.edu/
  • Rose, D. E. ve Levinson, D. (2004, May). Understanding user goals in web search. In Proceedings of the 13th International Conference on World Wide Web (pp. 13-19).
  • The MUNIN Project-An overview, MUNIN Final Event. (2015). Dipl.-Wirtsch.-Ing. University MUNIN Project Coordinator: Hans-Christoph Burmeister, Hamburg, Germany. Erişim adresi: http://www.unmanned-ship.org/munin/wp-content/uploads/2015/06/MUNIN-Final-Event-B-1-CML-The-MUNIN-Project-An-Overview.pdf.
  • Winkler, W. E. (1999). The State of Record Linkage and Current Research Problems. In Statistical Research Division, US Census Bureau.
  • Winkler, W. E. ve Thibaudeau, Y. (1991). An Application of the Fellegi-Sunter Model of record Linkage to the 1990 US Decennial Census. Washington, DC: US Bureau of the Census.
Toplam 23 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Bilgisayar Yazılımı
Bölüm Hakemli Makaleler
Yazarlar

Mehmet Ertuğrul 0000-0002-5833-4092

Demet Çelik Ulusoy 0000-0002-5542-9467

Yayımlanma Tarihi 30 Haziran 2021
Gönderilme Tarihi 26 Ocak 2021
Yayımlandığı Sayı Yıl 2021

Kaynak Göster

APA Ertuğrul, M., & Çelik Ulusoy, D. (2021). Arşiv Belgelerinin Aranması Üzerine Anlamsal Arama Botu Geliştirilmesi ve Hukuki Terimler Üzerinden Değerlendirilmesi. Bilgi Yönetimi, 4(1), 56-79. https://doi.org/10.33721/by.868918

15529