Amaç: Bu çalışmanın amacı, Türk Kütüphaneciliği dergisinin web sitesinde yer alan ve anahtar kelime ataması yapılmamış hakemli makalelere Türkçe özlerini kullanarak anahtar kelime atamaları gerçekleştirmektir. Bu sayede anahtar kelime eksikliği nedeniyle erişimde güçlük çekilen web arşivindeki çalışmalara daha etkin bir şekilde erişim sağlanması hedeflenmektedir.
Yöntem: Çalışmada, 1995 ile 1999 yılları arasında anahtar kelime olmaksızın yayımlanmış olan 58 hakemli makale incelenmiştir. Anahtar kelime ataması için Türkçe özleri girdi olarak kullanılan YAKE algoritması kullanılmış, metinlerin işlenmesi için Zemberek doğal dil işleme aracı ve Python programlama dili tercih edilmiştir. Atanan anahtar kelimelerin anlamlılığı, Anlamlılık Kontrol Oranı (AKO) ve Ortalama Mutlak Hata (OMH) değerleri ile ölçülmüştür. Atanan anahtar kelimelerin bağlamsal geçerliliği üç uzman değerlendirici ile algoritmanın atadığı anahtar kelimeler arasında değerlendirici uyumunu ölçen AC1 oranı ile ölçülmüştür.
Bulgular: Anahtar kelime ataması yapılan makalelerde en sık atama yapılan kelimelerin “kütüphane”, “bilgi”, “hizmet” ve “makale” olduğu tespit edilmiştir. Algoritmanın OMH değeri 0,099 olarak belirlenmiş, bu da algoritmanın yüksek doğrulukla anahtar kelime atadığını göstermektedir. Ancak, uzman değerlendiriciler ile algoritma tarafından atanan anahtar kelimeler arasında düşük seviyede uyum tespit edilmiştir.
Sonuç: Çalışma, Türkçe özlerden anahtar kelime çıkarımı yapmanın dijital belge erişimini artırmada önemli bir yöntem olduğunu göstermektedir. Algoritmaların daha yüksek performans göstermesi için, uzmanlar tarafından belirlenen veri setleri ile eğitilmeleri gerekmektedir. Ayrıca, yapılandırılmış öz kullanımı ve öz metinlerin uzunluğunun artırılması önerilmektedir.
Özgünlük: Bu çalışma bilimsel makalelerin Türkçe özlerden anahtar kelime çıkarımı yaparak dijital belge erişimini artırmaya yönelik özgün bir yaklaşım sunmaktadır. Kütüphanecilik ve Bilgi Bilim alanındaki dijitalleşmiş makaleleri web ortamından erişimin arttırılmasına yönelik yapılan ilk çalışmalardan biridir.
Çalışma etik kurul izni gerektirmeyen çalışmalar kapsamında yer almaktadır.
Çalışma kapsamında uzman değerlendirici olarak yer alan Kütüphaneci Dilan Karataş, Kütüphaneci Tuğba As ve Kütüphane Müdürü Fatih Furkan Gebel'e teşekkür ederim.
Purpose: This study aims to assign keywords to peer-reviewed articles on the Turkish Librarianship Journal's website that do not have keyword assignments by using their Turkish abstracts. The goal is to improve access to works in the web archive that are difficult to reach due to the lack of keywords.
Method: The study examined 58 peer-reviewed articles published without keywords between 1995 and 1999. The YAKE algorithm was used for keyword assignment, with Turkish abstracts as input, and the Zemberek natural language processing tool and Python programming language were utilized for text processing. The meaningfulness of the assigned keywords was measured using the Significance Control Ratio (SCR) and Mean Absolute Error (MAE) values. The contextual validity of the assigned keywords was assessed by measuring the inter-rater agreement (AC1 ratio) between three expert evaluators and the algorithm-assigned keywords.
Findings: The most frequently assigned keywords in the articles were "library," "information," "service," and "article." The algorithm's MAE value was determined to be 0.099, indicating that the algorithm assigned keywords with high accuracy. However, low agreement was found between the keywords the experts assigned and those the algorithm assigned.
Implications: The study demonstrates that extracting keywords from Turkish abstracts is essential for enhancing access to digital documents. Algorithms need to be trained on datasets determined by experts to perform better. Additionally, using structured abstracts and increasing the length of abstract texts are recommended.
Originality: This study presents a novel approach to improving digital document access by extracting keywords from Turkish abstracts of scientific articles. It is one of the first studies aimed at increasing web access to digitized articles in the Librarianship and Information Science field.
Primary Language | Turkish |
---|---|
Subjects | Archive, Information Retrival, Informetrics |
Journal Section | Research Articles |
Authors | |
Early Pub Date | December 22, 2024 |
Publication Date | |
Submission Date | May 20, 2024 |
Acceptance Date | October 12, 2024 |
Published in Issue | Year 2024 Volume: 38 Issue: 4 |
Bu dergi içeriği CC BY 4.0 ile lisanslanmaktadır.