Günümüzde bilgisayar destekli araçlar, akademik araştırmalarda bilgiye erişimi iyileştirme ve verimliliği optimize etmede önemli bir rol oynamaktadır. Bu bağlamda, yapay zeka ve doğal dil işleme tekniklerinin kullanımı, araştırmacıların iş yükünü hafifletmekte ve daha hızlı sonuçlar elde etmelerini sağlamaktadır. Bu çalışmada, araştırma sürecinin özellikle literatür taraması ve kaynak bulma aşamalarında verimliliği artırmayı amaçlayan yeni bir prototip çalışma geliştirilmiştir. Bu çalışma, kullanıcıların girdiği anahtar kelimeler aracılığıyla Google Scholar platformundan belirlenen sayıda akademik makaleyi PDF formatında otomatik olarak indirir. Ardından Berstum, TextRank ve LexRank olmak üzere üç farklı özetleme algoritması seçeneği sunarak, indirilen makalelerin özetlerini çıkarır. Kullanıcı dostu bir arayüz aracılığıyla araştırmacılar istedikleri anahtar kelimeleri girebilir, benzerlik analizi için bir metin sağlayabilir ve tercih ettikleri özetleme algoritmasını seçebilirler. Elde edilen özetler ve benzerlik skorları arayüzde anlaşılır bir şekilde sunulur. İndirilen makalelerin içeriklerini kullanıcının girdiği metinle karşılaştırmak amacıyla metinlerdeki kelimelerin önem ve benzerliğini ölçen TF-IDF (Terim Frekansı-Ters Belge Frekansı) ve kosinüs benzerlik algoritmaları kullanılmıştır. Bu sayede, kullanıcının aradığı konularla ilgili makaleler ve ilgili bölümler tespit edilebilmektedir. Çalışmada ayrıca, geliştirilen prototipin ürettiği özetlerin kalitesini değerlendirmek için, özetlerin kullanıcıların girdiği referans metinlerle olan örtüşmesini, kesinliğini ve anlam bütünlüğünü ölçen Bleu, Rouge ve Meteor metrikleri kullanılmıştır. Bu değerlendirme sonucunda prototip çalışmanın ürettiği özetlerin yüksek doğruluk değerlerine ulaştığı görülmüştür. Prototip bu çalışma, farklı formatlarda ve düzenlerde olabilen PDF dosyalarının yapısal farklılıklarını ele almak için çeşitli ön işleme adımları kullanır. Bu sayede, farklı kaynaklardan gelen makalelerin özetleri ve benzerlik analizleri tutarlı bir şekilde gerçekleştirilebilmektedir.
Doğal Dil İşleme Benzerlik Analizi Metin Özetleme Bertsum LexRank TextRank
Today, computer-aided tools play an important role in improving access to information and optimizing efficiency in academic research. In this context, the use of artificial intelligence and natural language processing techniques reduces the workload of researchers and enables them to obtain faster results. In this study, a new prototype study was developed that aims to increase efficiency, especially in the literature review and source finding stages of the research process. The prototype automatically downloads a specified number of academic articles in PDF format from the Google Scholar platform through the keywords entered by users. Then, it extracts summaries of the downloaded articles by offering three different summarization algorithm options: Bertsum, TextRank and LexRank. Through a user-friendly interface, researchers can enter the desired keywords, provide a text for similarity analysis and select the summarization algorithm they prefer. The resulting summaries and similarity scores are presented in an understandable manner in the interface. TF-IDF (Term Frequency-Inverse Document Frequency) and cosine similarity algorithms that measure the importance and similarity of words in the texts to compare the content of the downloaded articles with the text entered by the user has been used. In this way, articles and related sections related to the topics searched by the user can be detected. In addition, in order to evaluate the quality of the summaries produced by the developed prototype study, Bleu, Rouge and Meteor metrics were used, which measure the overlap, precision and semantic integrity of the summaries with the reference texts. As a result of this evaluation, it was seen that the summaries produced by the prototype reached high accuracy values. The prototype uses various preprocessing steps to address the structural differences of PDF files that may have different formats and layouts. In this way, summaries and similarity analyses of articles from different sources can be performed consistently.
Natural Language Processing Similarity Analysis Text Summarization Bertsum LexRank TextRank
| Birincil Dil | Türkçe |
|---|---|
| Konular | Makine Öğrenme (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 20 Ekim 2024 |
| Kabul Tarihi | 12 Şubat 2025 |
| Yayımlanma Tarihi | 16 Haziran 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 8 Sayı: 3 |
* Uluslararası Hakemli Dergi (International Peer Reviewed Journal)
* Yazar/yazarlardan hiçbir şekilde MAKALE BASIM ÜCRETİ vb. şeyler istenmemektedir (Free submission and publication).
* Yılda Ocak, Mart, Haziran, Eylül ve Aralık'ta olmak üzere 5 sayı yayınlanmaktadır (Published 5 times a year)
* Dergide, Türkçe ve İngilizce makaleler basılmaktadır.
*Dergi açık erişimli bir dergidir.
Bu web sitesi Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.