Radyoloji raporları, ham anlatı biçiminde sunulduğunda hekimleri zorlayabilecek klinik açıdan kritik ancak karmaşık bilgiler içerir. Bu sorunu çözmek için, bu çalışma FAISS tabanlı bir semantik arama motorunu küçük bir T5 üretici modelle entegre ederek tıbbi rapor özetleme için Retrieval-Augmented Generation (RAG) yaklaşımını önermektedir. Bu metodoloji, Sentence-BERT'i kullanarak MIMIC-III veri setinden radyoloji raporlarının “Bulgular” bölümünü gömmektedir. Bu bölümler daha sonra FAISS kullanılarak indekslenerek semantik olarak benzer vakalar geri getirilmektedir. Bu yaklaşımda, geri getirilen bağlam orijinal ‘Bulgular’ bölümüyle birleştirilmekte ve ardından T5 modeline beslenerek ilgili “İzlenim” özeti üretilmektedir.
Deney sonuçları, modelin hem sözcüksel doğruluk hem de semantik tutarlılık açısından etkinliğini göstermektedir. Model, ROUGE-1'de 0,5299, ROUGE-2'de 0,4206, METEOR'da 0,5018 ve sıkıştırma oranında 0,9213 değerlerine ulaşmıştır. Alanına özgü anlamsal eşleştirme, FactCC (0,5463), CheXpert Label Agreement (0,6194) ve Medical Concept Overlap (0,5552) puanları kullanılarak doğrulanmıştır. Model, sürekli azalan doğrulama kaybı ile kanıtlandığı üzere, aşırı uyum olmadan yedi dönem boyunca istikrarlı bir yakınsama göstermiştir.
Niteliksel örnekler, modelin düzgün ve klinik olarak tutarlı özetler ürettiğini göstermektedir, ancak ara sıra görülen gerçek dışı halüsinasyonlar iyileştirilmesi gereken alanları göstermektedir. Genel olarak, önerilen FAISS+T5 süreci, bağlamsal geri alma ve üretimi entegre ederek geleneksel özetleme yöntemlerinin temel sınırlamalarını ele almaktadır. Bu çerçeve, klinik metinleri özetlemek için ölçeklenebilir, yorumlanabilir ve alana özgü bir çözüm sunar ve gerçek dünyadaki karar destek sistemlerinde uygulanması için umut vaat etmektedir.
Tıbbi Rapor Özetleme Getirmeli Destekli Üretim (RAG) FAISS Tabanlı Anlamsal Arama T5 Dönüştürücü Modeli Klinik Doğal Dil İşleme Radyoloji Raporu Analizi
Radiology reports contain clinically critical yet complex information that can overwhelm physicians when available in a raw narrative form. To address this challenge, this study proposes a Retrieval-Augmented Generation (RAG) approach to medical report summarization by integrating a FAISS-based semantic search engine with a small T5 generative model. The methodology uses Sentence-BERT to embed the “Findings” section of radiology reports from the MIMIC-III dataset, which are then indexed using FAISS to retrieve semantically similar cases. In this approach, The retrieved context has been merged with the original 'Finding' section and subsequently fed into the T5 model to produce the respective 'Impression' summary.
Experimental results demonstrate the model’s effectiveness in terms of both lexical fidelity and semantic consistency, achieving ROUGE-1 of 0.5299, ROUGE-2 of 0.4206, METEOR of 0.5018, and compression ratio of 0.9213. Domain-specific semantic matching was validated using FactCC (0.5463), CheXpert Label Agreement (0.6194), and Medical Concept Overlap (0.5552) scores. The model demonstrated stable convergence over seven epochs without overfitting, as evidenced by the steadily decreasing validation loss.
Qualitative examples show that the model generates smooth and clinically consistent summaries, although occasional factual hallucinations indicate areas for improvement. Overall, the proposed FAISS+T5 process addresses key limitations of traditional summarization methods by integrating contextual retrieval and generation. This framework offers a scalable, interpretable, and domain-specific solution for summarizing clinical texts and shows promise for implementation in real-world decision support systems.
Medical Report Summarization Retrieval-Augmented Generation (RAG) FAISS Semantic Search T5 Transformer Model Clinical NLP Radiology Report Analysis
Primary Language | English |
---|---|
Subjects | Deep Learning, Machine Learning (Other) |
Journal Section | Articles |
Authors | |
Publication Date | August 25, 2025 |
Submission Date | July 10, 2025 |
Acceptance Date | August 22, 2025 |
Published in Issue | Year 2025 Volume: 29 Issue: 2 |
e-ISSN :1308-6529
Linking ISSN (ISSN-L): 1300-7688
All published articles in the journal can be accessed free of charge and are open access under the Creative Commons CC BY-NC (Attribution-NonCommercial) license. All authors and other journal users are deemed to have accepted this situation. Click here to access detailed information about the CC BY-NC license.