Research Article

Yapay Zeka Modelleri ile Acil Beyin BT Patolojilerinin Saptanması: ChatGPT, Grok ve DeepSeek Karşılaştırması

Volume: 5 Number: 3 December 30, 2025
TR EN

Yapay Zeka Modelleri ile Acil Beyin BT Patolojilerinin Saptanması: ChatGPT, Grok ve DeepSeek Karşılaştırması

Öz

Amaç: Bu çalışmanın amacı, acil beyin BT raporlarında sık rastlanan patolojilerin tespiti açısından üç farklı yapay zeka dil modelinin (ChatGPT, Grok ve DeepSeek) doğruluğunu karşılaştırmaktır. Gereç ve Yöntem: Bu retrospektif çalışmada, İzmir Şehir Hastanesi acil servisinde 2023–2024 yılları arasında çekilmiş 18 yaş üstü 2000 hastaya ait beyin BT raporları kullanıldı. Radyoloji raporları, iki deneyimli radyolog tarafından LabelStudio platformunda beş ana patoloji açısından “var/yok” şeklinde etiketlendi: intraserebral hematom, subaraknoid kanama, subdural hematom, iskemik inme (akut/subakut), kitle etkisine bağlı herniasyon. Etiketleme sırasında doğrudan tanı ifadesi bulunmasa bile yorumdan tanı çıkarımı yapıldı. Üç farklı büyük dil modeli, aynı raporları tarayarak her patoloji için “var/yok” kararı üretti. Bulgular altın standart olan radyolog etiketleriyle karşılaştırılarak F1 skorları hesaplandı. Bulgular: DeepSeek modeli tüm patolojilerde en yüksek F1 skoruna (0.89–0.95) ulaşırken, ChatGPT ikinci sırada yer aldı (0.88–0.93). Grok modeli genel olarak daha düşük performans gösterdi (0.83–0.90). En yüksek F1 skorları intraserebral hematom ve kitle etkisine bağlı herniasyon için DeepSeek’te gözlendi. Sonuç: Yapay zeka dil modelleri, beyin BT raporlarında acil patolojilerin otomatik tespitinde yüksek doğrulukla çalışabilir. Özellikle DeepSeek ve ChatGPT, hastane bilgi sistemlerine entegre edilerek kritik bulgular konusunda klinisyenleri zamanında uyarabilecek yardımcı araçlar olabilir.

Anahtar Kelimeler

References

  1. 1. Maxwell S, Ha NT, Bulsara MK, Doust J, Mcrobbie D, O’Leary P, et al. Increasing use of CT requested by emergency department physicians in tertiary hospitals in Western Australia 2003–2015: an analysis of linked administrative data. BMJ Open. 2021 Mar 4;11(3):e043315.
  2. 2. Kidwell CS, Chalela JA, Saver JL, Elkhedrawy YA, Starkman S, Hillis AE, et al. Comparison of MRI and CT for detection of acute intracerebral hemorrhage. JAMA. 2004 Jul 7;291(3):375–382. doi:10.1001/jama.291.3.375
  3. 3. Greenberg SM, Di Tullio MR, Winshi P, et al.; AHA/ASA Guideline Development Group. 2022 guideline for the management of patients with spontaneous intracerebral hemorrhage: a guideline from the American Heart Association/American Stroke Association. Stroke. 2022 May 1;53(7):e1–e52. doi:10.1161/STR.0000000000000407
  4. 4. Lee CS, Nagy PG, Weaver SJ, Newman-Torres M, Kim S, Brink JA. Cognitive and system factors contributing to diagnostic errors in radiology. AJR Am J Roentgenol. 2013 Mar;200(3):535–542. doi:10.2214/AJR.12.10375
  5. 5. Salbas A, Buyuktoka RE. Performance of Large Language Models in Recognizing Brain MRI Sequences: A Comparative Analysis of ChatGPT-4o, Claude 4 Opus, and Gemini 2.5 Pro. Diagnostics. 2025;15(15):1919. doi:10.3390/diagnostics15151919
  6. 6. Elkassem AA, Corral JE, Rubin DL, Muzikansky A, Aydin U. Potential use cases for ChatGPT in radiology reporting. AJR Am J Roentgenol. 2024 Jan 1;222(1):13–19. doi:10.2214/AJR.23.29198
  7. 7. Nakamura Y, Prakash P, Harada S, et al. Automatic detection of actionable radiology reports using NLP. BMC Med Inform Decis Mak. 2021 Jun 3;21(1):146. doi:10.1186/s12911-021-01623-6
  8. 8. Titano JJ, Badgeley M, Schefflein J, et al. Automated deep-neural-network surveillance of cranial images for acute neurologic events. Nat Med. 2018;24(9):1337-1341. doi:10.1038/s41591-018-0147-y

Details

Primary Language

Turkish

Subjects

Natural Language Processing , Radiology and Organ Imaging

Journal Section

Research Article

Publication Date

December 30, 2025

Submission Date

August 5, 2025

Acceptance Date

December 5, 2025

Published in Issue

Year 2025 Volume: 5 Number: 3

Vancouver
1.Hamza Eren Güzel, Cemre Ozenbas. Yapay Zeka Modelleri ile Acil Beyin BT Patolojilerinin Saptanması: ChatGPT, Grok ve DeepSeek Karşılaştırması. JAIHS. 2025 Dec. 1;5(3):14-9. doi:10.52309/jaihs.1758538