Amaç: Yapay zekâ, bilgisayar sistemlerinin insan benzeri zeka işlevlerini taklit etmesini amaçlayan disiplinler arası bir çalışma alanıdır. Büyük dil modelleri (Large Language Model, LLM), yapay zekâ uygulamalarının daha kısa sürede geliştirilmesine katkıda bulunarak özellikle tıp alanında yeni yazılımların ortaya çıkmasına zemin hazırlamaktadır. Bu çalışmanın amacı, erken bebeklik döneminde aile ve ebeveyn bilgilendirmesi bağlamında güncel büyük dil modellerinin ürettiği içeriklerini değerlendirmektir.
Metod: Yaygın olarak kullanılan üç özel LLM'ye (GPT-5 [Generative Pre-trained Transformer 5], Claude 4, Gemini 2.5), erken bebeklik dönemiyle ilgili üç klinik vaka senaryosu sunulmuştur. Üretilen çıktılar, uzman fizyoterapistler tarafından klinik doğruluk, uygulanabilirlik, güvenlik farkındalığı, ilgililik ve tamlık açısından Likert ölçeği (1= Çok yetersiz, 2= Yetersiz, 3= Orta, 4= İyi, 5= Mükemmel) kullanılarak değerlendirilmiştir. Ortalama puanlar kaydedilmiştir.
Bulgular: İlk vaka için klinik doğrulukta en yüksek puanı GPT-5, uygulanabilirlik ve güvenlik farkındalığında en yüksek puanı Claude 4, ilgililik ve tamlıkta en yüksek puanı Gemini 2.5 almıştır. İkinci vaka için tüm kategorilerde ve toplam puanda en yüksek puanı GPT-5 almıştır. Üçüncü vaka için tüm kategorilerde ve toplam puanda en yüksek puanı Claude 4 almıştır.
Sonuç: Genel olarak, büyük dil modellerinin aile-ebeveyn bilgilendirmesi ve eğitimi için kullanılabilir olduğu, ancak tek bir modelin tüm senaryolarda üstünlük sağlamadığı belirlenmiştir. Bu durum, klinik bağlamda kullanılacak yapay zekâ tabanlı içeriklerin model çeşitliliği ile değerlendirilmesi ve mutlaka uzman denetimiyle desteklenmesi gerektiğini göstermektedir.
Purpose: Artificial intelligence (AI) is an interdisciplinary field that aims to simulate human-like cognitive functions through computer systems. Large language models (LLMs) contribute to the rapid development of AI applications and pave the way for the emergence of new software solutions, particularly in medicine. The aim of this study was to evaluate the content produced by current LLMs in the context of parent and family education during early infancy.
Methods: Three widely used proprietary LLMs (GPT-5 [Generative Pre-trained Transformer 5], Claude 4, Gemini 2.5) were prompted with three clinical case scenarios related to early infancy. The generated outputs were evaluated by expert physiotherapists in terms of accuracy, applicability, safety awareness, relevance, and completeness, using a Likert scale (1 = Very poor, 2 = Poor, 3 = Fair, 4 = Good, 5 = Excellent). Mean scores were recorded.
Results: For the first case, GPT-5 received the highest score for clinical accuracy, Claude 4 for applicability and safety awareness, and Gemini 2.5 for relevance and completeness. For the second case, GPT-5 achieved the highest scores across all categories and the overall total. For the third case, Claude 4 obtained the highest scores in all categories as well as the total.
Conclusion: Overall, LLMs appear to be usable for parent and family education; however, no single model demonstrated superiority across all scenarios. These findings suggest that AI-based educational content in clinical contexts should be evaluated through the lens of model diversity and always supported by expert supervision.
Parent education early intervention pediatrics artificial intelligence
| Birincil Dil | Türkçe |
|---|---|
| Konular | Fizyoterapi |
| Bölüm | Kısa Bildiri |
| Yazarlar | |
| Gönderilme Tarihi | 1 Ağustos 2025 |
| Kabul Tarihi | 1 Ekim 2025 |
| Yayımlanma Tarihi | 26 Şubat 2026 |
| IZ | https://izlik.org/JA96LM34LJ |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 11 Sayı: Özel sayı: II: Uluslararası Erken Müdahale ve Rehabilitasyon Kongresi (ICER 2025) |