Amaç: Yapay zeka sohbet botları, gıda sınıflandırma görevlerinde umut vaat etmiştir; ancak oksalat gibi belirli besin içeriklerine göre gıdaları sınıflandırmadaki doğrulukları, Türkçe dilinde yeterince değerlendirilmemiştir. Bu çalışma, üç yapay zeka sohbet botunun—ChatGPT 4.0, Gemini ve Microsoft Copilot—oksalat içeriğine göre gıdaları sınıflandırma performansını değerlendirmektedir.
Gereç ve Yöntem: Yaygın tüketilen Türk gıdalarını içeren 63 farklı gıda maddesinden oluşan bir veri seti, beş oksalat kategorisinde (çok az veya yok, düşük, orta, yüksek ve çok yüksek) sohbet botlarının doğruluğunu değerlendirmek için kullanılmıştır. Her modelin performansı analiz edilmiş ve yaygın doğru ve yanlış sınıflandırmalar belirlenmiştir.
Bulgular: ChatGPT 4.0, genel doğruluk açısından en yüksek performansı (%69,8) sergileyerek Gemini (%36,5) ve Microsoft Copilot'un (%26,9) önüne geçmiştir. Ispanak ve kakao gibi gıdalar tutarlı bir şekilde doğru sınıflandırılırken, havuç ve ceviz gibi gıdalar genellikle yanlış sınıflandırılmıştır. Cochran’s Q testi kullanılarak yapılan istatistiksel analiz, sohbet botları arasındaki doğruluk farklılıklarının anlamlı olduğunu göstermiştir (p <0,05).
Sonuç: Bu çalışma, özellikle hiperoksalüri veya böbrek taşı gibi durumları olan hastalar için düşük oksalat diyeti önerilen durumlarda, diyet yönetiminde yapay zeka araçlarının potansiyelini vurgulamaktadır. Ancak, bölgesel farklılıklar veya karmaşık bileşimlere sahip gıdaların sınıflandırılmasında doğruluğun artırılması gerektiğini vurgulamaktadır.
Aim: AI chatbots have shown promise in food classification tasks, but their accuracy in categorising foods based on specific nutritional content, such as oxalates, has not been thoroughly evaluated in the Turkish language. This study assesses the performance of three AI chatbots—ChatGPT 4.0, Gemini, and Microsoft Copilot—in classifying foods according to their oxalate content.
Materials and Methods: A dataset of 63 diverse food items, including commonly consumed Turkish foods, was used to evaluate the chatbots’ accuracy across five oxalate categories: little or none, low, moderate, high, and very high. The performance of each model was analysed, and commonly correct and incorrect classifications were identified.
Results: ChatGPT 4.0 demonstrated the highest overall accuracy (69.8%), significantly outperforming Gemini (36.5%) and Microsoft Copilot (26.9%). Foods such as spinach and cocoa were consistently classified correctly, while foods like carrot and walnut were commonly misclassified. Statistical analysis using Cochran’s Q test revealed significant differences in accuracy among the chatbots (p-value <0.05).
Conclusion: This study highlights the potential of AI chatbots in dietary management, particularly in supporting clinicians who recommend low oxalate diets for patients with conditions such as hyperoxaluria or kidney disease stones. However, it emphasises the need for further refinement to improve accuracy, especially in classifying foods with regional variations or complex compositions commonly encountered in clinical settings.
Artificial Intelligence Hyperoxaluria Kidney Stones Renal Diet Oxalate
Birincil Dil | İngilizce |
---|---|
Konular | Dahili Hastalıklar Hemşireliği |
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 31 Ocak 2025 |
Gönderilme Tarihi | 12 Aralık 2024 |
Kabul Tarihi | 21 Aralık 2024 |
Yayımlandığı Sayı | Yıl 2025 |
Nefroloji Hemşireliği Dergisi/ Journal of Nephrology Nursing Creative Commons Atıf-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.