The aim is to investigate the effects of applying the same questions in different languages related to oculofacial plastic and orbital surgery to ChatGPT-3.5, Copilot, and Gemini artificial intelligence chatbots, which are freely accessible, on the performance of these programs. English and Turkish versions of 30 questions related to oculofacial plastic and orbital surgery were applied to ChatGPT-3.5, Copilot, and Gemini chatbots. The answers given by the chatbots were compared with the answer key at the back of the book and grouped as correct and incorrect. Their superiority over each other was compared statistically. While ChatGPT-3.5 answered 43.3% of the English questions correctly, it answered 23.3% of the Turkish questions correctly (p=0.07). While Copilot answered 73.3% of the English questions correctly, it answered 63.3% of the Turkish questions correctly (p=0.375). While Gemini answered 46.7% of the English questions correctly, it answered 33.3% of the Turkish questions correctly (p=0.344). Copilot showed higher performance than other programs in answering Turkish questions (p<0.05). In addition to improving the knowledge level of chatbots, their performance in different languages also needs to be examined and improved. Correcting these disadvantages in chatbots will pave the way for more widespread and reliable use of these programs.
ChatGPT-3.5 Copilot Gemini English and Turkish Oculofacial plastic and orbital surgery
Ücretsiz olarak erişim sağlanabilen ChatGPT-3,5, Copilot ve Gemini yapay zeka sohbet botlarına okülofasiyal plastik ve orbita cerrahisi ile ilişkili farklı dillerdeki aynı soru uygulamalarının bu programların performanslarına olan etkilerini araştırmaktır. Okülofasiyal plastik ve orbita cerrahisi ile ilişkili 30 sorunun İngilizce ve Türkçe versiyonları ChatGPT-3,5, Copilot ve Gemini sohbet botlarına uygulandı. Sohbet botlarının verdikleri cevaplar kitap arkasında yer alan cevap anahtarı ile karşılaştırıldı, doğru ve yanlış olarak gruplandırıldı. Birbirlerine üstünlükleri istatistiksel olarak karşılaştırıldı. ChatGPT-3,5 İngilizce soruların %43,3’üne doğru cevap verirken, Türkçe soruların %23,3’üne doğru cevap verdi (p=0,07). Copilot İngilizce soruların %73,3’üne doğru cevap verirken, Türkçe soruların %63,3’üne doğru cevap verdi (p=0,375). Gemini İngilizce soruların %46,7’sine doğru cevap verirken, Türkçe soruların %33,3’üne doğru cevap verdi (p=0,344). Copilot, Türkçe soruları cevaplamada diğer programlardan daha yüksek performans gösterdi (p<0,05). Sohbet botlarının bilgi düzeylerinin geliştirilmesinin yanında farklı dillerdeki performanslarının da incelenmeye ve geliştirilmeye ihtiyacı vardır. Sohbet botlarındaki bu dezavantajların düzeltilmesi, bu programların daha yaygın ve güvenilir bir şekilde kullanılmasına zemin hazırlayacaktır.
ChatGPT-3.5 Copilot Gemini İngilizce ve Türkçe Okülofasyal plastik ve orbita cerrahisi
Birincil Dil | Türkçe |
---|---|
Konular | Göz Hastalıkları |
Bölüm | ORİJİNAL MAKALELER / ORIGINAL ARTICLES |
Yazarlar | |
Yayımlanma Tarihi | 12 Eylül 2024 |
Gönderilme Tarihi | 22 Temmuz 2024 |
Kabul Tarihi | 3 Eylül 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 46 Sayı: 5 |