ABD’deki California San Diego Üniversitesi tarafından yapılan bir araştırma, tabiplerden ve ChatGPT’den gelen yazılı cevapları gerçek dünyadaki sıhhat sorgularıyla karşılaştırdı.
Daily Mail’in haberine nazaran, sıhhat uzmanlarından oluşan bir heyet, ChatGPT’nin cevaplarını yüzde 79 oranında daha fazla tercih etti ve sağlanan bilgiler ve daha fazla anlayış göstermesi açısından bunları “daha kaliteli” olarak derecelendirdi. Heyet kimin yapay zeka kimin gerçek hekim olduğunu bilmiyordu.
CHATGPT’NİN KARŞILIKLARI DAHA UZUNDU
California San Diego Üniversitesi’nden araştırma grubu, yaklaşık 452.000 üyenin tıbbi problemleri bildirdiği ve doğrulanmış sıhhat uzmanlarının teklifler sunduğu Reddit’in AskDocs forumunu inceledi.
Forumda bir soruyu herkes yanıtlayabilir, lakin moderatörler sıhhat uzmanının kimlik bilgilerini denetim eder ve yanıtlayanın uzmanlık seviyesini gösterir. Sosyal medyadaki soru-cevap alışverişi, bir hastanın bir hekimle klâsik konuşma hali olmasa da, heyet, konuşmaların klinik tecrübelerini yansıttığını söyledi.
UC San Diego araştırma takımı, AskDocs’tan, doğrulanmış bir hekimin yanıtladığı bir soru-cevabı rastgele seçti. Ekip, özgün soruyu ChatGPT’ye de sordu ve ondan bir karşılık yazmasını istedi.
Üç hekimden oluşan heyet, her bilgiyi inceledi lakin hangisinin hekim hangisinin yapay zeka tarafından yazıldığı konusunda emin olamadı. Sonrasında ise yapay zekanın yazdığı karşılığın daha düzgün, uzun ve empatik olduğunu belirledi.
İngiltere’deki Bath Üniversitesi’nden Profesör James Davenport, “Hem burada hem de tüm veritabanında, ChatGPT cevapları ortalama olarak doktorlarınkinden dört kat daha uzundu.” dedi.
Çalışma, ChatGPT’nin hekimlerin yerini alabileceğini argüman etmese de, yapay zekanın doktorlara cevap oluşturmada yardımcı olup olmayacağı yahut nasıl yardımcı olabileceği konusunda daha fazla araştırma yapılmasını istiyor.
Kaynak: Sözcü