Awalnya, ChatGPT bertugas membuat daftar kemungkinan diagnosis, atau diagnosis banding, berdasarkan informasi awal pasien, termasuk usia, jenis kelamin, gejala, dan urgensi kasus.

Selanjutnya, informasi tambahan diberikan, dan ChatGPT diminta untuk membuat keputusan manajemen klinis dan memberikan diagnosis akhir, yang menyimulasikan pertemuan pasien yang sebenarnya.

Panel ahli kemudian menilai kinerja ChatGPT dalam proses buta, memberikan poin untuk tanggapan yang benar dan menggunakan regresi linier untuk menguji hubungan antara kinerja ChatGPT dan informasi demografis dalam sketsa.

Hasilnya mengungkapkan bahwa ChatGPT mencapai akurasi keseluruhan sekitar 72 persen. Khususnya, kinerjanya unggul dalam memberikan diagnosis akhir, dengan tingkat akurasi mencapai 77 persen. Namun, ChatGPT mengalami kesulitan terbesar dalam menghasilkan diagnosis banding, yang hanya akurat 60 persen.

Kinerjanya dalam pengambilan keputusan manajemen klinis, seperti meresepkan obat setelah diagnosis yang benar, mencapai tingkat akurasi sebesar 68 persen. Yang penting, penelitian ini menemukan bahwa respons ChatGPT bebas dari bias gender, dan kinerjanya tetap konsisten baik di layanan primer maupun darurat.

 

Leave a Reply