Model AI generatif menutup kesenjangan dengan dokter non-spesialis ketika datang ke diagnosis medis, tetapi mereka tetap jauh lebih akurat daripada pakar manusia, menurut analisis skala besar dari . Penelitian ini, yang dipimpin oleh Dr. Hirotaka Takita dan Associate Professor Daiju Ueda, secara sistematis meninjau 83 studi untuk membandingkan kinerja AI dengan dokter, mengungkapkan akurasi diagnostik AI rata-rata 52,1%.
Diterbitkan dalam Nature Pada 22 Maret, meta-analisis menyaring lebih dari 18.000 makalah yang diterbitkan sejak Juni 2018. Ini mengevaluasi berbagai AI, termasuk model yang dipelajari seperti GPT-4 dan juga secara wasib yang disebutkan secara statis. Mirip dengan dokter non-ahli, dengan hanya perbedaan 0,6% yang mendukung manusia. Namun, spesialis medis mempertahankan tepi yang jelas, mengungguli model AI dengan margin 15,8% dalam akurasi.
Model AI menunjukkan keberhasilan variabel di berbagai disiplin medis. Mereka menunjukkan kekuatan khusus dalam dermatologi, bidang di mana pengenalan pola visual-keahlian AI saat ini-memainkan peran besar. Namun, para peneliti memperingatkan bahwa dermatologi juga menuntut penalaran yang kompleks di luar pencocokan visual.
Sebaliknya, temuan yang menyarankan kecakapan AI dalam urologi dimatikan oleh fakta bahwa mereka berasal terutama dari satu studi besar, membatasi seberapa luas hasil tersebut dapat diterapkan. Secara umum, analisis menunjukkan bahwa AI cenderung goyah ketika berhadapan dengan kasus-kasus kompleks yang memerlukan menafsirkan informasi pasien yang luas dan terperinci, suatu area di mana spesialis sering unggul melalui pengalaman dan bernuansa penalaran klinis.
AI sebagai asisten, bukan penggantian
Osaka Metropolitan University, in an April 18, 2025 statement, quoted Dr. Takita on the possibilities: “This research shows that generative AI’s diagnostic capabilities are comparable to non-specialist doctors. It could be used in medical education to support non-specialist doctors and assist in diagnostics in areas with limited medical resources.”
This suggests a future where AI acts more as a supplementary tool, perhaps Menambah kemampuan manusia daripada menggantikannya, pandangan yang bergema dalam diskusi yang lebih luas tentang AI dalam kedokteran di mana kinerja manusia-AI sering melebihi baik saja.
rintangan persisten: bias dan transparansi
Antusiasme untuk potensi AI yang diungkapkan dengan tantangan yang dikerahkan. Masalah utama yang diidentifikasi adalah kurangnya transparansi mengenai data pelatihan yang digunakan untuk banyak model AI komersial. Opacity ini membuatnya sulit untuk menilai bias potensial atau menentukan apakah kinerja model dapat digeneralisasi di berbagai populasi pasien.
Para peneliti mencatat bahwa transparansi sangat penting untuk memahami pengetahuan dan keterbatasan model. Penilaian Kualitas Menggunakan Alat ProBAST Dinilai 76% dari studi yang dimasukkan sebagai memiliki risiko bias yang tinggi, sering kali berasal dari evaluasi menggunakan set data uji kecil atau detail yang tidak memadai tentang data pelatihan AI yang mempengaruhi penilaian validasi eksternal. Forward for Medical AI
Studi Osaka tiba ketika upaya untuk membangun AI medis khusus berlanjut, dicontohkan oleh alat-alat seperti bioptimus model patologi H-optimus-0 yang dirilis pada Juli 2024. Pencapaian meta-analisis yang diperlukan. Menekankan persyaratan yang sedang berlangsung untuk validasi melalui skenario klinis yang lebih rumit dan proses AI yang lebih jelas: “Penelitian lebih lanjut, seperti evaluasi dalam skenario klinis yang lebih kompleks, evaluasi kinerja menggunakan catatan medis aktual, meningkatkan transparansi pengambilan keputusan AI, dan verifikasi dalam berbagai kelompok pasien, diperlukan untuk memverifikasi kapabilitas AI.