Microsoft membuat terobosan besar dalam AI perawatan kesehatan dengan asisten Copilot-nya. Raksasa teknologi ini telah bermitra dengan Harvard Medical School untuk memberikan informasi kesehatan tepercaya kepada pengguna, menurut laporan dari The Wall Street Journal.

Pembaruan untuk Copilot, akan segera diluncurkan pada bulan ini, akan memanfaatkan konten dari Harvard Health Publishing untuk menjawab pertanyaan medis.

Langkah ini merupakan bagian dari tujuan perusahaan yang lebih luas untuk membangun model AI-nya sendiri dan tidak terlalu bergantung pada mitranya, OpenAI. Dengan menargetkan sektor layanan kesehatan yang penting, Microsoft berharap dapat membangun merek Copilot dan menempa jalurnya sendiri dalam persaingan AI yang kompetitif. Strategi ini tampaknya merupakan upaya langsung untuk menciptakan ceruk yang mengutamakan kredibilitas.

Dosis Kredibilitas dari Harvard

Kolaborasi dengan Harvard, yang mana Microsoft akan membayar biaya lisensinya, merupakan upaya langsung untuk memecahkan salah satu tantangan terbesar bagi AI konsumen: keandalan.

Dengan mengintegrasikan konten dari cabang Harvard Health Publishing yang terkemuka ke dalam pembaruan Copilot besar yang dijadwalkan pada bulan ini, perusahaan bertujuan untuk membangun landasan kepercayaan dengan pengguna mengenai topik medis sensitif. Sasaran strategisnya adalah untuk memberikan jawaban yang lebih sesuai dengan informasi dari praktisi medis dibandingkan chatbot standar.

Wakil Presiden Kesehatan Microsoft AI, Dominic King, membenarkan hal ini, dengan menyatakan bahwa tujuan perusahaan adalah untuk menyediakan pengguna dengan “memastikan bahwa masyarakat memiliki akses terhadap informasi kesehatan yang kredibel dan dapat dipercaya yang disesuaikan dengan bahasa dan kemampuan baca tulis mereka serta segala hal yang penting.” King mencatat bahwa tujuannya adalah untuk membantu pengguna membuat keputusan yang tepat dalam mengelola kondisi kompleks seperti diabetes.

Fokus tajam pada akurasi ini merupakan respons yang jelas terhadap kekurangan AI untuk tujuan umum dalam konteks medis yang terdokumentasi dengan baik. Sebuah penelitian di Universitas Stanford pada tahun 2024, misalnya, menemukan bahwa dari 382 pertanyaan medis yang diajukan ke ChatGPT, chatbot memberikan jawaban yang “tidak pantas” di sekitar 20% kasus.

Kesenjangan kredibilitas ini tidak terbatas pada chatbot saja; meta-analisis komprehensif dari Universitas Osaka menemukan bahwa meskipun AI generatif mendekati keterampilan diagnostik dokter non-spesialis, AI masih tertinggal jauh dibandingkan manusia yang ahli.

Dengan melisensikan konten tepercaya, Microsoft mencoba membangun alternatif yang lebih aman dan dapat diandalkan. Hal ini merupakan bagian dari upaya yang lebih luas untuk menjadikan Copilot sebagai alat kesehatan praktis, yang juga menyertakan fitur dalam pengembangan untuk membantu pengguna menemukan penyedia layanan kesehatan terdekat berdasarkan kebutuhan dan cakupan asuransi mereka.

Namun, inisiatif ini bukannya tanpa kompleksitas yang signifikan, terutama seputar topik sensitif. Literatur Harvard Health Publishing memuat materi tentang kesehatan mental, namun ketika ditanya, Microsoft menolak menjelaskan secara spesifik bagaimana Copilot yang diperbarui akan menangani pertanyaan semacam itu.

Ini adalah masalah kritis, karena interaksi antara chatbot dan individu yang mengalami krisis kesehatan mental telah menarik pengawasan ketat dari anggota parlemen dan pakar kesehatan, terutama setelah adanya laporan bahwa AI berperan dalam situasi yang berakhir dengan tragedi.

Dorongan Strategis untuk Kemandirian AI

Inisiatif layanan kesehatan yang baru adalah bagian penting dari misi Microsoft yang lebih besar dan lebih mendesak: mencapai kemandirian teknologi dari OpenAI. Perusahaan ini secara aktif melatih model AI miliknya dengan tujuan jangka panjang untuk menggantikan beban kerja yang saat ini ditangani oleh OpenAI, menurut orang-orang yang mengetahui masalah tersebut.

Upaya ini didorong oleh Mustafa Suleyman, CEO divisi AI konsumen Microsoft. Timnya berfokus pada pengembangan model buatan Microsoft.

Pada bulan Agustus, perusahaan tersebut mulai menguji secara publik salah satu model tersebut untuk Copilot. Pola diversifikasi ini sudah terlihat, dengan Microsoft menggunakan model dari pesaing OpenAI, Anthropic, untuk beberapa dari 365 produknya.

Dorongan untuk kemandirian terus berlanjut meskipun ada perjanjian tentatif pada bulan September untuk memperpanjang kemitraan dengan OpenAI.

Microsoft telah secara terbuka menyatakan bahwa “OpenAI’akan terus menjadi mitra kami dalam model terdepan’dan filosofinya adalah menggunakan model terbaik yang ada,”namun tindakan internalnya menandakan keinginan yang jelas untuk mengendalikan nasib AI-nya sendiri. CEO Satya Nadella baru-baru ini mendelegasikan tugas lain untuk fokus pada taruhan AI utama.

Menavigasi Perlombaan AI Medis dengan Taruhan Tinggi

Fokus Microsoft pada layanan kesehatan menempatkannya dalam arena yang sangat kompetitif dan sering kali heboh. Perusahaan ini bukanlah orang baru yang berani membuat klaim dalam bidang ini.

Pada bulan Juni, perusahaan ini meluncurkan sistem MAI-DxO, sebuah AI yang dirancang untuk menangani kasus medis yang kompleks. Menurut Microsoft, sistem ini dievaluasi berdasarkan standar baru yang ketat menggunakan studi kasus yang menantang dari New England Journal of Medicine.

Hasilnya sangat mengejutkan: MAI-DxO menyelesaikan 85,5% kasus dengan tepat, sementara panel yang terdiri dari 21 dokter praktik mencapai akurasi rata-rata hanya 20%.

Hal ini mendorong CEO Microsoft AI Mustafa Suleyman untuk mengklaim, “Microsoft telah mengambil’sebuah solusi yang baik’. langkah nyata menuju superintelligence medis.'”Perusahaan ini menyatakan bahwa alatnya dapat mendiagnosis penyakit dengan akurasi empat kali lipat dari dokter.

Namun, bidang AI medis yang lebih luas penuh dengan janji dan rintangan yang signifikan, sehingga klaim tersebut memerlukan kehati-hatian. Meta-analisis dari Universitas Osaka pada bulan Maret 2025, yang diterbitkan di Nature, menawarkan perspektif yang lebih terukur.

Setelah meninjau 83 penelitian berbeda, ditemukan bahwa meskipun AI generatif mengalami peningkatan, kinerjanya masih jauh dari sempurna. Hirotaka Takita, peneliti utama, menyatakan “bahwa kemampuan diagnostik AI generatif sebanding dengan dokter non-spesialis,” dan menambahkan bahwa AI masih tertinggal jauh di belakang spesialis manusia dengan selisih 15,8%.

Studi ini juga menimbulkan tanda bahaya mengenai kondisi penelitian di lapangan, dan menemukan bahwa 76% makalah yang dianalisis memiliki risiko bias yang tinggi, sering kali disebabkan oleh pelatihan yang tidak jelas. data.

Kesenjangan antara kinerja benchmark dan praktik klinis di dunia nyata adalah tema yang berulang. Bidang radiologi berfungsi sebagai studi kasus yang kuat. Pada tahun 2016,

Pelopor AI Geoffrey Hinton dengan terkenal menyatakan bahwa “orang-orang harus berhenti melatih ahli radiologi sekarang.”Namun, hampir satu dekade kemudian, permintaan akan ahli radiologi manusia meningkat pesat, dengan rekor posisi residensi dan gaji yang melonjak.

Paradoks ini mengungkap kompleksitas besar dalam regulasi, tanggung jawab, dan integrasi alur kerja yang tidak dapat diselesaikan hanya dengan algoritma. Perusahaan asuransi semakin banyak memasukkan klausul ‘Pengecualian AI Absolut’ ke dalam kebijakan malpraktik, sehingga memaksa rumah sakit untuk tetap memberikan tanggung jawab hukum kepada dokter berlisensi atas diagnosis apa pun dan memastikan manusia tetap mengikuti perkembangannya.

Perlombaan untuk AI medis juga diperjuangkan di berbagai bidang selain diagnostik. Peneliti Eropa, misalnya, telah mengembangkan Delphi-2M, sebuah AI yang dapat memperkirakan risiko lebih dari 1.000 penyakit beberapa dekade ke depan dengan menganalisis catatan kesehatan.

Sementara itu, di Universitas Johns Hopkins, sistem SRT-H telah menunjukkan potensi AI dalam intervensi langsung, yang secara mandiri melakukan langkah-langkah bedah kompleks pada robot da Vinci standar dalam uji laboratorium.

Pendekatan yang bervariasi ini menggarisbawahi ambisi besar di seluruh sektor ini, dimana tantangannya bukan hanya pada menciptakan algoritma yang akurat, namun juga algoritma yang aman, andal, dan cukup praktis untuk diadopsi secara klinis.

Tantangan Kepercayaan dan Akurasi yang Belum Terselesaikan

Di luar tolok ukur kinerja, hambatan terbesar bagi AI dalam bidang kedokteran adalah kepercayaan. Penggunaan kumpulan data pasien yang sangat besar untuk melatih model menimbulkan pertanyaan privasi yang mendalam. Kontroversi baru-baru ini mengenai AI’Foresight’di Inggris, yang dilatih pada 57 juta catatan NHS, menyoroti kekhawatiran publik terhadap keamanan data.

Copilot Microsoft juga menghadapi peningkatan tajam dalam adopsi pengguna. Aplikasi ini telah diunduh 95 juta kali, sebagian kecil dari lebih dari satu miliar unduhan ChatGPT, menurut data Sensor Tower. Membangun reputasi akurasi di bidang sensitif seperti layanan kesehatan dapat menjadi pembeda utama.

Pada akhirnya, kesuksesan Microsoft tidak hanya bergantung pada teknologinya, namun juga pada kemampuannya untuk meyakinkan pengguna bahwa AI-nya adalah sumber yang dapat diandalkan untuk menjawab pertanyaan-pertanyaan terpenting mereka. Kemitraan Harvard adalah langkah yang jelas dan strategis untuk membangun kepercayaan penting tersebut.

Categories: IT Info