Microsoft đang thực hiện một bước tiến lớn vào lĩnh vực AI chăm sóc sức khỏe với trợ lý Copilot. Gã khổng lồ công nghệ đã hợp tác với Trường Y Harvard để cung cấp cho người dùng thông tin sức khỏe đáng tin cậy, theo một báo cáo từ The Wall Street Journal.

Bản cập nhật cho Copilot sẽ sớm ra mắt trong tháng này, sẽ dựa trên nội dung từ Nhà xuất bản Y tế Harvard để trả lời các câu hỏi y tế.

Động thái này là một phần trong mục tiêu rộng lớn hơn của công ty là xây dựng các mô hình AI của riêng mình và ít phụ thuộc hơn vào đối tác của mình, OpenAI. Bằng cách nhắm mục tiêu vào lĩnh vực chăm sóc sức khỏe quan trọng, Microsoft hy vọng sẽ xây dựng thương hiệu của Copilot và tạo dựng con đường riêng của mình trong cuộc đua AI đầy cạnh tranh. Chiến lược này dường như là một nỗ lực trực tiếp nhằm tạo ra một thị trường ngách trong đó uy tín là điều tối quan trọng.

Lượng uy tín từ Harvard

The hợp tác với Harvard, mà Microsoft sẽ trả phí cấp phép, là một nỗ lực trực tiếp nhằm giải quyết một trong những thách thức lớn nhất đối với AI của người tiêu dùng: độ tin cậy.

Bằng cách tích hợp nội dung từ chi nhánh Nhà xuất bản Y tế Harvard quý giá vào bản cập nhật Copilot lớn dự kiến trong tháng này, công ty đặt mục tiêu xây dựng nền tảng niềm tin với người dùng về các chủ đề y tế nhạy cảm. Mục tiêu chiến lược là cung cấp câu trả lời phù hợp với thông tin từ bác sĩ hơn là một chatbot tiêu chuẩn.

Phó Chủ tịch Y tế của Microsoft AI, Dominic King, đã xác nhận điều này, đồng thời cho biết mục tiêu của công ty là cung cấp cho người dùng “đảm bảo rằng mọi người có quyền truy cập vào thông tin sức khỏe đáng tin cậy, đáng tin cậy được điều chỉnh phù hợp với ngôn ngữ và trình độ hiểu biết của họ cũng như tất cả những thứ cần thiết”. King lưu ý mục đích là giúp người dùng đưa ra quyết định sáng suốt về việc quản lý các tình trạng phức tạp như bệnh tiểu đường.

Sự tập trung sâu sắc vào độ chính xác này là phản hồi rõ ràng đối với những thiếu sót đã được ghi chép rõ ràng của AI đa năng trong bối cảnh y tế. Ví dụ: một nghiên cứu của Đại học Stanford năm 2024 đã phát hiện ra rằng trong số 382 câu hỏi y tế được đặt ra cho ChatGPT, chatbot đã đưa ra câu trả lời “không phù hợp” trong khoảng 20% ​​trường hợp.

Khoảng cách về độ tin cậy này không chỉ giới hạn ở chatbot; một phân tích tổng hợp toàn diện của Đại học Osaka cho thấy rằng mặc dù AI tổng hợp đang tiếp cận kỹ năng chẩn đoán của các bác sĩ không chuyên, nhưng nó vẫn tụt hậu đáng kể so với các chuyên gia về con người.

Bằng cách cấp phép cho nội dung đáng tin cậy, Microsoft đang cố gắng xây dựng một giải pháp thay thế an toàn hơn, đáng tin cậy hơn. Đây là một phần trong nỗ lực rộng lớn hơn nhằm biến Copilot trở thành một công cụ y tế thiết thực, đồng thời bao gồm một tính năng đang được phát triển nhằm giúp người dùng tìm các nhà cung cấp dịch vụ chăm sóc sức khỏe lân cận dựa trên nhu cầu và phạm vi bảo hiểm của họ.

Tuy nhiên, sáng kiến ​​này không phải là không có sự phức tạp đáng kể, đặc biệt là liên quan đến các chủ đề nhạy cảm. Tài liệu của Nhà xuất bản Y tế Harvard bao gồm tài liệu về sức khỏe tâm thần, nhưng khi được hỏi, Microsoft đã từ chối nêu rõ cách Copilot cập nhật sẽ xử lý các truy vấn như vậy.

Đây là một vấn đề nghiêm trọng vì sự tương tác giữa chatbot và các cá nhân gặp khủng hoảng về sức khỏe tâm thần đã thu hút sự giám sát chặt chẽ từ các nhà lập pháp và chuyên gia y tế, đặc biệt là sau các báo cáo về vai trò của AI trong các tình huống kết thúc bằng bi kịch.

Thúc đẩy chiến lược cho sự độc lập về AI

Sáng kiến chăm sóc sức khỏe mới là một phần quan trọng trong sứ mệnh lớn hơn, cấp bách hơn của Microsoft: đạt được sự độc lập về công nghệ khỏi OpenAI. Theo những người quen thuộc với vấn đề này, công ty đang tích cực đào tạo các mô hình AI của riêng mình với mục tiêu dài hạn là thay thế khối lượng công việc hiện đang được OpenAI xử lý.

Nỗ lực này được thúc đẩy bởi Mustafa Suleyman, Giám đốc điều hành bộ phận AI tiêu dùng của Microsoft. Nhóm của ông tập trung vào việc thúc đẩy các mô hình cây nhà lá vườn của Microsoft.

Vào tháng 8, công ty đã bắt đầu thử nghiệm công khai một mô hình như vậy cho Copilot. Mô hình đa dạng hóa này đã được thể hiện rõ, với việc Microsoft sử dụng các mô hình từ đối thủ Anthropic của OpenAI cho một số trong số 365 sản phẩm của mình.

Việc thúc đẩy khả năng tự lực vẫn tiếp tục bất chấp thỏa thuận dự kiến ​​vào tháng 9 nhằm mở rộng quan hệ đối tác với OpenAI.

Microsoft đã công khai tuyên bố rằng “OpenAI ‘sẽ tiếp tục là đối tác của chúng tôi trên các mô hình tiên phong’ và triết lý của họ là sử dụng những mô hình tốt nhất hiện có”, nhưng hành động nội bộ của họ báo hiệu mong muốn rõ ràng là kiểm soát vận mệnh AI của chính mình. Giám đốc điều hành Satya Nadella gần đây đã giao các nhiệm vụ khác để tập trung vào các hoạt động đặt cược quan trọng vào AI.

Điều hướng Cuộc đua AI y tế có tính rủi ro cao

Việc Microsoft tập trung vào chăm sóc sức khỏe sẽ đặt Microsoft vào một đấu trường cạnh tranh khốc liệt và thường được thổi phồng. Công ty không phải là người mới đưa ra những tuyên bố táo bạo trong lĩnh vực này.

Vào tháng 6, công ty đã công bố hệ thống MAI-DxO, một AI được thiết kế để giải quyết các trường hợp y tế phức tạp. Theo Microsoft, hệ thống này đã được đánh giá theo một tiêu chuẩn mới nghiêm ngặt bằng cách sử dụng các nghiên cứu điển hình đầy thách thức từ Tạp chí Y học New England.

Kết quả thật đáng kinh ngạc: MAI-DxO đã giải quyết chính xác 85,5% các trường hợp, trong khi một nhóm gồm 21 bác sĩ hành nghề đạt được độ chính xác trung bình chỉ 20%.

Điều này khiến Giám đốc điều hành AI của Microsoft Mustafa Suleyman tuyên bố: “Microsoft đã đã thực hiện’một bước thực sự hướng tới siêu trí tuệ y tế.'”Công ty khẳng định rằng công cụ của họ có thể chẩn đoán bệnh với độ chính xác gấp bốn lần bác sĩ.

Tuy nhiên, lĩnh vực AI y tế rộng lớn hơn chứa đầy những hứa hẹn cũng như những trở ngại đáng kể, nên những tuyên bố như vậy cần phải thận trọng. Một phân tích tổng hợp vào tháng 3 năm 2025 của Đại học Osaka, được xuất bản trên tạp chí Nature, đã đưa ra một quan điểm đo lường hơn.

Sau khi xem xét 83 nghiên cứu khác nhau, họ phát hiện ra rằng mặc dù AI có khả năng tạo sinh đang được cải thiện nhưng hiệu suất của nó vẫn chưa hoàn hảo. Là nhà nghiên cứu chính, Tiến sĩ Hirotaka Takita đã lưu ý “khả năng chẩn đoán của AI có thể so sánh được với các bác sĩ không chuyên”, đồng thời nói thêm rằng nó vẫn tụt hậu đáng kể so với các chuyên gia về con người với tỷ lệ 15,8%.

Nghiên cứu cũng đưa ra cảnh báo về tình trạng nghiên cứu trong lĩnh vực này, phát hiện ra rằng 76% số bài báo mà nó phân tích có nguy cơ sai lệch cao, thường là do đào tạo không rõ ràng dữ liệu.

Khoảng cách giữa hiệu suất chuẩn và thực hành lâm sàng trong thế giới thực là một chủ đề thường xuyên xảy ra. Lĩnh vực X quang đóng vai trò là một trường hợp nghiên cứu mạnh mẽ. Vào năm 2016,

Nhà tiên phong về AI Geoffrey Hinton đã tuyên bố nổi tiếng rằng “mọi người nên ngừng đào tạo bác sĩ X quang ngay bây giờ”. Tuy nhiên, gần một thập kỷ sau, nhu cầu về bác sĩ X quang con người đang bùng nổ, với vị trí cư trú kỷ lục và mức lương tăng vọt.

Nghịch lý này cho thấy sự phức tạp to lớn của quy định, trách nhiệm pháp lý và tích hợp quy trình làm việc mà chỉ riêng thuật toán không thể giải quyết được. Các công ty bảo hiểm đang ngày càng đưa ra các điều khoản”Loại trừ AI tuyệt đối”vào các chính sách sơ suất, buộc các bệnh viện phải để bác sĩ được cấp phép chịu trách nhiệm pháp lý đối với mọi chẩn đoán và đảm bảo con người luôn được cập nhật.

Cuộc đua về AI y tế cũng đang diễn ra trên nhiều mặt trận ngoài chẩn đoán. Ví dụ, các nhà nghiên cứu châu Âu đã phát triển Delphi-2M, một AI có thể dự báo nguy cơ của hơn 1.000 căn bệnh trước nhiều thập kỷ bằng cách phân tích hồ sơ sức khỏe.

Trong khi đó, tại Đại học Johns Hopkins, hệ thống SRT-H đã chứng minh tiềm năng của AI trong việc can thiệp trực tiếp, tự động thực hiện các bước phẫu thuật phức tạp trên robot da Vinci tiêu chuẩn trong các thử nghiệm trong phòng thí nghiệm.

Những cách tiếp cận đa dạng này nhấn mạnh tham vọng to lớn trong toàn ngành, trong đó thách thức không chỉ là tạo ra một thuật toán chính xác mà còn là thuật toán an toàn, đáng tin cậy và đủ thiết thực để áp dụng lâm sàng.

Những thách thức chưa được giải quyết về độ tin cậy và độ chính xác

Ngoài các tiêu chuẩn về hiệu suất, trở ngại lớn nhất đối với AI trong y học là niềm tin. Việc sử dụng bộ dữ liệu lớn về bệnh nhân để đào tạo mô hình đặt ra những câu hỏi sâu sắc về quyền riêng tư. Một cuộc tranh cãi gần đây về AI’Foresight’của Vương quốc Anh, được đào tạo trên 57 triệu hồ sơ NHS, đã làm nổi bật sự lo lắng của công chúng về bảo mật dữ liệu.

Copilot của Microsoft cũng phải đối mặt với mức độ chấp nhận của người dùng tăng vọt. Theo dữ liệu của Sensor Tower, ứng dụng này đã được tải xuống 95 triệu lần, một phần nhỏ trong số hơn một tỷ lượt tải xuống của ChatGPT. Xây dựng danh tiếng về độ chính xác trong một lĩnh vực nhạy cảm như chăm sóc sức khỏe có thể là điểm khác biệt chính.

Cuối cùng, thành công của Microsoft sẽ không chỉ phụ thuộc vào công nghệ mà còn phụ thuộc vào khả năng thuyết phục người dùng rằng AI của họ là nguồn đáng tin cậy cho những câu hỏi quan trọng nhất của họ. Quan hệ đối tác với Harvard là một bước đi rõ ràng và mang tính chiến lược nhằm xây dựng niềm tin thiết yếu đó.

Categories: IT Info