Openai đã công bố một phương pháp đào tạo an toàn mới cho gia đình Model GPT-5 mới của mình có tên là Safe Safe Finemations.” Được công bố vào ngày 7 tháng 8 cung cấp các phản ứng hữu ích nhưng về cơ bản an toàn. Theo OpenAI, phương pháp tập trung đầu ra này làm cho mô hình trở nên hữu ích hơn đáng kể mà không ảnh hưởng đến ranh giới an toàn cốt lõi. Chiến lược cơ bản dường như là một phản ứng trực tiếp đối với một trong những thách thức dai dẳng nhất trong AI: tạo ra các mô hình vừa hữu ích và vô hại, đặc biệt là khi ý định của người dùng không rõ ràng. src=”Dữ liệu: Image/SVG+XML; gihdpzhropsixmjgwiibozwlnahq9iju3ocigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Vấn đề nan giải sử dụng kép
Trọng tâm của phương pháp mới này là vấn đề sử dụng kép”. Openai sử dụng ví dụ về người dùng yêu cầu năng lượng cần thiết để đốt cháy pháo hoa, một truy vấn có thể dành cho một dự án trường học hoặc để xây dựng chất nổ. Sự mơ hồ này, nơi thông tin có cả tiềm năng lành tính và độc hại, là một thách thức cốt lõi đối với sự an toàn của AI. Các mô hình an toàn AI truyền thống, được đào tạo trên một logic”Tuân thủ nhị phân hoặc từ chối”, không được trang bị cho sắc thái này. Họ đưa ra một quyết định đơn giản dựa trên tác hại nhận thức của lời nhắc. Hệ thống này hoàn toàn tuân thủ, điều này rất nguy hiểm nếu ý định của người dùng là độc hại, hoặc nó đưa ra một sự từ chối chăn như là tôi xin lỗi, tôi có thể giúp đỡ với điều đó”, điều này không có ích cho người dùng hợp pháp. Khung nhị phân này không điều hướng khu vực màu xám rộng lớn về ý định của con người. Hạn chế đáng kể này là điều khiến Openai phát triển một phương pháp tinh vi hơn có thể cung cấp câu trả lời an toàn, cấp cao thay vì từ chối hoàn toàn. Target=”_ Blank”> Thông báo Openai, , về cơ bản, chuyển trọng tâm từ việc phân loại đầu vào của người dùng để đảm bảo sự an toàn của đầu ra mô hình. Thay vì đưa ra phán đoán nhị phân trên lời nhắc của người dùng, cách tiếp cận tập trung vào đầu ra này đào tạo mô hình để tạo ra phản ứng hữu ích nhất có thể vẫn tuân thủ các chính sách an toàn nghiêm ngặt.