OpenAI đã đảo ngược quyết định tháng 2 của mình để hủy mô hình O3, thay vào đó thông báo rằng họ sẽ ra mắt O3 và O4-Mini trong vài tuần tới, GPT-5 bị giữ lại cho đến cuối năm nay. Bản cập nhật đã được CEO Sam Altman xác nhận trong một bài đăng trên X, nơi ông nói rằng công ty giờ đây sẽ giữ các mô hình tập trung vào lý do tách biệt với các mô hình ngôn ngữ đa năng của nó. Mô hình trò chuyện/hoàn thành.”Altman đã viết. Ông nói thêm, chúng tôi rất vui mừng về hiệu suất mà chúng tôi thấy từ O3 trong nội bộ.”src=”https://winbuzzer.com/wp-content/uploads/2023/08/openai-logo.jpg”>

Có rất nhiều lý do cho điều này href=”https://twitter.com/sama/status/1908167621624856998?ref_src=twsrc%5etfw”Target=”_ Blank”vào GPT-5. Chiến lược đó nhằm mục đích giảm sự nhầm lẫn của người dùng và hợp lý hóa sự phức tạp của sản phẩm. Openai đã nói rằng họ muốn tạo một hệ thống duy nhất có thể phục vụ tất cả các chức năng mà không cần một người chọn mô hình.”Cài đặt hiệu quả thấp và 91,5% ở chế độ hiệu quả cao. Trên điểm chuẩn toán học AIME 2024, nó đạt 96,7%. Nó cũng hoạt động tốt trên GPQA Diamond, một bài kiểm tra cho lý luận khoa học cấp tiến sĩ, với điểm 87,7%. Những con số này đặt O3 trên GPT-4.5 và O3-Mini trong các nhiệm vụ kỹ thuật cụ thể, đặc biệt là trong các lĩnh vực có cấu trúc. Điều này cho phép nó giải quyết các vấn đề nhiều bước phức tạp hiệu quả hơn so với các mô hình trước đó. O3 cho phép các nhà phát triển tăng độ sâu lý luận, nhưng sự đánh đổi là tính toán sử dụng mạnh mẽ lên tới 172 lần trong các cấu hình hiệu quả cao. Những yêu cầu này đã được xác nhận trong blog ARC Benchmark và đặt ra câu hỏi về tính khả thi ở quy mô. Dựa trên các quy ước đặt tên Openai, nó có khả năng cung cấp các yêu cầu tính toán giảm với nhiều lợi ích lý luận tương tự. Công ty chưa chia sẻ điểm chuẩn công khai hoặc thông số kỹ thuật. Vào ngày 20 tháng 3, công ty đã ra mắt O1-Pro thông qua API Access, nhắm mục tiêu các trường hợp sử dụng doanh nghiệp như các đường ống công nghệ và đại lý hợp pháp. Mô hình hỗ trợ tới 100.000 mã thông báo đầu ra và yêu cầu 5 đô la chi tiêu trước để mở khóa truy cập. Giá bắt đầu từ 150 đô la một triệu mã thông báo đầu vào và 600 đô la cho đầu ra. Không có chi phí, như đã báo cáo vào ngày 7 tháng 3. Điều này cho thấy sự khác biệt trong các mô hình kinh doanh: Microsoft gói các công cụ lý luận của Openai, thành phần mềm rộng hơn, trong khi OpenAI kiếm tiền từ lý luận như một tính năng cao cấp. Altman nói rằng mô hình sẽ đến trong một vài tháng,”mặc dù không có ngày cụ thể nào được đưa ra. Khi nó ra mắt, GPT-5 dự kiến ​​sẽ tích hợp lý luận và tạo ra trong một hệ thống. Mục tiêu đó ban đầu đã được trích dẫn trong kế hoạch tháng hai đã bỏ qua để gấp O3 thành GPT-5. Được phát hành vào cuối tháng 2, GPT-4,5 đã mở rộng cửa sổ bối cảnh của hệ thống lên 200.000 mã thông báo và đưa ra những cải tiến trong sự hiểu biết đa ngôn ngữ. Tuy nhiên, nó vẫn kém hơn trong các điểm chuẩn lý luận toán học và khoa học so với O3-mini. Openai thừa nhận rằng các mô hình như O3-Mini vẫn vượt qua GPT-4.5 trong các lĩnh vực lớn như mã hóa và giải quyết vấn đề nâng cao. Sự thay đổi lộ trình đang diễn ra cùng với các động thái tài chính và cơ sở hạ tầng đáng kể. Vào ngày 1 tháng 4, công ty đã công bố một thỏa thuận đấu thầu trị giá 40 tỷ đô la do SoftBank dẫn đầu, đẩy mức định giá của nó lên 300 tỷ đô la. Cấu trúc của thỏa thuận, chủ yếu là doanh số chia sẻ thứ cấp, đã cho phép các nhân viên và nhà đầu tư sớm rút tiền trong khi tăng áp lực lên Openai để vận chuyển các sản phẩm có giá trị cao. Vào tháng 3, nó đã ký một thỏa thuận tính toán 11,9 tỷ đô la với CoreWeave và chiếm cổ phần 350 triệu đô la trong công ty. Nó cũng tiếp tục phát triển các chip AI tùy chỉnh hợp tác với Broadcom và TSMC, với các thiết kế ban đầu dự kiến ​​vào cuối năm nay.

Mô hình trọng lượng mở và đẩy minh bạch

Ngay trước khi đảo ngược O3, Altman cũng tuyên bố rằng OpenAI đang chuẩn bị phát hành mô hình ngôn ngữ cân nặng mở đầu tiên kể từ GPT-2. Ông mô tả mô hình này là khá có khả năng”và yêu cầu các nhà phát triển và nhà nghiên cứu cung cấp phản hồi về cách cải thiện tiện ích của nó. Công ty đã làm rõ rằng mô hình sẽ bao gồm các trọng số được đào tạo trước nhưng không đào tạo dữ liệu hoặc mã. Altman đã viết. Động thái này diễn ra trong bối cảnh nhu cầu của nhà phát triển ngày càng tăng về tính minh bạch và đáp ứng cạnh tranh từ các mô hình nguồn mở được phát hành bởi Meta, Mistral và Deepseek.

Openai cũng đã thay đổi để tăng khả năng diễn giải. Vào tháng Hai, công ty bắt đầu tiết lộ dấu vết lý luận nội bộ từ O3-mini, giúp các nhà phát triển và nhà nghiên cứu hiểu cách các mô hình đến câu trả lời. Quyết định này phản ánh sự thay đổi rộng hơn đối với khả năng giải thích trong gia đình mô hình lý luận của công ty. Thay vì chờ đợi các khả năng gói vào một mô hình biên giới toàn diện, OpenAI hiện đang phát hành các công cụ chuyên dụng khi chúng sẵn sàng sản xuất.

Sự thay đổi đi kèm với sự đánh đổi. Người dùng bây giờ phải đối mặt với nhiều loại mô hình hơn, nhưng mỗi loại được tối ưu hóa tốt hơn cho các tác vụ cụ thể. Các doanh nghiệp có thể áp dụng các mô hình lý luận cao cấp như O1-Pro, trong khi các nhà phát triển có quyền truy cập vào các hệ thống trung gian như O4-mini, hoặc các phiên bản trọng lượng mở để thử nghiệm minh bạch hơn. Liệu GPT-5 cuối cùng sẽ củng cố các dịch vụ này hay chỉ là một chi nhánh khác trong công ty Mở rộng Cây mô hình Cây được nhìn thấy.

Categories: IT Info