Các mô hình Openai chưa được phát hành đạt được điểm số mã hóa Olympic và Top Olympic Gold trên bảng xếp hạng WebArena

Openai đã tiết lộ hai đột phá lớn: một mô hình thử nghiệm giành được huy chương vàng trong một cuộc thi toán danh tiếng và một mô hình alpha mới với các kỹ năng mã hóa đáng gờm.

Tiến bộ kép này báo hiệu sự hồi sinh mạnh mẽ. Nó nhằm mục đích chuyển lời kể từ sự hỗn loạn nội bộ sang lãnh đạo kỹ thuật không thể phủ nhận. Đối với một ngành công nghiệp theo dõi Openai, mỗi động thái, những phát triển này là một lời nhắc nhở mạnh mẽ về khả năng nghiên cứu sâu của công ty và tham vọng xác định biên giới tiếp theo của AI. Một mô hình nghiên cứu thử nghiệm đã kiếm được điểm cấp huy chương vàng tại

Mô hình đã giải quyết năm trong số sáu vấn đề phức tạp, kiếm được 35 trong số 42 điểm có thể. Điểm này chắc chắn đặt hiệu suất của nó trong tầng cao nhất của các thí sinh của con người. Nhà khoa học nghiên cứu Openai Alexander Wei đã công bố tin tức về X, gọi đó là thành tích của pic.twitter.com/sg3k6eknac

href=”https://twitter.com/alexwei_/status/194647774285532918?ref_src=twsrc%5etfw”Target=”_ Blank”> Mô hình được tạo ra chi tiết, bằng chứng logic Trong cùng điều kiện nghiêm ngặt như người tham gia, không truy cập vào Internet hoặc bất kỳ công cụ nào bên ngoài. Wei lưu ý, bằng cách làm như vậy, chúng tôi đã có được một mô hình có thể tạo ra các lập luận phức tạp, kín nước ở cấp độ của các nhà toán học của con người”, nêu bật khả năng của mô hình để xử lý lý luận trừu tượng. Nhà nghiên cứu Openai Sebastien Bubeck nhấn mạnh điểm này, nêu rõ , Đây là một mô hình cụ thể theo IMO. Nó là một LLM lý do kết hợp các kỹ thuật đa năng thử nghiệm mới.”Nó dựa vào thời gian tính toán rộng rãi để giải quyết vấn đề. Brown giải thích sự phát triển của các hệ thống của họ, nói rằng, mô hình này cũng suy nghĩ trong một thời gian dài. O1 đã suy nghĩ trong vài giây. Nghiên cứu sâu trong vài phút. Điều này nghĩ trong nhiều giờ.”Tuy nhiên, sức mạnh lý luận tiên tiến này đã sớm có được trong các sản phẩm công cộng. Cả Wei và CEO Sam Altman đều xác nhận mô hình là một dự án nghiên cứu, với khả năng của nó

Trong khi mô hình toán học tạo ra các tiêu đề, một sáng tạo Openai khác lặng lẽ nổi lên. Vào ngày 17 tháng 7, một mô hình mới được đặt tên là O3-Alpha”đã xuất hiện trên bảng xếp hạng WebArena, một nền tảng để thử nghiệm các tác nhân AI trên bảng xếp hạng WebArena trong thế giới thực. Hiệu suất của nó ngay lập tức làm dấy lên sự phấn khích trong cộng đồng nhà phát triển. Điều này cho thấy một bước quan trọng đối với các trợ lý AI có thể đóng vai trò là đối tác thực tế cho các nhà phát triển. Các chuyên gia đưa ra giả thuyết rằng O3-alpha là một thử nghiệm cho các kiến trúc trong tương lai sẽ thống nhất AI trò chuyện với khả năng phát triển phần mềm tinh vi, một mục tiêu chính cho GPT-5 sắp tới. Một người ẩn danh-chatbot” pic.twitter.com/akqsle7z4f

-Aibattle (@aibattle_) href=”https://twitter.com/aibattle_/status/1946106642598162922? Khả năng

Những chiến thắng kỹ thuật này cung cấp một sự tương phản rõ rệt và kịp thời với các cuộc đấu tranh gần đây của Openai. Công ty đã điều hướng một thời kỳ áp lực bên trong và bên ngoài mãnh liệt, được đánh dấu bằng sự sụp đổ ngoạn mục của thỏa thuận trị giá 3 tỷ đô la của mình để có được sự khởi nghiệp của AI Coding Windsurf. Đó là một phần của một cuộc khủng hoảng rộng lớn hơn”bao gồm một quyết định hỗn loạn, đảo ngược để trở thành một tập đoàn vì lợi nhuận và một cuộc di cư tài năng cho các đối thủ cạnh tranh như Meta. Bằng cách chứng minh các khả năng tiên tiến trong hai lĩnh vực riêng biệt và rất phức tạp, Openai đang xác nhận lại vị trí của mình ở vị trí hàng đầu trong nghiên cứu AI. Thông điệp rất rõ ràng: Mặc dù bộ phim của công ty, các phòng thí nghiệm đang gửi.

Các mô hình Openai chưa được phát hành đạt được điểm số mã hóa Olympic và Top Olympic Gold trên bảng xếp hạng WebArena

Published by All Things Windows on July 21, 2025

IT Info

XAI từ ‘Dự án Skippy, đã sử dụng các khuôn mặt nhân viên để dạy cảm xúc của con người, làm nổi bật phản ứng dữ dội nội bộ

IT Info

Openai Pivots để gây quỹ khẩn cấp như dự án Stargate $ 500B với SoftBank vấp ngã

IT Info

Amazon mua lại AI Startup Bee có thể đeo được

Các mô hình Openai chưa được phát hành đạt được điểm số mã hóa Olympic và Top Olympic Gold trên bảng xếp hạng WebArena

Published by All Things Windows on July 21, 2025

Related Posts

IT Info

XAI từ ‘Dự án Skippy, đã sử dụng các khuôn mặt nhân viên để dạy cảm xúc của con người, làm nổi bật phản ứng dữ dội nội bộ

IT Info

Openai Pivots để gây quỹ khẩn cấp như dự án Stargate $ 500B với SoftBank vấp ngã

IT Info

Amazon mua lại AI Startup Bee có thể đeo được