OpenAI đã cập nhật mô hình GPT-4O của mình, cải thiện khả năng xử lý các truy vấn liên quan đến STEM, giải thích dữ liệu trực quan và kết hợp kiến ​​thức gần đây hơn vào các phản hồi của nó.

Bản cập nhật mới nhất mở rộng dữ liệu đào tạo mô hình từ tháng 11 năm 2023 đến tháng 6 năm 2024, cho phép nó xử lý một loạt các chủ đề hiện tại với độ chính xác cao hơn. Bên cạnh những tiến bộ kỹ thuật này, Openai đã điều chỉnh phong cách đàm thoại của mô hình bằng cách tăng sử dụng biểu tượng cảm xúc trong các tương tác thông thường. Rủi ro trong phát triển AI nhanh chóng

Openai nói rằng GPT-4o hiện cho thấy hiệu suất mạnh hơn trên các điểm chuẩn AI đa phương thức như Mathvista và MMMU, kiểm tra khả năng hiểu và phân tích cả văn bản và hình ảnh của mô hình.

Theo OpenAI, mô hình tinh tế cung cấp những hiểu biết phong phú hơn và hướng dẫn chính xác hơn”khi đánh giá nội dung trực quan, giúp người dùng làm việc với sơ đồ phức tạp, sơ đồ kỹ thuật và trực quan hóa dữ liệu.

Các cải tiến cũng tăng cường độ tin cậy của GPT-4O trong các trường STEM, một khu vực mà các mô hình AI đã phải đối mặt với các thách thức, đặc biệt là giải quyết vấn đề phức tạp. Lý do khái niệm tốt hơn và trình độ kỹ thuật. Đối với kết quả web. và mã hóa. Bản cập nhật tăng cường khả năng của mô hình để xử lý các tính toán logic và số có cấu trúc, các khu vực mà các lần lặp trước đây thỉnh thoảng tạo ra kết quả không chính xác.

OpenAI nhấn mạnh những cải tiến này trong thông báo của mình, nêu rõ, GPT-4O giờ đây tốt hơn về toán học, khoa học và các vấn đề liên quan đến mã hóa, với mức tăng trên các evals học thuật như GPQA và toán học. Điểm được cải thiện của nó trên MMLU, một điểm chuẩn toàn diện về hiểu ngôn ngữ, chiều rộng kiến ​​thức và lý luận, phản ánh khả năng giải quyết các vấn đề phức tạp hơn trên các lĩnh vực.”Giải quyết vấn đề AI-hỗ trợ, đặc biệt là trong các khu vực yêu cầu độ chính xác như tính toán nâng cao, thuật toán học máy và mô phỏng khoa học. là trung tâm của các trường như phát triển phần mềm và vật lý lý thuyết/p>

Trong khi OpenAI không nêu rõ liệu GPT-4O có kết hợp những tiến bộ mới trong lý luận có cấu trúc hay không, hiệu suất được cải thiện của mô hình trên GPQA và MMLU cho thấy các tinh chỉnh trong cách xử lý các nhiệm vụ logic nhiều bước.

Phân tích hình ảnh chính xác hơn và sự hiểu biết đa phương thức

Bản cập nhật cũng tăng cường khả năng xử lý hình ảnh của GPT-4O, làm cho nó trở thành một công cụ có khả năng hơn để phân tích các mối quan hệ không gian, giải thích sơ đồ kỹ thuật và cung cấp hiểu biết bối cảnh dựa trên đầu vào trực quan.

Openai đã báo cáo rằng GPT-4O hiện xếp hạng cao hơn về các điểm chuẩn đánh giá đa phương thức như Mathvista và MMMU, cho thấy hiệu suất mạnh hơn trong việc tích hợp lý luận dựa trên văn bản và hình ảnh. Lưu ý rằng mô hình được cập nhật có nhiều khả năng diễn giải các mối quan hệ không gian trong tải lên hình ảnh, cũng như phân tích các sơ đồ phức tạp, hiểu biểu đồ và đồ thị và kết nối đầu vào trực quan với nội dung bằng văn bản.”

Khả năng bối cảnh hóa và Phân tích dữ liệu trực quan hiệu quả hơn làm cho GPT-4O hữu ích cho các ứng dụng trong kỹ thuật, kiến ​​trúc và khoa học dữ liệu, trong đó các mô hình AI phải xử lý và giải thích sơ đồ hoặc sơ đồ với độ chính xác cao. Bản thiết kế hoặc sơ đồ toán học, những cải tiến này có nghĩa là Chatgpt hiện có thể cung cấp những hiểu biết chi tiết hơn về bố cục không gian và các mối quan hệ số trong dữ liệu trực quan. hình ảnh, chẳng hạn như nghiên cứu khoa học, lập bản đồ không gian địa lý và hình ảnh y tế.

Điều chỉnh đàm thoại và tăng sử dụng biểu tượng cảm xúc Phong cách đàm thoại của GPT-4O, kết hợp nhiều sử dụng biểu tượng cảm xúc vào các câu trả lời. Công ty tuyên bố rằng mô hình hiện sẽ tự động bao gồm các biểu tượng cảm xúc trong các tương tác, đặc biệt khi người dùng đã sử dụng chúng trong tin nhắn của họ.

Openai đã thừa nhận việc điều chỉnh trong thông báo của mình, giải thích, GPT-4O giờ đây có một chút nhiệt tình trong việc sử dụng biểu tượng cảm xúc của nó (có lẽ đặc biệt như vậy nếu bạn sử dụng biểu tượng cảm xúc trong cuộc trò chuyện ✨)-cho chúng tôi biết những gì bạn Hãy suy nghĩ.”Không ảnh hưởng đến khả năng lý luận của mô hình, nó báo hiệu một xu hướng rộng hơn đối với việc làm cho các tương tác AI tự nhiên và giống con người hơn. Tùy chọn tùy chỉnh cho giai điệu đàm thoại trong các lần lặp trong tương lai. Một thời gian khi Openai phải đối mặt với sự cạnh tranh ngày càng tăng từ các nhà phát triển AI đối thủ, đặc biệt là trong các lĩnh vực hiệu quả và hiệu suất lý luận.

Deepseek, một công ty AI có trụ sở tại Trung Quốc, gần đây đã giới thiệu mô hình R1 của mình, đã chứng minh kết quả mạnh mẽ trong các điểm chuẩn lý luận trong khi hoạt động trên một phần tài nguyên tính toán được sử dụng bởi các mô hình Openai.

Cách tiếp cận hiệu quả của Deepseek đã thúc đẩy các phản ứng từ các nhà lãnh đạo trong ngành, bao gồm cả Giám đốc điều hành Openai Sam Altman, người đã thừa nhận sự cạnh tranh bằng cách nêu rõ, rõ ràng chúng tôi sẽ cung cấp các mô hình tốt hơn nhiều và cũng kéo dài một số bản phát hành.”

Liên quan: AI AUDIT-DeepSeek thất bại 83% các bài kiểm tra chính xác do thông tin sai lệch và kiểm duyệt

Ngoài việc tinh chỉnh GPT-4O với bản cập nhật mới nhất, Openai là Chuẩn bị khởi chạy O3-Mini, một mô hình tập trung vào lý do được tối ưu hóa cho tốc độ và hiệu quả

Mô hình hiện đang trải qua quá trình kiểm định FedRamp, một yêu cầu chính đối với các nhà cung cấp đám mây làm việc với các cơ quan chính phủ Hoa Kỳ. Chính phủ trong quy trình làm việc của khu vực công, nói rằng, chúng tôi thấy tiềm năng to lớn cho các công cụ này để hỗ trợ khu vực công trong việc giải quyết các thách thức phức tạp.”Các chương trình thí điểm sớm thể hiện sự tăng năng suất có thể đo lường được. > Với làn sóng tiến bộ AI tiếp theo trên đường chân trời, OpenAI có thể tập trung vào việc mở rộng các mô hình của nó trong khi đảm bảo độ tin cậy trong các ứng dụng trong thế giới thực. thị trường với các chiến lược tối ưu hóa khác nhau.

Categories: IT Info