Những thách thức nhân học Openai với nâng cấp 1M token claude Sonnet 4, nhưng có lớn hơn luôn tốt hơn không?

Nhân học đang tăng cường cuộc đua cửa sổ bối cảnh AI, nâng cấp mô hình Claude Sonnet 4 của mình để xử lý 1 triệu mã thông báo. hiện có sẵn trong beta công khai , động thái này sẽ đưa ra sự cạnh tranh trực tiếp với việc Phân tích toàn bộ cơ sở mã hoặc bộ tài liệu lớn cùng một lúc. Sự thúc đẩy trên toàn ngành này xuất hiện giống như các nghiên cứu gần đây về mục tiêu bối cảnh”cho thấy hiệu suất mô hình có thể trở nên tồi tệ hơn với các đầu vào dài, đưa ra câu hỏi về chiến lược. href=”https://www.anthropic.com/news/1m-context”Target=”_ Blank”> API chính thức API và Amazon Bedrock. Công ty cũng đã xác nhận rằng tính năng này sẽ sớm ra mắt với Google Cloud Vertex AI, mở rộng tính khả dụng của nó cho các nhà phát triển doanh nghiệp. Anthropic đang định vị sự tăng cường này cho một lớp mới các ứng dụng phức tạp, sử dụng nhiều dữ liệu trước đây không thực tế. Đối với các nhà phát triển, điều này có nghĩa là khả năng thực hiện phân tích mã quy mô lớn bằng cách tải toàn bộ cơ sở mã, cho phép mô hình hiểu kiến trúc dự án và xác định các phụ thuộc vào tệp chéo. Đối với các nhà nghiên cứu và nhà phân tích, nó cho phép tổng hợp các bộ tài liệu rộng rãi, chẳng hạn như hợp đồng pháp lý hoặc thông số kỹ thuật, đồng thời duy trì bối cảnh đầy đủ trên hàng trăm nguồn. Nó cũng trao quyền cho việc tạo ra các tác nhân nhận thức bối cảnh, tinh vi hơn, có thể duy trì sự gắn kết giữa hàng trăm cuộc gọi công cụ và quy trình làm việc nhiều bước. Bolt.New, một công ty tích hợp Claude vào nền tảng phát triển dựa trên trình duyệt của mình, đã nhấn mạnh mô hình tiếp tục vượt trội so với các đối thủ cạnh tranh. Eric Simons, Giám đốc điều hành và đồng sáng lập của công ty, đã tuyên bố rằng, với cửa sổ bối cảnh 1M, các nhà phát triển giờ đây có thể làm việc trên các dự án lớn hơn đáng kể trong khi duy trì độ chính xác cao mà chúng ta cần cho mã hóa trong thế giới thực.”Sean Ward, Giám đốc điều hành và đồng sáng lập của Igent AI, đã mô tả bản cập nhật là một sự thay đổi cơ bản, lưu ý rằng nó cho phép kỹ thuật quy mô sản xuất thực sự của các phiên Mult-Mult-Day trên các cơ sở mã trong thế giới thực. Cảnh quan cạnh tranh đã bao gồm Minimax có trụ sở tại Singapore, công bố mô hình mã thông báo 4 triệu vào tháng 1, thiết lập một thanh cao cho ngành công nghiệp. Nó cũng bao gồm meta, mô hình Scout Llama 4 tự hào có dung lượng mã thông báo 10 triệu, đẩy các ranh giới của xử lý bối cảnh dài hơn nữa. Target=”_ Blank”> Giá cho tính năng mới được xếp hạng . Đối với lời nhắc lên tới 200.000 mã thông báo, chi phí là 3 triệu đô la đầu vào. Đối với những lời nhắc lớn hơn, giá tăng gấp đôi tới 6 triệu đô la đầu vào. Cấu trúc này được thiết kế để quản lý tải trọng tính toán tăng của các bối cảnh dài hơn. Mặc dù các giao diện web của nó có giới hạn nhỏ hơn, API GPT-5 cung cấp một cửa sổ bối cảnh tối đa là 400.000 mã thông báo. Cấp hàng đầu này được dành riêng cho người dùng API, nhắm mục tiêu các nhà phát triển xây dựng các ứng dụng yêu cầu phân tích tài liệu sâu. Google Gem Gemini 2.5 Pro hỗ trợ một cửa sổ bối cảnh lên tới 1 triệu mã thông báo.

Vấn đề rot rot bối cảnh: lớn hơn luôn tốt hơn? Một báo cáo gần đây từ Chroma Research đã giới thiệu khái niệm về mục đích bối cảnh,”thách thức câu chuyện lớn hơn là”Thay vào đó, nó đã kiểm tra 18 LLM hàng đầu về khả năng đưa ra các suy luận từ thông tin liên quan đến ngữ nghĩa, một nhiệm vụ khó khăn hơn nhiều. Các nhà nghiên cứu lưu ý, chúng tôi chứng minh rằng ngay cả trong các điều kiện tối thiểu này, hiệu suất mô hình giảm dần khi độ dài đầu vào tăng lên, thường theo những cách đáng ngạc nhiên và không đồng nhất.”Nghiên cứu cũng cho thấy các mô hình GPT có xu hướng ảo giác câu trả lời sai, trong khi các mô hình Claude thường từ chối trả lời khi phải đối mặt với sự mơ hồ. Những phát hiện này không bị cô lập. Một nghiên cứu chung từ Microsoft và Salesforce đã báo cáo giảm 39% hiệu suất trong các cuộc trò chuyện dài, nhiều lượt. Meta sườn Llama 4, mặc dù cửa sổ mã thông báo 10 triệu, đã báo cáo đã đấu tranh với các điểm chuẩn trong bối cảnh dài. Điều này đã khiến một số người, như nhà nghiên cứu AI Gary Marcus, đặt câu hỏi về toàn bộ cách tiếp cận. Ông lập luận rằng, không ai có tính toàn vẹn trí tuệ vẫn có thể tin rằng quy mô thuần túy sẽ đưa chúng ta đến AGI.”Khi các nhà phát triển có quyền truy cập vào các công cụ mới mạnh mẽ này, trọng tâm có thể chuyển từ mức độ dữ liệu mà một mô hình có thể xử lý để chuẩn bị dữ liệu đó.

Những thách thức nhân học Openai với nâng cấp 1M token claude Sonnet 4, nhưng có lớn hơn luôn tốt hơn không?

Published by All Things Windows on August 13, 2025

IT Info

Tôi có thể lấy email từ tài khoản Gmail đã xóa không?

IT Info

Làm cách nào để xóa tài khoản iCloud của tôi khỏi một thiết bị khác?

IT Info

Làm cách nào để lưu trữ hoạt động của mình trên PayPal?

Những thách thức nhân học Openai với nâng cấp 1M token claude Sonnet 4, nhưng có lớn hơn luôn tốt hơn không?

Published by All Things Windows on August 13, 2025

Related Posts

IT Info

Tôi có thể lấy email từ tài khoản Gmail đã xóa không?

IT Info

Làm cách nào để xóa tài khoản iCloud của tôi khỏi một thiết bị khác?

IT Info

Làm cách nào để lưu trữ hoạt động của mình trên PayPal?