quay cuồng với mối quan hệ đối tác thảm khốc với meta đã gây ra cuộc di cư của khách hàng và sa thải hàng loạt, AI quy mô công ty dán nhãn dữ liệu đang thực hiện một trò chơi táo bạo để đòi lại thẩm quyền của mình trong ngành công nghiệp AI. Các cuộc chiến chuẩn cấp”bằng cách sử dụng cơ sở người dùng toàn cầu đa dạng và bảo vệ chống lại thao túng . Trục chiến lược này nhằm giải quyết những lo ngại ngày càng tăng rằng bảng xếp hạng AI hiện tại dễ dàng được đánh giá và không phản ánh hiệu suất trong thế giới thực, đưa ra một con đường để xây dựng lại danh tiếng của nó trên nền tảng của sự tin tưởng.

Làm thế nào SEAL SHOWDOWN nhằm mục đích xây dựng một điểm chuẩn tốt hơn

AI đang định vị SEAL SHOWDOWN là thuốc giải độc cho hệ thống thiếu sót này. Công ty lập luận rằng các bảng xếp hạng ngày hôm nay bị sai lệch vì họ phụ thuộc rất nhiều vào phản hồi từ một nhóm người đam mê công nghệ. Mạng lưới đóng góp. Mạng này kéo dài hơn 100 quốc gia, 70 ngôn ngữ và các ngành nghề khác nhau, hứa hẹn đánh giá đại diện và thực tế hơn về hiệu suất mô hình. Điều này cho phép các nhà phát triển và khách hàng xem các mô hình hoạt động như thế nào cho các đối tượng cụ thể, thay vì dựa vào một điểm số nguyên khối duy nhất. Nó cũng cho thấy cách các mô hình như Gemini hoạt động tốt hơn với người dùng không phải tiếng Anh, cung cấp những hiểu biết trước đây không có sẵn cho công chúng. Công ty tuyên bố họ sẽ không bán hoặc cấp phép dữ liệu gần đây từ cùng phân phối với bảng xếp hạng trực tiếp. Chính sách này được thiết kế để ngăn AI Labs chỉ đơn giản là điều chỉnh các mô hình của họ sang trò chơi”Bảng xếp hạng, buộc họ phải xây dựng các hệ thống có khả năng thực sự. Như Giám đốc điều hành Turing Jonathan Siddharth đã lập luận sau thỏa thuận meta, tính trung lập không còn là tùy chọn, nó rất cần thiết.”Bằng cách khởi chạy một nền tảng được xây dựng dựa trên tính minh bạch và tính trung lập, AI tỷ lệ đang cố gắng đòi lại chất lượng thiết yếu đó. Nó có một giá thầu cổ phần cao để chuộc lỗi. Đối với một công ty có danh tiếng đã bị phá vỡ bởi một thỏa thuận làm tổn hại đến sự độc lập của mình, xây dựng tiêu chuẩn đáng tin cậy nhất trong ngành có thể là con đường duy nhất trở lại vị trí lãnh đạo. Vào tháng 6, Meta đã đầu tư 14,3 tỷ đô la cho tỷ lệ 49% cổ phần của AI. Phòng thí nghiệm của Sup SuperIntellectence”. Như một nhà phân tích lưu ý, đó là một khoản đầu tư không phải là không mua cả một công ty mà chỉ để có người đứng đầu một công ty đứng đầu nỗ lực AI của bạn.”Họ được giao phó với dữ liệu nhạy cảm, độc quyền và các lộ trình sản phẩm trong tương lai từ các đại gia công nghệ cạnh tranh. Thỏa thuận meta đã phá hủy niềm tin đó ngay lập tức.

Hậu quả là ngay lập tức và nghiêm trọng. Một cuộc di cư của khách hàng bắt đầu như những người khổng lồ trong ngành, bao gồm Google, Microsoft và Elon Musk, XAI, bắt đầu xem xét quan hệ đối tác của họ, vì sợ dữ liệu của họ có thể được tiếp xúc với đối thủ cạnh tranh trực tiếp. đo. Vào tháng 7, chỉ một tháng sau khi thỏa thuận meta, công ty đã sa thải 14% lực lượng lao động của mình, ảnh hưởng đến 200 nhân viên toàn thời gian và 500 nhà thầu. Việc cắt giảm đã được xử lý đột ngột, với các nhân viên đã tắt hệ thống trước khi họ thức dậy. Việc sắp xếp lại thị trường đã tạo ra một cơ hội lớn cho các đối thủ quy mô, với các công ty như Surge AI được báo cáo tìm kiếm vốn mới để tiếp thu các khách hàng chạy trốn.

Sự hỗn loạn lên đến đỉnh điểm trong hành động pháp lý. Đầu tháng 9, quy mô AI đã đệ đơn kiện gián điệp của công ty chống lại công ty đối thủ Mercor và một cựu giám đốc điều hành, Eugene Ling. Di chuyển báo hiệu một công ty chịu áp lực to lớn, hiện đang chiến đấu để bảo vệ tài sản trí tuệ của mình khi các đối thủ cạnh tranh tận dụng sự bất ổn của nó. Xếp hạng có thể thúc đẩy các phương tiện truyền thông, hợp đồng doanh nghiệp và định giá cao hơn, tạo ra áp lực to lớn cho các phòng thí nghiệm hoạt động tốt, đôi khi thông qua các phương tiện đáng ngờ. Điều này đã dẫn đến các cuộc chiến chuẩn,”trong đó nhận thức về sự thống trị cũng quan trọng như hiệu suất thực tế. Một báo cáo gần đây đã tiết lộ Elon Musk, XAI đã thuê các nhà thầu với mục tiêu rõ ràng là đào tạo mô hình Grok của mình để đánh bại đối thủ của đối thủ và một tài liệu mã hóa có ảnh hưởng. href=”https://www.businessinsider.com/grok-deaderboard-coding-anthropic-blaude-cale-ai-2025-7″Target=”_ Blank”> Business Insider .

Nate Jones đã viết Hệ thống, theo một nghiên cứu tháng 7 đồng tác giả bởi các nhà nghiên cứu từ Amazon, Stanford và MIT.