Deepseek sườn nhanh chóng lên đến các tiếng vang trên của trí tuệ nhân tạo đã khiến nhiều người ngạc nhiên trong lĩnh vực công nghệ.
Trên bề mặt, dường như đã đạt được một kỳ tích đáng chú ý: đào tạo một mô hình tinh vi, được đặt tên là R1, với một phần chi phí điển hình và với ít tài nguyên tính toán hơn so với các phòng thí nghiệm phương Tây hàng đầu.
Tuy nhiên, bằng chứng ngày càng tăng cho thấy các tuyên bố của Deepseek có thể không phản ánh thực tế. Các nhà nghiên cứu, nhà báo và người trong ngành hiện đang đặt câu hỏi liệu thành tích của công ty có bắt nguồn từ kỹ thuật tiên tiến hay không, liệu họ có dựa vào phần cứng buôn lậu, dữ liệu đào tạo AI bị đánh cắp và chiến dịch tuyên truyền do Đảng Cộng sản Trung Quốc (CCP). IMG width=”801″height=”459″src=”data: hình ảnh/gif; base64, r0lgodlhaqabaaaaaach5baekaaealaaaaaabaaaaaiCtaeaaUw==”>
Khoảnh khắc Deepseek R1
Deepseek đã thu hút sự chú ý trên toàn thế giới vào đầu tháng 1 này, bằng cách thông báo rằng mô hình lý luận quy mô lớn của nó, R1, đã được cho là phù hợp hoặc phù hợp với OpperAnformed O1’s O1 trên các điểm chuẩn kỹ thuật, chỉ là một phần chi phí đào tạo thông thường. Các giám đốc điều hành đã chỉ ra 2.048 GPU NVIDIA H800 là phần cứng duy nhất được sử dụng và ước tính tổng chi phí dưới 6 triệu đô la.
Điều này rất nổi bật khi được thiết lập để chống lại hàng trăm triệu người được sử dụng bởi Western Labs để phát triển các mô hình AI tương tự.
Nhiều chuyên gia trong ngành tìm thấy câu chuyện không thể kể chuyện. Huấn luyện các hệ thống AI tiên tiến đòi hỏi sức mạnh tính toán khổng lồ.
Ngay cả những cải thiện nhỏ về hiệu quả đến từ mức tăng nghiên cứu gia tăng trong thời gian dài. Nghi ngờ phát triển cho đến khi Alexandr Wang, Giám đốc điều hành của Scale AI, phát biểu tại Diễn đàn Kinh tế Thế giới vào ngày 24 tháng 1 và tiết lộ rằng Deepseek có thể có phần cứng tiên tiến hơn rất nhiều so với họ thừa nhận. Họ có thể nói về nó vì nó vi phạm các biện pháp kiểm soát xuất khẩu của Hoa Kỳ. Các phòng thí nghiệm Trung Quốc, họ có nhiều H100 hơn mọi người nghĩ. Thực tế là họ dự trữ trước khi các lệnh trừng phạt đầy đủ có hiệu lực, và bây giờ họ đang tận dụng họ để đẩy AI của họ về phía trước.”Các đơn vị H800 Một phiên bản được điều chỉnh của H100 để tuân thủ các lệnh trừng phạt của Hoa Kỳ. Vấn đề.
Đây không chỉ là một công ty AI. Hiệu quả, R1 của Deepseek có thể nợ hiệu suất của nó đối với phần cứng thu được một cách bất hợp pháp. Về một hoạt động buôn lậu quy mô lớn với sự ủng hộ tiềm năng của chính phủ. wiki/suchir_balaji”> suchir balaji , một cựu nhà nghiên cứu Openai 26 tuổi Được tìm thấy trong căn hộ San Francisco của mình vào ngày 26 tháng 11 năm 2024 .
Liên quan: Alibaba Qwen thách thức Openai và Deepseek với AI đa phương thức và các mô hình bối cảnh 1M-Token
Nhà báo điều tra George Webb khả năng trộm cắp dữ liệu AI . Balaji chuyên về các đường ống đào tạo mô hình AI, một vai trò đã trao cho anh ấy cái nhìn sâu sắc về cách các mô hình ngôn ngữ lớn của Openai được xây dựng và tinh chỉnh. Để xây dựng các hệ thống AI của nó, bao gồm cả chatgpt. Trong một Phỏng vấn Thời báo New York , Balaji tuyên bố rằng các phương pháp của Openai có thể làm mất ổn định nền kinh tế cho những người tạo nội dung tạo ra dữ liệu các hệ thống này dựa trên. về sự xuất hiện của chính quyền, để lại ít chỗ để điều tra sâu hơn. Webb, người đã theo dõi gián điệp Trung Quốc bị cáo buộc trong khu vực AI, đã mô tả lý do tại sao chuyên môn của Balaji có thể khiến anh ta trở thành mục tiêu:
một tự sát. Không điều tra thực sự, không có nỗ lực để kết nối các dấu chấm. Nhưng nếu bạn nhìn vào những gì anh ấy đang làm việc trên các đường ống dữ liệu, các bộ dữ liệu, các bộ dữ liệu có thể được dỡ bỏ và sử dụng lại, các hàm ý được làm lạnh. Có những lời thì thầm rằng anh ta sắp thổi còi về cách dữ liệu đào tạo của Openai vào tay Deepseek.”<..co/PbRPkzIupl">pic.twitter.com/PbRPkzIupl
— George Webb – Investigative Journalist (@RealGeorgeWebb1) ngày 29 tháng 1 năm 2025
Ngay cả một lượng nhỏ dữ liệu hoặc mã bị đánh cắp cũng có thể rút ngắn đáng kể thời gian để đào tạo các hệ thống quy mô lớn, do đó giải thích cách Deepseek xuất hiện để nén nhiều năm nghiên cứu về một vài tháng. Nếu hóa ra Deepseek đã đào tạo mô hình R1 của họ trên dữ liệu Openai bị đánh cắp, điều đó có nghĩa là một trong những hoạt động gián điệp lớn nhất của công ty trong lịch sử. Chúng ta đang nói về AI trị giá hàng tỷ, có thể là hàng nghìn tỷ, được bàn giao cho một thực thể được nhà nước hậu thuẫn ở Trung Quốc. Balaji đã biết điều gì đó, và bây giờ anh ấy đã biến mất.”-Luiza-asyamova-george-webb.jpg”>
Các quan chức Openai đã từ chối giải quyết công khai cái chết của Balaji, thúc đẩy sự suy đoán bổ sung. Vi phạm về sở hữu trí tuệ phương Tây. Liên quan: Deepseek bỏ một người khác Openai-Buster với các mô hình đa phương thức Janus, vượt xa Dall-E 3
quan hệ với tham vọng chiến lược của Trung Quốc
Sự gia tăng của Deepseek ngày càng được xem là phù hợp với các mục tiêu chính thức của Trung Quốc là vượt qua các đối thủ cạnh tranh phương Tây trong nghiên cứu và phát triển tiên tiến..
Nhà báo độc lập Lei, một chuyên gia của Trung Quốc và nhà phê bình ĐCST Bảo hiểm:
Hiện họ diễu hành Deepseek như bằng chứng về sức mạnh của Trung Quốc trong AI, nhưng bất cứ ai cố gắng xác minh yêu cầu của họ đều thấy các cánh cửa đóng sầm lại. Tất cả đều quá quen thuộc: cường điệu nhà vô địch địa phương, kết thúc sự giám sát của nước ngoài và gắn nhãn nó thành công lớn.”
[Nội dung nhúng]
Công khai. Các cán bộ đảng có ý định thúc đẩy các khả năng AI của Homegrown. Các nhà phân tích lập luận rằng chân dung này làm nổi bật các giới hạn công nghệ toàn cầu của Trung Quốc, ngay cả khi thực tế liên quan đến sự hỗ trợ của nhà nước nặng và chuỗi cung ứng mờ đục. >
Những tiết lộ về việc buôn lậu của Deepseek về GPU NVIDIA H100 và những tin đồn về việc sử dụng trái phép nghiên cứu Openai đã gây ra cuộc tranh luận giữa các nhà hoạch định chính sách ở Hoa Kỳ và Liên minh châu Âu.
Việc tiết lộ theo quy mô Giám đốc điều hành AI Alexandr Wang, Deepseek có khoảng 50.000 NVIDIA H100 GPU”Các biện pháp đề xuất để thắt chặt việc theo dõi phần cứng điện toán hiệu suất cao. Mua lại quy mô, nhưng các nhà phê bình chỉ ra rằng bất kỳ cơ quan đăng ký nào cũng có thể được trốn tránh qua Hồng Kông hoặc các nút trung gian khác về việc các công ty địa phương có vô tình hỗ trợ dự trữ của Deepseek hay không. Cảnh báo rằng một rủi ro kẹp đơn phương cản trở sự hợp tác nghiên cứu có lợi. Những người đề xuất các quy tắc chặt chẽ hơn, chống lại phần cứng và dữ liệu AI nâng cao không chỉ tài nguyên thương mại mà là tài sản chiến lược. Ở giữa là các công ty công nghệ buộc phải điều hướng một không gian ngày càng phân cực.
Một ngành công nghiệp AI đang phát triển: thận trọng thay thế sự cởi mở
Deepseek của các chiến thuật được cho là có được phần cứng của Hoa Kỳ, có thể đánh cắp dữ liệu OpenAI và chiến lược tiếp thị dựa vào Trên ĐCSTQ Hỗ trợ, đã gây ra sóng xung kích giữa các công ty AI trên toàn thế giới.
Trường hợp trường đã từng tổ chức nghiên cứu mở, nhiều phòng thí nghiệm hiện đang ban hành các biện pháp bảo mật mạnh mẽ hơn để bảo vệ các cơ sở mã và bộ dữ liệu. Balaji, lo lắng rằng vụ Deepseek đại diện cho một bước ngoặt: Các công ty như Openai, Nhân học hoặc Meta có thể phải coi R & D mô hình ngôn ngữ lớn như một hoạt động tình báo. Sự bí mật sẽ tăng lên, và điều đó có thể ngăn chặn việc chia sẻ kiến thức.”Lưu ý trong phân tích của cô rằng ngoài phạm vi kỹ thuật, các hiệu ứng gợn sóng mở rộng đến quản trị dữ liệu, quyền riêng tư và thậm chí là an toàn cá nhân/P>
Đồng thời, cô nhấn mạnh rằng các cộng đồng am hiểu công nghệ ở Trung Quốc cũng đang theo dõi câu chuyện, nhận thức được rằng Deepseek có thể đã làm lu mờ các công ty AI địa phương hợp pháp hơn: Thật là mỉa mai. Thực hiện theo, nhưng các nhà nghiên cứu thực sự của Trung Quốc lo lắng rằng nó tạo tiền lệ cho việc cắt các góc, hoặc tệ hơn, vì đồng lõa với gián điệp.”P> Các nhà hoạch định chính sách và các nhà nghiên cứu đều phải đối mặt với một câu hỏi bực tức: Làm thế nào để thúc đẩy sự đổi mới của AI trong khi ngăn chặn việc lạm dụng sở hữu trí tuệ và công nghệ buôn lậu. Có một lời kêu gọi ngày càng tăng đối với các khung xuyên biên giới hạn chế hoạt động bí mật mà không cản trở sự hợp tác đạo đức.
Một số học giả đã lập luận cho các hội đồng giải quyết xung đột AI AI”liên quan đến các bên liên quan lớn từ chính phủ, ngành công nghiệp và học viện.. Hãy cạnh tranh với chúng tôi, họ sẽ dẫn đầu. Nếu các phương pháp được báo cáo đằng sau thành công của Deepseek, vẫn chưa được kiểm soát, các công ty khác có thể áp dụng các tuyến đường bí mật tương tự, làm trầm trọng thêm những khó khăn trong việc phát hiện các hành vi xâm phạm. Ngược lại, các quy định phản ứng thái quá rủi ro có nguy cơ nỗ lực hợp pháp, đặc biệt là đối với các phòng thí nghiệm nhỏ hơn hoạt động ở các cạnh của nghiên cứu hiện tại. Tiếp tục mở ra, với những tiết lộ thêm về các kênh tài chính tiềm năng, chia sẻ công nghệ và các khía cạnh âm u khác trong hoạt động của nó. Sự giám sát quốc tế, cùng với các cuộc điều tra về cái chết của suchir Balaji, có thể đẩy Deepseek tiến tới việc làm rõ các phương pháp của nó hoặc, nếu nó tiếp tục chặn các đánh giá bên ngoài, tăng cường nghi ngờ rằng đó là tài sản của nhà nước hơn là khởi nghiệp.
AI, từng được coi là một lĩnh vực được thúc đẩy chủ yếu bởi thử nghiệm khoa học, đã mở rộng thành một lĩnh vực nơi cạnh tranh về kiến thức, phạm vi thị trường và các mục tiêu của nhà nước có thể hội tụ theo những cách gây rối. Cho dù Deepseek vẫn là một ví dụ bị cô lập hoặc báo hiệu sự thay đổi lâu dài trong khía cạnh chính trị của AI vẫn còn được nhìn thấy. khôi phục. Nhưng hiện tại, Deepseek vẫn là một biểu tượng mạnh mẽ về cách công nghệ tiên tiến có thể trở thành một công cụ chính sách mạnh mẽ, uy tín quốc gia và chiến lược kinh tế, tất cả đều xảy ra sau cánh cửa đóng kín và mạng lưới được bảo vệ.