Anthropic đã chính thức trình làng các mẫu ngôn ngữ trí tuệ nhân tạo mới nhất, được gọi chung là Claude 3, vào thứ Hai. Công ty quảng cáo những mô hình này đã đạt được các tiêu chuẩn ngành mới trong một loạt nhiệm vụ nhận thức, với mức hiệu suất gần đạt đến mức năng lực của con người trong một số lĩnh vực nhất định. Claude 3 bao gồm bộ ba mô hình, mỗi mô hình được thiết kế với mức độ phức tạp và khả năng khác nhau và hiện có thể truy cập được thông qua trang web của Anthropic.

Bản phát hành đánh dấu một thời điểm quan trọng trong quá trình phát triển không ngừng của các mô hình ngôn ngữ AI, giới thiệu những gì có thể là đối thủ đáng gờm của GPT-4 của OpenAI. Nó cũng được xây dựng dựa trên mẫu Claude 2, được ra mắt vào giữa năm ngoái.

Các biến thể mẫu và khả năng tiếp cận

Gia đình Claude 3 bao gồm ba mẫu riêng biệt: Claude 3 Haiku, Claude 3 Sonnet và Claude 3 Opus, với mỗi mẫu tiếp theo mô hình cung cấp độ phức tạp và số lượng tham số tăng lên. Claude 3 Sonnet hiện có sẵn để sử dụng miễn phí thông qua chatbot Claude.ai nếu người dùng đăng nhập bằng email của họ. Trong khi đó, Claude 3 Opus, biến thể mạnh nhất của bộ ba, chỉ có thể truy cập được thông qua dịch vụ đăng ký có tên “Claude Pro”, tính phí cho người đăng ký là 20 USD hàng tháng thông qua trang web Anthropic. Ngoài ra, tất cả các mẫu Claude 3 đều có chung bối cảnh 200.000 token khả năng của cửa sổ, cho phép hiểu sâu rộng và tạo phản hồi trong các ngữ cảnh nhất định.

Hiệu suất so sánh và ý nghĩa

Anthropic khẳng định rằng Claude 3 Opus vượt trội hơn GPT-4 của OpenAI qua mười tiêu chuẩn AI riêng biệt. Chúng bao gồm MMLU (thước đo kiến ​​thức cấp đại học ), GSM8K (toán cấp lớp), HumanEval (nhiệm vụ viết mã) và HellaSwag (kiến thức thông thường). Chiến thắng về hiệu suất dao động từ biên độ hẹp, chẳng hạn như dẫn đầu 0,4% về điểm MMLU, đến đáng kể, với điểm HumanEval cao hơn 23,7%. Tuy nhiên, ý nghĩa thực tế của những điểm chuẩn này đối với người dùng cuối vẫn phức tạp và nhiều sắc thái.

Nhà nghiên cứu AI Simon Willison, nói chuyện với Ars Technica, cảnh báo về việc diễn giải quá mức hiệu suất điểm chuẩn. Ông lưu ý:”Chưa có mẫu máy nào khác đánh bại được GPT-4 về một loạt các điểm chuẩn được sử dụng rộng rãi như thế này”. Tuy nhiên, Willison nhấn mạnh rằng việc chuyển đổi tính ưu việt của điểm chuẩn sang trải nghiệm người dùng không hề đơn giản. Tuy nhiên, những thành tựu của Claude 3 trong các lĩnh vực này báo hiệu một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo, nhấn mạnh tính chất cạnh tranh và phát triển nhanh chóng của việc phát triển mô hình AI.

Việc Anthropic phát hành Claude 3 không chỉ đánh dấu một cột mốc quan trọng trong công nghệ AI mà còn khơi dậy những cuộc thảo luận sâu hơn về tiềm năng và định hướng trí tuệ nhân tạo. Với những tiến bộ này, các câu hỏi đặt ra về việc sử dụng AI có đạo đức, bản chất của trí thông minh và tương lai của sự tương tác giữa con người và AI. Khi các mô hình này tiếp tục phát triển và bắt chước chặt chẽ hơn sự hiểu biết và sự trôi chảy ở cấp độ con người, Cuộc trò chuyện xung quanh vai trò của AI trong cuộc sống của chúng ta có thể sẽ trở nên phức tạp và nhiều sắc thái hơn.

Categories: IT Info