Google đang nắm lấy một ít ít hơn là”triết lý với bản phát hành AI mới nhất của mình, ra mắt mô hình mở Gemma 3 270m siêu hiệu quả. Chỉ với 270 triệu tham số, mô hình nhỏ gọn này được thiết kế cho các nhà phát triển để tạo các ứng dụng chuyên dụng, tinh chỉnh có thể chạy trực tiếp trên các thiết bị như điện thoại thông minh hoặc thậm chí trong trình duyệt web. Thay vì dựa vào các hệ thống dựa trên đám mây khổng lồ, Gemma 3 270m tập trung vào hiệu quả công suất cực cao cho các nhiệm vụ được xác định rõ, làm cho AI tiên tiến dễ tiếp cận hơn đối với điện toán trên thiết bị và cạnh. Target=”_ Blank”> Mở rộng Gem GemaSones”của các mô hình mở . Nó sau khi ra mắt ban đầu của Sê-ri Gemma 3 vào tháng 3, việc phát hành các phiên bản QAT cho GPU của người tiêu dùng vào tháng 4 và ra mắt Gemma 3n đầu tiên trên thiết bị di động vào tháng 6. src=”Dữ liệu: Image/SVG+XML; Aiihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Chiến lược này phù hợp với sự thay đổi ngành công nghiệp rộng hơn đối với các mô hình ngôn ngữ nhỏ (SLM). Các công ty như Microsoft với Series PHI, Mistral AI với mô hình nhỏ 3 và khuôn mặt ôm nhau với các mẫu Smolvlm của nó đều đầu tư mạnh vào AI hiệu quả. Nó nhấn mạnh một xu hướng phát triển của ngành công nghiệp, nơi các mô hình nhỏ hơn, chuyên dụng đang trở thành công cụ thiết yếu để triển khai thực tế, trong thế giới thực. href=”https://developers.googleblog.com/en/introducing-gemma-3-270m”Target=”_ Blank”> Google đang định vị Gemma 3 270m Thông báo chính thức của công ty gọi một nguyên tắc kỹ thuật cổ điển: bạn sẽ sử dụng búa tạ để treo khung ảnh. Mô hình này
Sức mạnh của phương pháp chuyên môn này đã được chứng minh trong thế giới thực. Google nhấn mạnh công việc của ML thích ứng với SK Telecom, trong đó mô hình Gemma được điều chỉnh tinh chỉnh được giao nhiệm vụ kiểm duyệt nội dung đa ngôn ngữ. Kết quả rất rõ ràng: mô hình chuyên dụng không chỉ đáp ứng mà còn vượt trội so với các hệ thống độc quyền lớn hơn nhiều về nhiệm vụ cụ thể của nó. Câu chuyện thành công này đóng vai trò là một kế hoạch chi tiết thực tế cho cách các nhà phát triển có thể tận dụng hiệu quả của Gemma 3 270m. Bằng cách bắt đầu với một cơ sở nhỏ gọn và có khả năng, các nhà phát triển có thể xây dựng các hệ thống sản xuất nhanh hơn và rẻ hơn đáng kể. Chiến lược này trực tiếp nhắm mục tiêu vào nhu cầu ngày càng tăng đối với AI hiệu quả về chi phí có thể được triển khai ở quy mô mà không phải chịu chi phí suy luận lớn. Kích thước nhỏ của mô hình cho phép lặp lại nhanh chóng, cho phép hoàn thành các thí nghiệm tinh chỉnh trong vài giờ chứ không phải vài ngày. Đối với một số vai trò chuyên môn cao, chẳng hạn như NPC trò chơi nhập vai hoặc các bot nhật ký tùy chỉnh, khả năng của mô hình để quên đi”Kiến thức chung thông qua việc quá mức trở thành một tính năng, đảm bảo nó tập trung vào laser vào chức năng được chỉ định của nó. của sự đánh đổi kiến trúc có chủ ý. Mô hình 270 triệu tham số được phân phối một cách độc đáo: 170 triệu đáng kể được dành riêng cho lớp nhúng của nó, chỉ để lại 100 triệu cho các khối máy biến áp cốt lõi. Lựa chọn thiết kế này trực tiếp cho phép tính năng nổi bật của mô hình: một từ vựng lớn 256.000. Từ vựng lớn này là chìa khóa cho khả năng chuyên môn hóa của nó. Nó cho phép mô hình xử lý các mã thông báo hiếm, cụ thể và kỹ thuật có độ trung thực cao, làm cho nó trở thành một nền tảng đặc biệt mạnh mẽ để tinh chỉnh trong các lĩnh vực thích hợp như luật pháp, y học hoặc tài chính. Bằng cách hiểu biệt ngữ cụ thể của ngành ngay từ đầu, nó đòi hỏi ít dữ liệu đào tạo hơn để trở thành một chuyên gia. Điều này được bổ sung bởi một cửa sổ bối cảnh mã thông báo 32K đáng kính, cho phép nó xử lý các lời nhắc và tài liệu đáng kể. Công ty rõ ràng rằng Gemma 3 270m không được thiết kế cho các trường hợp sử dụng trò chuyện mở, phức tạp như chatbot. Thay vào đó, phiên bản điều chỉnh hướng dẫn được thiết kế để tuân theo các lời nhắc và lệnh có cấu trúc một cách hiệu quả ngay lập tức, cung cấp một cơ sở đáng tin cậy để tùy chỉnh thêm. Trong bài kiểm tra IFEVAL, đo lường khả năng của mô hình để tuân theo các hướng dẫn có thể kiểm chứng, Gemma 3 270m đạt được số điểm 51,2 %. Điểm này cao hơn các mô hình hạng nhẹ khác có nhiều tham số hơn, cho thấy nó vượt quá trọng lượng của nó. Mặc dù dự đoán sẽ thiếu hàng tỷ mô hình tham số tỷ, nhưng hiệu suất của nó có khả năng cạnh tranh đáng kể về kích thước phân số của nó. Các thử nghiệm nội bộ trên Pixel 9 Pro cho thấy mô hình được định hướng bằng INT4 chỉ được sử dụng 0,75% pin của thiết bị cho 25 cuộc trò chuyện, khiến cho mô hình GEMMA tiết kiệm năng lượng nhất của Google. Nó cũng đảm bảo quyền riêng tư của người dùng, vì thông tin nhạy cảm có thể được xử lý cục bộ mà không bao giờ được gửi lên đám mây. Điều này cho phép các nhà phát triển chạy các mô hình ở độ chính xác Int4 với sự suy giảm hiệu suất tối thiểu, một tính năng quan trọng để triển khai phần cứng bị hạn chế tài nguyên. href=”https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d”Target=”_ blank”Khả năng tiếp cận rộng rãi này, được các nhà phát triển như Simon Willison ca ngợi, người đã gọi một bản phát hành Gemma trước đây là lần ra mắt ngày đầu tiên mà tôi đã thấy cho bất kỳ mô hình nào,”là chìa khóa để thúc đẩy một hệ sinh thái sôi động xung quanh các công cụ AI nhỏ hơn, thực tế hơn này.