Google已完全發布了Gemma 3N,這是一種新一代的開源人工智能模型,該模型旨在將功能強大的多模式功能直接帶給消費者設備。為了使高級AI民主化,這些模型可以處理圖像,音頻和視頻輸入,以生成文本,同時在硬件上以2GB的記憶力進行操作,從而有效地從雲中解開了複雜的AI。

發行href=“ https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/” target=“ _ black”>官方開發人員指南,與Google較大的,較大的,較大的,專有的專家組成的模型一起引入了“移動- first”模型家族。新型號有兩種主要尺寸E2B和E4B,它們使用架構創新與可與較小型號相當的內存足跡運行。這種效率突破意味著開發人員現在可以在各種日常硬件上建立和部署複雜的,具有離線功能的AI應用程序,從智能手機到筆記本電腦。

在Google I/O上​​​​發布了發布會,並代表了今年早些時候開始的策略的高潮。完整版本鞏固了Google的推動,以增強開發人員社區的能力,這些工具以前是大規模數據中心的領域,從根本上改變了誰可以使用尖端的AI構建。

<2-firm>可訪問性的建築

是Gemma 3N效率的核心構建是一種新穎的建築,從頭開始設計,以進行設備的性能。 Google正在介紹所謂的 attryshka變壓器,架構,在更大的模型中築巢的模型較小,完全觸手可及。這使開發人員可以部署針對特定硬件約束的模型尺寸,並且Google提供a Matherformer Lab 幫助確定最佳配置。這種創新允許在設備的主CPU上處理模型參數的很大一部分,從而大大減少了所需的高速加速器內存(VRAM)的量。該架構還使用KV緩存共享,該公司聲稱最初處理的速度翻倍。

[嵌入式內容]

“ gemmaverse”和Google的開放策略

gemma 3n不是獨立的產品,而是越來越多的google cons of gemma calling gemma call’gemma call”這種生態系統策略似乎是該公司雙管AI開發方法的核心部分。根據 venturebeat訪談與Google產品經理Priya Singh,公司的開放式和封閉的模型相關關係,是與穀歌產品經理的訪談 Google不認為Gemma和Gemini是競爭對手,而是同一枚硬幣的兩個方面。該公司分析了開發人員與Gemma建立的內容,以確定在Frontier Research的下一步。

在過去一年中發布的各種專業的,Gemma品牌的模型中,這種策略很明顯。其中包括Txgemma,這是一套基於先前的Gemma 2建築建立的藥物發現工具,以及高度專業的海豚。後者是與野生海豚項目的獨特合作,用於分析數十年的海豚錄製,試圖在動物交流中找到模式,這項任務推動了AI應用的界限。

a開發人員的觀點:powers powers實用

在他的博客上詳細介紹 Willison,Willison強調了來自Ollama和Mlx等流行工具的廣泛支持。 While he successfully used one version of the model for audio transcription, he also noted some initial quirks, with the model failing to correctly describe an image it had just generated.

To further spur this kind of community engagement, Google has launched the Gemma 3n Impact Challenge, a competition with $150,000 in prizes for developers who use the new models to build products for social good.

Measuring Up: Multimodality and Market Competition

The architectural gains and developer-friendly features are backed by strong performance and new capabilities. The models feature an advanced audio encoder based on the Universal Speech Model (USM) and a new state-of-the-art vision encoder, MobileNet-V5, which can process video at up to 60 frames per second on a Google Pixel device.

This combination of efficiency權力在排行榜上取得了令人印象深刻的成績。 The larger Gemma 3n E4B variant is the first model under 10 billion parameters to achieve an LMArena score of over 1300, a benchmark that measures performance based on human preferences.

This path to on-device power began with the initial debut of the Gemma 3 series in March, whose larger models were made practical for local use by a subsequent release of specially optimized versions of its Gemma 3 family in April.

通過工程設計一個強大的多模型模型,該模型可以在人們每天使用的設備上使用,Google不僅要發布新工具,而且還清楚地說明了。此舉挑戰了以下觀點:尖端AI必須僅存在雲中,賦予新一波開發人員的能力,以構建下一代智能,私人和可訪問的應用程序。

Categories: IT Info