Ang

Ang Google ay ganap na pinakawalan ang Gemma 3N, isang bagong henerasyon ng mga open-source na artipisyal na mga modelo ng intelihensiya na ininhinyero upang magdala ng malakas na kakayahan ng multimodal nang direkta sa mga aparato ng consumer. Sa isang makabuluhang paglipat upang i-democratize ang advanced na AI, ang mga modelong ito ay maaaring magproseso ng mga imahe, audio, at mga video input upang makabuo ng teksto habang nagpapatakbo sa hardware na may kasing liit ng memorya ng 2GB, na epektibong hindi nababago ang kumplikadong AI mula sa ulap.

Ang paglabas, na detalyado sa isang Opisyal na gabay ng developer , nagpapakilala ng isang”mobile-first”pamilya ng mga modelo na nakatayo sa kabaligtaran sa mas malaki, proprietary gemini system. Ang mga bagong modelo ay magagamit sa dalawang pangunahing sukat, E2B at E4B, na gumagamit ng mga makabagong arkitektura upang tumakbo na may isang bakas ng memorya na maihahambing sa mas maliit na mga modelo. Ang pagbagsak ng kahusayan na ito ay nangangahulugang ang mga developer ay maaari na ngayong magtayo at mag-deploy ng sopistikado, offline na may kakayahang AI na mga aplikasyon sa isang malawak na hanay ng pang-araw-araw na hardware, mula sa mga smartphone hanggang sa mga laptop. Ang buong paglabas ay nagpapatibay sa pagtulak ng Google upang bigyan ng kapangyarihan ang pamayanan ng developer na may mga tool na dati nang domain ng mga malalaking sentro ng data, sa panimula na nagbabago kung sino ang maaaring magtayo ng pagputol ng ai. Ang Arkitektura ng Pag-access

Ipinakikilala ng Google kung ano ang tinatawag na matformer, o matryoshka transpormer, arkitektura , na mas maliit, ganap na mga modelo ng functional sa loob ng isang mas malaki. Pinapayagan nito ang mga developer na mag-deploy ng isang spectrum ng mga sukat ng modelo na naayon sa mga tiyak na mga hadlang sa hardware, kasama ang Google na nagbibigay ng isang matformer lab Upang matulungan ang pagkilala sa pinakamainam na mga pagsasaayos. Ang makabagong ito ay nagbibigay-daan sa isang malaking bahagi ng mga parameter ng modelo na maproseso sa pangunahing CPU ng isang aparato, na binabawasan ang dami ng memorya ng memorya ng accelerator (VRAM) na kinakailangan. Gumagamit din ang arkitektura ng pagbabahagi ng KV cache, na inaangkin ng kumpanya na doble ang bilis ng paunang pagproseso. Ang diskarte sa ekosistema na ito ay lilitaw na isang pangunahing bahagi ng dalawahan na diskarte ng kumpanya sa pag-unlad ng AI. Ayon sa isang pakikipanayam sa venturebeat Sa Google Product Manager Priya Singh, ang kumpanya ay tiningnan ang bukas at sarado na mga modelo bilang pagkakaroon ng isang simbolikong relasyon. Hindi nakikita ng Google sina Gemma at Gemini bilang mga kakumpitensya, higit pang dalawang panig ng parehong barya. Sinusuri ng kumpanya kung ano ang itinatayo ng mga developer kasama si Gemma upang matukoy kung saan pupunta sa susunod na may Frontier Research. Kasama dito ang TXGEMMA, isang suite ng mga tool para sa pagtuklas ng droga na itinayo sa naunang arkitektura ng Gemma 2, at ang lubos na dalubhasang dolpingemma. Ang huli ay isang natatanging pakikipagtulungan sa The Wild Dolphin Project upang pag-aralan ang mga dekada ng mga pag-record ng dolphin, sinusubukan na makahanap ng mga pattern sa komunikasyon ng hayop-isang gawain na nagtutulak sa mga hangganan ng aplikasyon ng AI. sigasig para sa agarang kakayahang magamit nito. Pinuri ng independiyenteng developer na si Simon Willison ang komprehensibong katangian ng pagpapalaya, na tinatawag itong”Gemma 3N din ang pinaka-komprehensibong araw ng isang paglulunsad na nakita ko para sa anumang modelo.”Sa pagsubok ng hands-on detalyado sa kanyang blog , binigyang-diin ni Willison ang malawak, araw-isang suporta mula sa mga sikat na tool tulad ng Ollama at MLX. Habang matagumpay niyang ginamit ang isang bersyon ng modelo para sa transkripsyon ng audio, nabanggit din niya ang ilang mga paunang quirks, na may modelo na hindi pagtupad ng tama na ilarawan ang isang imahe na nabuo lamang nito. Target=”_ Blank”> Gemma 3N Impact Hamon , isang kumpetisyon na may $ 150,000 sa mga premyo para sa mga nag-develop na gumagamit ng mga bagong modelo upang makabuo ng mga produkto para sa kabutihan ng lipunan. Nagtatampok ang mga modelo ng isang advanced na audio encoder batay sa unibersal na modelo ng pagsasalita (USM) ng kahusayan at kapangyarihan ay nagbunga ng mga kahanga-hangang resulta sa mga leaderboard. Ang mas malaking variant ng Gemma 3N E4B ay ang unang modelo sa ilalim ng 10 bilyong mga parameter upang makamit ang isang marka ng Lmarena na higit sa 1300, isang benchmark na sumusukat sa pagganap batay sa mga kagustuhan ng tao.

Sa pamamagitan ng engineering isang malakas na modelo ng multimodal na maaaring mabuhay sa mga aparato na ginagamit ng mga tao araw-araw, ang Google ay hindi lamang naglalabas ng isang bagong tool ngunit gumagawa ng isang malinaw na pahayag. Ang paglipat ay naghahamon sa paniwala na ang paggupit ng AI ay dapat na manirahan nang eksklusibo sa ulap, na nagbibigay kapangyarihan sa isang bagong alon ng mga nag-develop upang mabuo ang susunod na henerasyon ng matalino, pribado, at naa-access na mga aplikasyon.