Zoomin luonnoksen ketju leikkaa päättely AI-kustannukset 90%

zoom-tutkijat ovat ottaneet käyttöön uuden kehotustekniikan nimeltä Draft Chain (COD), joka voisi perusteellisesti muuttaa sitä, kuinka keinotekoiset älykkyysmallit prosessin päättelytehtävät.

harkitsemalla uudelleen, kuinka AI tuottaa vastauksia, COD vähentää tunnuksen käyttöä jopa 92%: lla ja alentaa operatiivisia kustannuksia 90 prosentilla. Verbose-selityksiin luottamisen sijasta, kuten perinteisissä AI-päättelymalleissa nähdään, tämä menetelmä pakottaa AI: n rakenteellisen ja tehokkaan säilyttäen tarkkuuden.

Tämä läpimurto tapahtuu aikaan, jolloin suuret kielimallit (LLMS) kuluttavat kasvavia määriä laskentavoimaa, mikä tekee tehokkuudesta kasvavan huolen. src=”data: kuva/svg+xml; nitro-namty-id=mtcznto3njk=-1; base64, phn2zyb2awv3qm94psiwidagnzy3idqx NSIGD2LKDGG9IJC2NYIGAGVPZ2H0PSI0MTUIIHHTBG5ZPSJODHRWOI8VD3D3LNCZLM9YZY8YMYDAWL3N2ZYI+PC9ZDMC+”>

Kysymys on nyt, vaikuttavatko COD: n kaltaiset tekniikat laajempaan teollisuuteen, etenkin kun suuret toimijat, kuten Openai, Google, Microsoft ja muut, kohtaavat asennuspainetta leikkaamaan kustannuksia.

Kuinka luonnostoiminnan ketju

Suunniteltu parantamaan AI-perusteiden tehokkuutta vähentäen samalla laskennallista yleiskustannuksia. Se perustuu ajatusketjuun (pinnasänky), joka kannustaa suuria kielimalleja (LLM) jakamaan monimutkaiset ongelmat monivaiheisiksi selityksiksi. COD pyrkii ratkaisemaan nämä tehottomuudet täytäntöön minimalistisen lähestymistavan väliaikaisten päättelyvaiheiden suhteen.

COD: n perusperiaate on jäljitellä, kuinka ihmiset käsittelevät tietoja ratkaisemalla monimutkaisia ongelmia. Sen sijaan, että tuottaisi yksityiskohtaisia selityksiä jokaisessa vaiheessa, COD kehottaa mallia tuottamaan vain välttämättömiä välituloksia-sen mukaan, kuinka henkilö voisi kirjoittaa muutaman avainmuistiinpanon ongelman läpi. Tämä jäsennelty tiivistys antaa LLMS: lle mahdollisuuden ylläpitää loogista tarkkuutta vähentämällä dramaattisesti tarpeettomia merkkintuotantoja.

toisin kuin aiemmissa tehokkuus-ja focused-tekniikoissa, kuten Lähde: Lähde: Zoom

Symboliset päättelytehtävät, kuten kolikon kääntöennuste, testasi COD: n tehokkuutta erittäin jäsenneltyissä loogisissa tehtävissä. Arviointi vahvisti merkittäviä tehokkuusparannuksia. Qwen2.5: n (1,5B ja 3B), LLAMA 3.2 (3B) ja ZOOM-SLM (2,3B) tulokset korostavat merkitsevämpää suorituskykykuilua verrattuna pinnasänkyyn. src=”data: kuva/svg+xml; nitro-namty-id=mtc1nzoxmti1-1; base64, phn2zyb2awv3qm94psiwidagnzc0idyzniig D2LKDGG9IJC3NCIGAGVPZ2H0PSI2MZYIIHHTBG5ZPSJODHRWOI8VD3D3LNCZLM9YZY8YMAWL3N2ZYI+PC9ZDMC+”> Lähde: Lähde: Zoom

Nämä havainnot viittaavat siihen, että pienet mallit vaativat hienosäätöä COD-tyylisillä tiedoilla sen tehokkuusetujen hyödyntämiseksi kokonaan. Ilman sopeutumista tarkkuushäviö tulee voimakkaammaksi, rajoittaen COD: n välitöntä sovellettavuutta kevyisiin AI-järjestelmiin.

OpenAI säätää AI-mallistrategiaansa

, kun taas Zoomin kaltaiset yritykset pyrkivät tarkentamaan AI-tehokkuutta, OpenAi muuttaa parhaillaan mallikokoonpanoaan. Yhtiö ilmoitti 13. helmikuuta 2025 lopettavansa julkaisemattoman itsenäisen O3-mallinsa ja yhdistävänsä rakenteelliset päättelyominaisuudet GPT-5: ksi. GPT-5, siirtämällä tarkennus useista mallivaihtoehdoista virtaviivaisempaan AI-järjestelmään. Ennen sen julkaisua koodinimellä Orionin taustalla oleva malli oli odotettu julkaisevan nimellä GPT-5.

sen alihäiriöt verrattuna nykyaikaiseen päättelymalliin, kuten Openain O3-Mini, Grok 3, ja Claude 3.7 Sonnet näyttää vaikuttaneen tähän päätökseen. Microsoft otti ratkaisevan askeleen, joka painosti edelleen Openain liiketoimintamallia. Microsoft ilmoitti äskettäin, että sen Copilot-avustaja tarjoaa nyt Openain O3-mini-korkean ilmaisen, poistamalla palkkasewallin, joka oli aikaisemmin rajoitettu pääsy edistyneempaan päättelymalliin.

Ennen tätä muutosta Openain O3-mini-korkealla malli oli saatavana vain maksettujen tilaussuunnitelmien avulla. ansaitsee sen kaikkein kykenevimmät AI-mallit. Tämä muutos korostaa myös, miksi Zoomin COD: n kaltaiset tehokkuuden läpimurtot ovat yhä merkityksellisempiä.

DeepSeek liikkuu nopeasti haastaakseen Openai

, kun kilpailu AI-tilassa jatkoi voimistumista. Kiinan AI Lab Deepekek ilmoitti 26. helmikuuta 2025 kiihdyttävänsä R2-mallinsa julkaisua. Alun perin toukokuussa 2025 suunniteltu mallin lanseeraus siirrettiin torjumaan Openain, Alibaban ja Googlen hallitsevuutta. Yhtiö kuitenkin kohtaa haasteita kilpailun ulkopuolella.

Deepseekin yllättävän menestyksen jälkeen R1-päättelymallillaan muut kiinalaiset ovat ilmoittaneet varastoivan NVIDIA: n H20-prosessoreita, jotka johtuvat Yhdysvaltojen kaupan pakotteista, heijastaen korkean suorituskyvyn AI-sirujen hankkimisen kasvavia vaikeuksia.

Vaikka Openai ja Deepseek tarkentavat AI-perusstrategioitaan, muut yritykset keskittyvät erilaisiin kustannusten vähentämislähestymistapoihin.

Alibaba esitteli juuri QWQ-32B: n, avoimen lähdekoodin AI-mallin, joka on suunniteltu toimittamaan korkean suorituskyvyn päättely vähentyneellä laskennallisella kustannuksella. Julkaisu asettaa Alibaban suorana kilpailijana Openaille ja Deepseekille, etenkin yrityksille, jotka etsivät kohtuuhintaisia AI-ratkaisuja.

Amazonin on ilmoitettu myös saapuvan AI-tehokkuuskilpailuun, mutta sillä on erilainen strategia. Yhtiö kehittää NOVA AI: tä, omistusmallia, jonka odotetaan käynnistyvän kesäkuuhun 2025 mennessä.

Toisin kuin Alibaban avoimen lähdekoodin lähestymistapa, Amazon integroi Nova AI: n suoraan AWS: ään, vahvistaen AI-pilvipalveluita ja todennäköisesti juuri ilmoitettua maksettua suunnitelmaa AI: n voimankäyttöisen AI: n virallisen version, Alexa+. Yritykset kokeilevat erilaisia strategioita. Olipa COD: n jäsennelty kehotus, Deepseekin optimoidut mallit tai Alibaban kustannusystävälliset vaihtoehdot, AI-yritykset siirtyvät pelkän mallin koon ulkopuolelle ja keskittyvät pitkäaikaiseen tehokkuuteen. organisaatio malli konteksti parametrit (b) syöttö $/m lähtö $/m lisenssi gpqa mmLU mmLU Pro pudota HumanVal aime’24 Simplebench malli OpenAi O3128 000 –––-Omistus87,70%––––-O3 Antropic Claude 3,7 Omistettu84,80%86,10%–––– 80,00%46,4%Claude 3,7 Sonnet Xai GROK-3128 000 –––––-Omistus84,60%–79,90%–– 93,30%GROK-3 XAI GROK-3 MINI128 000 –––––-Omistuskylp. O3-MINI200 000– 1,10 dollaria 4,40 dollaria omistusoikeus 79,70%86,90%––– 86,50%22,8%O3-mii OpenAi O1-Pro128 000 –––––-Omistus 79,00%–––-86,00%O1-Pro OpenAI O1200 000– 15.00 dollaria 60,00 dollaria. Omistusoikeus78,00%91,80%– 88,10%83,30%40,1%o1 Google Gemini 2,0 Flash ajattelua1 000 000 ––––-Omistus 74,20%––––– 73,30%30,7%Gemini 2,0 Flash Ajattelu Openai O1-Preview128 000– 15,00 dollaria 60,00 dollaria 60,00 dollaria. Omistus 73,30%90,80%––– 44,60%41,7%O1-Preview Deepseek Deepseek-R1131 072671 0,55 dollaria 2,19 dollaria Open71,50%90,80%84,00%92,20%–79,80%30,9%syvä OpenAIGPT-4,5128 000 ––– Omistusoikeus71,4%90,0%– 88,0%36,7%34,5%GPT-4,5 Antropinen Claude 3,5 Sonnet200 000–3,00 dollaria 15,00 dollaria. Omistettu67,20%90,40%77,60%87,10%93,70%16,00%41,4%CLAUDE 377,5 Sonnet 37,5. QWQ-32B-PREVIEW32 76832,5 $ 0,15 0,20 dollaria Open65,20%–70,97%––-50,00%QWQ-32B-Preview Google Gemini 2,0 Flash1 048,576 –––––-Omistusluettelo 2,0%–76,40%– 35,5%18,9%. O1-MINI128 000–3,00 dollaria 12,00 dollaria OMISSA60,00%85,20%80,30%–92,40%70,00%18,1%O1-Mini Deepseek Deepseek-V3131,072671 dollaria 0,27 dollaria 1,10 dollaria. Gemini 1,5 PRO2 097,152-2,50 dollaria 10,00 dollaria omistusoikeus59,10%85,90%75,80%74,90%84,10%19,3%27,1%%1,5 Pro Microsoft PHI-416 00014,7 dollaria 0,07 dollaria 0,140%82,60%84,80%707,50%75,50%82,50%. GROK-2128 000–2,00 dollaria 10,00 dollaria omistusoikeus56,00%87,50%75,50%–88,40%22,7%GROK-2 OpenAI GPT-4O128 000–2,50 dollaria 10,00 dollaria omistettu 53,60%88,00%74,70%-17,8%GPT-4O Google GEMINI 1,5 dollaria FALSH1,048,576-0,15 dollaria-0,15 dollaria. 0,60 dollaria Omistettu51,00%78,90%67,30%–74,30%Gemini 1,5 Flash Xai GROK-2 MINI128 000 ––––-Omistusarvo51,00%86,20%72,00%–85,70%GROK-2 MINI Meta LLAMA 3.1 405B Instruct128000405 dollaria 0,90 dollaria 0,90 dollaria Open50,70%87,30%73,30%84,80%89,00%23,0%LLAMA 3,1 405B ohjaaja Meta Llaama 3,3 70B Instruct128 00070 0,20 dollaria 0,20 dollaria Open50,50%86,00%68,90%–88,40%19,9%llam 3,3 70B Soittimet. 75,00 dollaria OMINAISUUDET50,40%86,80%68,50%83,10%84,90%23,5%Claude 3 Opus Qwen Qwen2,5 32B Instruct131 07232,5–-Open49,50%83,30%69,00%–88,40%Qwen2,5 32B SPOUNT QWEN QWEN.8.5B, 72B Ohje131 07272,7 0,35 dollaria 0,40 dollaria Open49,00%–71,10%–86,60%23,30%Qwen2.5 72B ohjaaja OpenAi GPT-4 Turbo128 000–10,00 dollaria 30,00 dollaria. Proprietary48,00%86,50%–86,00%87.10%GPT-4 Turbo Amazon NOVA Pro300000-0,80 dollaria. Omistusoikeus46,90%85,90%–85,40%89,00%Nova Pro Meta Llaama 3,2 90B ohje128 00090 dollaria 0,35 dollaria 0,40 dollaria Open46,70%86,00%–––-LLAMA 3,2 90B SPORTUCT QWEN QWEN2,5 14B Ohje131 07214,7–-open45,50%79,70%63,70%–83,50%Qwen2,5 14B ohjaa Mistral Mistral Small 332 00024 dollaria 0,07 dollaria 0,14 dollaria Open45,30%–66,30%–84,80%Mistral Small 3 Qwen Qwen2 72b Ohjaaja131 07272–-Open42,40%82,30%64,40%–86,00%Qwen2 72B ohje Amazon Nova Lite300 000–0,06 dollaria 0,24 dollaria omistettu 42,00%80,50%–80,20%85,40%0,20 dollaria 0,20 dollaria 0,20 dollaria 0,20 dollaria 0,20 dollaria. Open41,70%83,60%66,40%79,60%80,50%LLAMA 3,1 70B Ohje Antropic Claude 3,5 Haiku200 000–0,10 dollaria 0,50 dollaria Omistustuomioistuin41,60%–65,00%83,10%88,10%Claude 3,5 $ 15.00 Omistettu40,40%79,00%56,80%78,90%73,00%Claude 3 Sonnet OpenAi GPT-4O MINI128 000–0,15 dollaria 0,60 dollaria omaisuus 40,20,20%82,00%–79,70%87,20%10,04 dollaria 0,14 dollaria. Omistettu40,00%77,60%–79,30%81,10%Nova Micro Google Gemini 1,5 Flash 8b1 048,5768 dollaria 0,07 dollaria 0,30 dollaria omaksuva38,40%–58,70%–– GEMINI 1,5 $ 8.00 $ 8.00 Open36,90%81,20%53,50%—– Jamba 1,5 Suuri Microsoft PHI-3,5-Moe-Instruct128 00060–-Open36,80%78,90%54,30%–70,70%PHI-3,5 Open36,40%–56,30%–84,80%Qwen2,5 7B ohje Xai GROK-1,5128 000 ––– Omistus 35,90%81,30%51,00%–74,10%GROK-1,5 OpenAI GPT-432 768–30,00 dollaria 60,00 dollaria 60,00 dollaria Omistus 35,70%86,40%–80,90%67,00%25,1%GPT-4 Antropic Claude 3 haiku200 000–0,25 dollaria 1,25 dollaria omaisuus 33,30%75,20%–78,40%75,90%CLAUDE 3 HAIKU Meta Llaama 3,2 11B SPOUNT12800010.6 $ 0.06 Open32,80%73,00%–––– LLAMA 3,2 11B ohjeet Meta Llaama 3,2 3B ohje128 0003,2 dollaria 0,01 dollaria 0,02 dollaria Open32,80%63,40%–––––––––-LLAMA 3,2 3B ohje AI21 JAMBA 1 OpenAI GPT-3,5 Turbo16,385–0,50 dollaria 1,50 dollaria Omistus 30,80%69,80%–70,20%68,00%GPT-3,5 Turbo Meta Llaama 3,1 8B ohjaaja131 0728 dollaria 0,03 dollaria 0,03 dollaria Open30,40%69,40%48,30%59,50%72,60%LLAMA 3,1 PHI-3,5-min-instruktrakki128 0003,8 $ 0,10 0,10 dollaria Open30,40%69,00%47,40%–62,80%phi-3,5-min-instruktio Google Gemini 1,0 Pro32 760–0,50 dollaria 1,50 dollaria proprietary27,90%71,80%– – –-gemini 1,0 Pro Qwen2 7b. Ohjaaja131 0727,6–-avoin25,30%70,50%44,10%–– qwen2 7b ohjaaja Mistral CodeStral-22B32 76822,2 $ 0,20 0,60 dollaria Open –––––-81,10%Codestraal-22B CORE-komento r+ 128 000104 $ 0,25 dollaria 1,00 dollaria avoin-75,70%– 17,4%. Deepseek-V2.58,192236 $ 0,14 0,28 dollaria avoimia-80,40%– 89,00%Deepseek-V2.5 Google Gemma 2 27B8,19227,2–-Open-75,20%-51,80%Gemma 2 27b Google Gemma 2 9B8,1929,2-open-71,30%-40,20%GEMMA 299.29.29-7. GROK-1.5V128 000 –––-Omistettu ––––––-Grok-1.5v Moonshotai Kimi-K1.5128 000 –––––-87,40%–––– Kimi-K1.5 Nvidia Llaama 3,1 Nemotron 70B Instruct128 00070–-Open-80,20%–-llama 3.1 Mistral ministral 8b ohje128 0008 0,10 dollaria 0,10 dollaria avoimia-65,00%– 34,80%ministral 8b ohjeet mistral mistral Suuri 2128 000123 2,00 dollaria 6,00 dollaria avointa-84,00%-92,00%22,5%Mistral Suuri 0,15 dollaria Open–68.00%–––Mistral NeMo Instruct mistral Mistral Small32,76822$0.20 $0.60 Open–––––Mistral Small microsoft Phi-3.5-vision-instruct128,0004.2––Open–––––Phi-3.5-vision-instruct mistral Pixtral-12B128,00012.4$0.15 $0.15 Avoin-69,20%– 72,00%Pixtral-12B Mistral Pixtral LIARC128 000124 2,00 dollaria 6,00 dollaria avoimia ––––––––––––––––––––––––-pikstral Large Qwen Qvq-72B-Preview32 76873,4–-Open–qvq-72b-Prewen Qwen –––––––––––––––-qvq-72b-Prewen Qwen Qwen2.5-koodi 32b Ohjaaja128 00032 dollaria 0,09 dollaria 0,09 dollaria Open-75,10%50,40%–92,70%Qwen2.5-kooderi 32B ohje Qwen Qwen2.5-kooderi 7B ohje128 0007–-Open-67,60%40,10%–88,40%Qwen2,5-kooderi 7B ASTURTTI QWEN QWEN2-VL-72B-Instruct32 76873,4–-avoin ––––– qwen2-vl-72b-instruktio

Zoomin luonnoksen ketju leikkaa päättely AI-kustannukset 90%

Published by All Things Windows on March 9, 2025

Kuinka luonnostoiminnan ketju

OpenAI säätää AI-mallistrategiaansa

DeepSeek liikkuu nopeasti haastaakseen Openai

IT Info

Piilota viimeaikainen mobiilisisältö Windows 11 Start-valikossa

IT Info

Piilota mobiililaitteen ilmoitusmerkit Windows 11-valikossa

IT Info

Kiinan uusi autonominen AI-agentti Manus voi olla seuraava DeepSekek-hetki

Zoomin luonnoksen ketju leikkaa päättely AI-kustannukset 90%

Published by All Things Windows on March 9, 2025

Kuinka luonnostoiminnan ketju

OpenAI säätää AI-mallistrategiaansa

DeepSeek liikkuu nopeasti haastaakseen Openai

Related Posts

IT Info

Piilota viimeaikainen mobiilisisältö Windows 11 Start-valikossa

IT Info

Piilota mobiililaitteen ilmoitusmerkit Windows 11-valikossa

IT Info

Kiinan uusi autonominen AI-agentti Manus voi olla seuraava DeepSekek-hetki