Tencent i Kinës shkurton kërkesën e GPU-së duke iu drejtuar modeleve efikase të AI të Deepseek

Tencent thotë se po zvogëlon besimin e saj në GPU-të NVIDIA duke vendosur modele AI nga Deepseek që ofrojnë efikasitet më të lartë me më pak patate të skuqura-një ndërrim që kompania e përshkruan si një strategji të infrastrukturës afatgjatë që synon të zvogëlojë varësinë e harduerit dhe të përmirësojë shkallëzimin. href=”https://www.mitrade.com/insights/news/live-news/article-8-707313-20250320 Kanë qenë në gjendje të minimizojnë konsumin e GPU-së duke ruajtur prodhimin.”[T] ai industri dhe ne, brenda industrisë, po marrim produktivitet shumë më të lartë në një trajnim të modelit të madh të gjuhës nga GPU-të ekzistuese pa pasur nevojë të shtojmë GPU shtesë me ritmin e pritur më parë,”tha ekzekutivi. Ai shpjegoi më tej:

trendforce në raportin e tij të Chip-it H20-purchase . Sidoqoftë, loja e infrastrukturës po zhvendoset qartë nga zgjerimi i papërpunuar në optimizimin arkitektonik. Në shkurt, Openai prezantoi GPT-4.5, duke e quajtur atë modelin e tij më të madh dhe më të aftë deri më sot. Modeli.”

Modeli përmirësoi performancën në detyra shumëgjuhëshe dhe multimodale, por nuk arriti të tejkalojë modele më të vogla specifike të arsyetimit si O3-Mini në fusha të strukturuara si matematikë dhe logjikë shkencore. Kjo tregon se si qasja e Tencent-e përqendruar në efikasitetin e konkluzionit dhe modelet e përshtatura në vend-mund të qëndrojë si një strategji më e qëndrueshme. Një punim hulumtues i kohëve të fundit propozoi një metodë të quajtur”Shembull, shqyrtim dhe shkallë”, e cila përmirëson arsyetimin përmes vetë-verifikimit të konkluzionit. Ndërsa kjo rrit pjesën e sipërme të llogaritjes në kohën e funksionimit, ajo shmang kostot e tullumbaceve të modeleve masive para-trainimit dhe shihet si një qasje më e synuar për të përmirësuar detyrat e arsyetimit. Për Tencent, kjo ofron një rrugë për të shkallëzuar shërbimet e AI pa kapërcyer në inventarë të kufizuar ose të kufizuar të GPU. Microsoft kohët e fundit refuzoi një opsion GPU Cloud prej 12 miliardë dollarësh me Coreweave, i cili u mor në vend të kësaj nga Openai. Marrëveshja 11.9 miliardë dollarë përfshinte një aksion të kapitalit prej 350 milion dollarësh nga Openai përpara IPO të Coreweave. Kjo veprim lejon që Openai të diversifikojë burimet e saj llogaritëse përtej Microsoft Azure. Kompania gjithashtu po shkallëzon zgjerimin fizik. Microsoft anuloi qiratë e shumëfishta të Qendrës së të Dhënave AI, duke përfshirë një strukturë prej 3.3 miliardë dollarësh në Wisconsin, pasi u rishikuan parashikimet e kërkesës së brendshme. Analistët e TD Cowen vunë në dukje se projeksionet e azhurnuara të përdorimit të Openai luajtën një rol të madh në vendim. Strategjia e burimit Pas momentit”Sputnik”të Deepseek

Rritja e Deepseek gjithashtu përshtatet mjeshtërisht në strategjinë më të gjerë të AI të Kinës. Në përgjigje të kufizimeve të eksportit amerikan në patate të skuqura të përparuara, shumë firma të teknologjisë kineze po kthehen në burimin e hapur të modeleve të tyre.

Kjo qasje mundëson përsëritje më të shpejtë, inkurajon adoptimin global dhe zvogëlon koston e trajnimit. Për Tencent, adoptimi i modeleve më të hapura dhe me kosto të thellë të Deepseek përputhet me këto përparësi kombëtare dhe operacionale. Target=”_ bosh”>”Momenti Sputnik” Për industrinë e SHBA AI, me 1 trilion dollarë fshinë shkurtimisht vlerësimet e aksioneve të teknologjisë globale pas debutimit të tij. Zhvilluesit kinezë po ndërtojnë modele AI shumë të afta duke përdorur më pak patate të skuqura dhe më pak kapital-duke kontrolluar modelin tradicional të suksesit bazuar vetëm në shkallë dhe llogari.

Ka vërejtje. Tencent i është dashur të blejë sasi të mëdha të çipave H20 të NVIDIA për të ruajtur ofrimin e shërbimeve, pavarësisht zvogëlimit të përgjithshëm të përdorimit të GPU. Këto modele ende kërkojnë pajisje të fuqishme të backend-it, dhe aftësia e Kinës për të mbajtur furnizimin mbetet i pasigurt nën kufizimet e vazhdueshme të Sh.B.A.

Edhe kështu, strategjia e Tencent dërgon një sinjal të qartë. Efikasiteti, jo zgjerimi, po bëhet standardi i ri. Ndërsa kompanitë globale të teknologjisë vlerësojnë koston e shkallëzimit dhe brishtësinë e zinxhirëve të furnizimit, modelet si Deepseek R2 ofrojnë një plan të ndryshëm: më i vogël, më i zgjuar dhe ndoshta më i qëndrueshëm.

Tencent i Kinës shkurton kërkesën e GPU-së duke iu drejtuar modeleve efikase të AI të Deepseek

Published by All Things Windows on March 21, 2025

IT Info

Si të bllokoni qelizat në Excel nga redaktimi-Metoda më e thjeshtë

IT Info

Aktivizoni ndarjen e skedarëve tërheqës dhe pikë në Windows 11

IT Info

Shkelja e veprimit të GitHub ekspozon sekretet në qindra depo

Tencent i Kinës shkurton kërkesën e GPU-së duke iu drejtuar modeleve efikase të AI të Deepseek

Published by All Things Windows on March 21, 2025

Related Posts

IT Info

Si të bllokoni qelizat në Excel nga redaktimi-Metoda më e thjeshtë

IT Info

Aktivizoni ndarjen e skedarëve tërheqës dhe pikë në Windows 11

IT Info

Shkelja e veprimit të GitHub ekspozon sekretet në qindra depo