Fillimi i Konkluzionit të AI Groq ka filluar një fushatë agresive për të sfiduar mbizotërimin e gjigandëve të cloud si Amazon Web Services dhe Google, duke e bërë teknologjinë e tij të specializuar të përpunimit me shpejtësi të lartë drejtpërdrejt në dispozicion të miliona zhvilluesve përmes një partneriteti të ri me platformën Hugging Face. Masa synon të riformulojë peizazhin e AI duke siguruar qasje të gjerë në konkluzion më të shpejtë, me kosto më të ulët, një fazë kritike në vendosjen e aplikacioneve të inteligjencës artificiale. Përballë , një qendër qendrore për zhvilluesit dhe studiuesit e AI. Për të shfaqur aftësitë e saj, Groq tani po ekzekuton modele të përparuara si QWEN3 32B të Alibaba, duke mbështetur të gjithë dritaren e kontekstit të modelit 131,000 me shpejtësi të lartë. Ky feat teknik, i cili lejon analizën e të gjithë dokumenteve në kohë reale, është krijuar për të demonstruar një avantazh të qartë të performancës mbi pajisjen me qëllime të përgjithshme që nënvizon ofertat më të mëdha të cloud. Një deklaratë e përbashkët nga kompanitë theksoi qëllimin, duke thënë,”Ky bashkëpunim midis përqafimit të fytyrës dhe groQ është një hap domethënës përpara për të bërë konkluzione të AI me performancë të lartë më të arritshme dhe efikase.”
Duke ngulitur teknologjinë e saj ku zhvilluesit tashmë punojnë, Groq po bastet se mund të krijojë një pjesë të konsiderueshme të tregut në një sektor të parashikuar të jetë me vlerë mbi 154 miliardë dollarë deri në vitin 2030. href=”https://groq.com/wp-content/uploads/2024/07/groqthoughts_whatisalpu-vf.pdf”target=”_ bosh”> njësia e përpunimit të gjuhës me porosi (LPU) arkitekturë , një chip i dizajnuar në mënyrë specifike për kërkesat e konfuzionut të AI. Për dallim nga GPU-të më të gjithanshme që fuqizojnë pjesën më të madhe të industrisë së AI, LPU-të e Groq posedojnë një dizajn thelbësisht të ndryshëm që bashkë-lokon llogarit dhe kujtesë në çip. Kjo eliminon shishet e gjerësisë së bandës së kujtesës së jashtme që mund të pengojnë performancën e GPU-së në detyra sekuenciale, të bazuara në gjuhë.
Kjo qasje e specializuar jep performancë të jashtëzakonshme. Analizë artificiale e krahasimit të pavarur konfirmoi që vendosja e Groq-it të modelit QWEN3 32B shkon në afërsisht 535 shenja në sekondë. Kompania ka theksuar se kjo shpejtësi nuk vjen në koston e aftësisë, duke pretenduar se është i vetmi ofrues i konkluzionit të shpejtë që lejon zhvilluesit të ndërtojnë”ngarkesa të punës të nivelit të prodhimit, jo vetëm POC”me dritaren e plotë të kontekstit të modelit. Zhvilluesit mund të hyjnë në model përmes API GroqCloud duke përdorur identifikuesin QWEN/QWEN3-32B. Ky kombinim i shpejtësisë dhe kostos së ulët paraqet një propozim të vlerës bindëse në një treg që shpesh karakterizohet nga shpenzime të larta të llogaritjes. Sidoqoftë, për vendimmarrësit e ndërmarrjeve, duke u mbështetur në një ofrues më të vogël, më të specializuar prezanton rreziqe të mundshme në lidhje me stabilitetin e zinxhirit të furnizimit dhe mbështetjen afatgjatë në krahasim me infrastrukturën e vendosur globale të Amazon, Google dhe Microsoft.
Përkundër këtyre sfidave, Groq mbetet i sigurt, me një zëdhënës duke theksuar se edhe nëse kompania dyfishonte infrastrukturën e saj të planifikuar,”Ende nuk do të ketë kapacitet të mjaftueshëm për të përmbushur kërkesën sot.”ekosistem. Partneriteti me Hugging Face është një veprim strategjik transformues që siguron një hyrje për miliona zhvillues. Duke takuar zhvilluesit në një platformë që ata përdorin tashmë, Groq po ul ndjeshëm pengesën për hyrjen për teknologjinë e saj, një strategji që një zëdhënës i kompanisë tha se zgjat zgjedhjen dhe përshpejton adoptimin. një numër në rritje i modeleve të optimizuara. Bashkëpunimi synon të krijojë një efekt fluturues: Ndërsa më shumë zhvillues eksperimentojnë me shpejtësinë e Groq, kërkesa për pajisjen e tij të specializuar mund të rritet, duke nxitur më tej zgjerimin dhe aftësinë e tij për të sfiduar detyrat. Arabia Saudite. Në shkurt, kompania përfundoi një marrëveshje investimi prej 1.5 miliardë dollarësh me Mbretërinë, një marrëveshje e krijuar për të çuar përpara planin e Vision 2030 të Arabisë Saudite për të diversifikuar ekonominë e saj dhe për t’u bërë një fuqi globale e teknologjisë.
Kjo marrëdhënie ka evoluar në një partneritet thelbësor strategjik. Groq tani është një ofrues kryesor i teknologjisë për Humain, entiteti i ri shtetëror i Arabisë Saudite AI që po ekzekuton një ofensivë shumë miliardë dollarëshe për të ndërtuar një ekosistem sovran AI. Kjo pasqyron një kuptim të nuancuar të peizazhit të harduerit AI, ku përdoren mjete të ndryshme për punë të ndryshme. Ky ndjenjë u bë jehonë nga Drejtori i Përgjithshëm i NVIDIA Jensen Huang, i cili e ka quajtur AI infrastrukturë thelbësore për çdo komb që kërkon të garojë në ekonominë moderne. Duke shfrytëzuar arkitekturën e saj unike të LPU-së, duke krijuar aleanca kritike me platformat e zhvilluesve, dhe duke siguruar një mbështetje të fuqishme financiare dhe gjeopolitike, kompania ka ngritur një sfidë të besueshme për rendin e vendosur. Dominimi.