ai következtetés Az indítás a GROQ agresszív kampányt indított, hogy megtámadja a felhő óriásainak, például az Amazon Web Services és a Google dominanciáját, és speciális nagysebességű feldolgozási technológiáját közvetlenül a fejlesztők millióinak elérhetővé teszi az átölelő arcplatformmal való új partnerség révén. A lépés célja az AI táj átalakítása azáltal, hogy széles körben hozzáférést biztosít a gyorsabb, alacsonyabb költségű következtetéshez, amely kritikus szakasz a mesterséges intelligencia alkalmazások telepítésében. Face , az AI fejlesztők és kutatók központi csomópontja. A képességeinek bemutatása érdekében a GROQ most olyan fejlett modelleket futtat, mint az Alibaba QWEN3 32B, támogatva a modell teljes 131 000-es kontextusablakát nagy sebességgel. Ezt a technikai feat-t, amely lehetővé teszi a teljes dokumentumok valós időben történő elemzését, úgy tervezték, hogy egyértelmű teljesítmény-előnyt mutatjon be az általános célú hardverhez képest, amely alátámasztja a legtöbb fő felhőajánlatot. A vállalatok közös nyilatkozata kiemelte a célt, kijelentve: „Az Face és a GROQ közötti együttmûködés jelentős előrelépés a nagy teljesítményű AI-következtetések hozzáférhetőbbé és hatékonyabbá tételében.”

Azáltal, hogy beágyazza a technológiáját, ahol a fejlesztők már dolgoznak, a GROQ azt fogadja, hogy 2030-ra várhatóan jelentős piaci részesedést képes kiszámítani egy ágazatban, amelynek várhatóan több mint 154 milliárd dollárt ér. href=”https://groq.com/wp-content/uploads/2024/07/groqthouthts_whatisalpu-vf.pdf”Target=”_ blank”> Egyedi-Built nyelvfeldolgozó egység (LPU) architektúra , egy chip, amelyet az AI igényeinek igényeire terveztek. A sokoldalúbb GPU-val ellentétben, amely az AI ipar nagy részét táplálja, a GROQ LPU-ja alapvetően eltérő formatervezésű, amely a kiszámítás és a memória együttes helyét és memóriáját helyezi el a chipen. Ez kiküszöböli a külső memória sávszélességű szűk keresztmetszeteket, amelyek akadályozhatják a GPU teljesítményét a szekvenciális, nyelvi alapú feladatokban.

Ez a speciális megközelítés figyelemre méltó teljesítményt nyújt. Független benchmarking cég A mesterséges elemzés megerősítette, hogy a GROQ a QWEN3 32B modell telepítése kb. 535 token/másodperc. A társaság hangsúlyozta, hogy ez a sebesség nem a képesség költségén áll, azt állítva, hogy ez az egyetlen gyors következtetési szolgáltató, amely lehetővé teszi a fejlesztők számára, hogy a „termelési szintű munkaterheléseket, nem csak a POC-kat” készítsék a modell teljes kontextusú ablakával. A fejlesztők a Groqcloud API-n keresztül hozzáférhetnek a modellhez a QWEN/QWEN3-32B azonosító segítségével. A sebesség és az alacsony költségek kombinációja egy kényszerítő értékjavaslatot jelent egy olyan piacon, amelyet gyakran magas számítási költségek jellemeznek. A vállalati döntéshozók számára azonban egy kisebb, speciálisabb szolgáltatóra támaszkodva lehetséges kockázatokkal jár az ellátási lánc stabilitása és a hosszú távú támogatás szempontjából, összehasonlítva az Amazon, a Google és a Microsoft bevált globális infrastruktúrájával. 

E kihívások ellenére a GROQ továbbra is magabiztos, egy szóvivője megjegyezve, hogy még ha a vállalat is megduplázza a tervezett infrastruktúrát, „még mindig nem lenne elegendő képesség a kereslet kielégítésére.”

stratégiai szövetségek az ökoszisztéma növekedése számára

míg a műszaki benchmarks, a leginkább a Groq-tól, a Groq-nak a leginkább a GROQ-t. A fejlesztői ökoszisztéma. A Face-vel való partnerség egy átalakító stratégiai lépés, amely átjárót biztosít a fejlesztők millióinak. Azáltal, hogy a fejlesztőkkel egy olyan platformon, amelyet már használnak, a GROQ jelentősen csökkenti a technológia belépésének akadályát, ezt a stratégiát, amely szerint a vállalat szóvivője szerint a választást és felgyorsítja az örökbefogadást. növekvő számú optimalizált modell. Az együttműködés célja egy lendkerék-hatás létrehozása: Mivel egyre több fejlesztő kísérletezik a GROQ sebességével, a speciális hardver iránti igény növekedhet, tovább fokozva annak terjeszkedését és képességét, hogy megtámadja az inkumbens szolgáltatókat.

Szaúd-Arábia törekvései. Februárban a társaság 1,5 milliárd dolláros befektetési megállapodást kötött a Kingdom-val, amelynek célja a Szaúd-Arábia Vision 2030-as tervének előmozdítása a gazdaság diverzifikálására és a globális technológiai hatalommá vált. A GROQ ma a Humain, Szaúd-Arábia új állami tulajdonú AI entitása, amely több milliárd dolláros sértő végrehajtást hajt végre a szuverén AI ökoszisztéma felépítésére. Ez tükrözi az AI hardver táj árnyalt megértését, ahol különböző eszközöket használnak különböző munkákhoz. Ezt az érzetet Jensen Huang, az NVIDIA vezérigazgatója, aki az AI infrastruktúrát elengedhetetlennek nevezte minden olyan nemzet számára, amely a modern gazdaságban versenyezni szeretne. Egyedülálló LPU architektúrájának kihasználásával, kritikus szövetségek kidolgozásával a fejlesztői platformokkal, valamint a hatalmas pénzügyi és geopolitikai támogatás biztosításával a vállalat hiteles kihívást jelentett a megállapított rendhez. dominancia.

Categories: IT Info