AI Chip Unicorn Groq ay nag-chart ng isang pangunahing pandaigdigang pagpapalawak matapos na makakuha ng isang bagong $ 750 milyong pondo ng pagpopondo na pinalakas ang pagpapahalaga nito sa $ 6.9 bilyon. href=”https://www.wsj.com/business/ai-unicorn-groq-charts-data-center-expansion-plan-5d6a130e”target=”_ blangko”> higit sa isang dosenang mga bagong sentro ng data sa susunod na taon Ang mga madiskarteng pakikipagsosyo, kabilang ang isang malalim na alyansa sa pambansang AI Entity ng Saudi Arabia, humain, at isang pagsasama sa platform ng developer na yakap sa mukha. Ang agresibong pagtulak upang hamunin ang mga itinatag na manlalaro tulad ng NVIDIA sa pamamagitan ng pag-alok ng dalubhasang, mas mababang halaga ng hardware. imprastraktura na naghahatid nito nang may mataas na bilis at mababang gastos.”href=”https://groq.com/newsroom/groq-raises-750-million-as-inference-demand-surges”target=”_ blangko”> Blackrock at Deutsche Telekom Capital Partners .
Ang pinansiyal na momentum ay mahalaga habang ang kumpanya ay humuhugot ng imprastraktura nito. Gayunpaman, ang landas ay hindi walang mga hamon. Nauna nang nabanggit ng isang tagapagsalita na kahit na may dobleng imprastraktura,”Hindi pa rin sapat ang kapasidad upang matugunan ang demand ngayon.”Napakahusay na alyansa. Ang pagsasama na ito ay ginagawang groq isang opisyal na nagbibigay ng inference sa platform . Ang pag-back ay nagmula sa Saudi Arabia, na natapos ang isang $ 1.5 bilyong kasunduan sa pamumuhunan noong Pebrero 2025. Ang pakikipagsosyo na ito ay ginagawang GROQ na isang pangunahing tagapagbigay ng teknolohiya para sa Humain, ang bagong pag-aari ng estado ng AI. Nagtatayo ito sa mga naunang pakikipagtulungan, kabilang ang isang 2024 na proyekto kasama ang ARAMCO upang magtatag ng isang AI Data Center, na nagsilbing isang maagang pagsubok na lugar para sa teknolohiya ng GROQ sa rehiyon. Sa pamamagitan ng pag-secure ng pag-access sa teknolohiyang cut-edge ng US chip, ang kaharian ay naglalayong bumuo ng isang may kapangyarihan na kakayahan sa AI, isang layunin na sentro ng multi-bilyon-dolyar na plano sa imprastraktura.
Ito ay sumasalamin sa isang nuanced na pag-unawa sa hardware landscape. Binibigyang diin ng HUMAIN CEO TAREQ AMIN ang pagkadalian, na nagsasabing,”Ang mundo ay nagugutom para sa kapasidad. Mayroong dalawang mga landas na maaari mong gawin: dadalhin mo ito nang mabagal at tiyak na hindi namin ito mabagal, o mabilis kang pumunta.”
href=”https://groq.com/lpu-architecture”target=”_ blangko”> arkitektura ng pagproseso ng wika (LPU) . Hindi tulad ng maraming nalalaman GPU na kapangyarihan ng karamihan sa industriya ng AI, ang mga LPU ay partikular na idinisenyo para sa mga hinihingi ng AI inference, co-locating compute at memorya sa chip. Habang ang mga matatandang modelo ay nakakabit, ang mga modernong transformer ay nakagapos ng memorya. Ang arkitektura ng GROQ ay isang direktang mapagpipilian sa bagong katotohanan na ito. Ang independiyenteng firm na artipisyal na pagsusuri ay nakumpirma ang pag-deploy ng GROQ ng Alibaba’s QWEN3 32B na modelo ay tumatakbo ng humigit-kumulang na 535 token bawat segundo. Nag-aalok ang kumpanya ng pag-access sa malakas na modelo ng QWEN3 32B sa $ 0.29 bawat milyong mga token ng input at $ 0.59 bawat milyong mga token ng output, isang nakapipilit na rate na idinisenyo upang masira ang mga incumbent cloud provider. Nakakahimok na halaga ng panukala laban sa mga serbisyo tulad ng AWS Bedrock at Google Vertex AI. Ang mga startup tulad ng ay pinapasok din ang fray Ang mga disenyo ng unang memorya. Kinilala din ng CEO Jensen Huang Lahi.