AI Chip Unicorn Groq mencatatkan pengembangan global utama setelah memperoleh pusingan pembiayaan baru $ 750 juta yang meningkatkan penilaiannya kepada $ 6.9 bilion.

Permulaan yang berpangkalan di A.S. merancang untuk menubuhkan Lebih daripada sedozen pusat data baru Perkongsian strategik, termasuk persekutuan yang mendalam dengan entiti AI kebangsaan Arab Saudi, humain, dan integrasi dengan platform pemaju yang memeluk muka. Isyarat menolak agresif untuk mencabar pemain yang ditubuhkan seperti Nvidia dengan menawarkan perkakasan yang khusus dan kos rendah. Infrastruktur Amerika yang menyampaikannya dengan kelajuan tinggi dan kos rendah.”href=”https://groq.com/newsroom/groq-raises-750-million-as-inference-demand-surges”sasaran=”_ black”> Blackrock dan deutsche Telekom Capital Partners Keyakinan.

Momentum kewangan adalah penting kerana syarikat itu menstabilkan infrastrukturnya. Walau bagaimanapun, jalan itu bukan tanpa cabaran.

Dilaporkan pada bulan Julai bahawa Groq telah menyemak ramalan pendapatan 2025 dari lebih daripada $ 2 bilion hingga $ 500 juta, satu langkah yang menyoroti volatiliti pasaran perkakasan AI. Seorang jurucakap yang sebelum ini menyatakan bahawa walaupun dengan infrastruktur dua kali ganda,”masih tidak ada keupayaan yang mencukupi untuk memenuhi permintaan hari ini.”Integrasi ekosistem dan pakatan yang kuat.

Pergerakan transformatif datang pada bulan Jun apabila syarikat itu bekerjasama dengan Hugging Face, hab pusat bagi pemaju AI. Integrasi ini menjadikan groq a Pembekal kesimpulan rasmi di platform . Backing berasal dari Arab Saudi, yang memuktamadkan perjanjian pelaburan $ 1.5 bilion pada bulan Februari 2025. Perkongsian ini menjadikan Groq sebagai penyedia teknologi utama untuk Humain, entiti AI milik kerajaan yang baru. Ia membina kerjasama terdahulu, termasuk projek 2024 dengan Aramco untuk menubuhkan pusat data AI, yang berfungsi sebagai tempat ujian awal untuk teknologi Groq di rantau ini. Dengan mendapatkan akses kepada teknologi cip AS yang canggih, Kerajaan bertujuan untuk membina keupayaan AI yang berdaulat, satu matlamat yang penting untuk pelan infrastruktur berbilang dolar.

Ini mencerminkan pemahaman yang bernuansa tentang landskap perkakasan. Ketua Pegawai Eksekutif Humain Tareq Amin menekankan dengan segera, berkata,”Dunia lapar untuk kapasiti. Terdapat dua jalan yang boleh anda ambil: anda mengambilnya perlahan dan kami pasti tidak mengambilnya perlahan, atau anda pergi dengan cepat. href=”https://groq.com/lpu-architecture”target=”_ blank”> Unit pemprosesan bahasa (LPU) arsitektur . Tidak seperti GPU yang serba boleh yang kuasa kebanyakan industri AI, LPU direka khusus untuk tuntutan kesimpulan AI, pengiraan dan ingatan bersama pada cip.

Reka bentuk LPU secara langsung menangani peralihan asas dalam beban kerja AI. Walaupun model yang lebih tua dikira terikat, transformer moden adalah terikat memori.

Ini bermakna keuntungan prestasi datang dari akses memori yang lebih cepat, bukan hanya kuasa pemprosesan mentah. Senibina Groq adalah pertaruhan langsung pada realiti baru ini.

Analisis buatan firma bebas mengesahkan penggunaan model QWEN3 32B Alibaba yang berjalan pada kira-kira 535 token sesaat.

Syarikat itu menawarkan akses kepada model Qwen3 32B yang kuat pada hanya $ 0.29 per juta token input dan $ 0.59 per juta token output, kadar yang menarik yang direka untuk mengurangkan penyedia awan yang ada. Cadangan terhadap perkhidmatan seperti AWS Bedrock dan Google Vertex AI.

Strategi ini memberikan cabaran langsung kepada dominasi Nvidia, yang dibina di atas GPU yang kuat dan ekosistem perisian CUDA yang sangat mantap. Startups seperti

Categories: IT Info