Permulaan Inference AI Groq telah melancarkan kempen yang agresif untuk mencabar dominasi gergasi awan seperti Amazon Web Services dan Google, menjadikan teknologi pemprosesan berkelajuan tinggi khususnya tersedia secara langsung kepada berjuta-juta pemaju melalui perkongsian baru dengan platform muka pelukan. Langkah ini bertujuan untuk membentuk semula landskap AI dengan menyediakan akses yang meluas ke kesimpulan yang lebih cepat, kos rendah, tahap kritikal dalam mengerahkan aplikasi perisikan buatan. Wajah , hab pusat untuk pemaju dan penyelidik AI. Untuk mempamerkan keupayaannya, Groq kini menjalankan model maju seperti QWEN3 32B Alibaba, yang menyokong keseluruhan tetingkap konteks 131,000 yang dimulakan model pada kelajuan tinggi. Prestasi teknikal ini, yang membolehkan analisis keseluruhan dokumen dalam masa nyata, direka untuk menunjukkan kelebihan prestasi yang jelas ke atas perkakasan tujuan umum yang menyokong kebanyakan tawaran awan utama.
Kenyataan bersama dari syarikat-syarikat yang menyerlahkan matlamat, menyatakan,”Kerjasama ini antara muka yang memeluk dan groq adalah langkah penting dalam membuat kesimpulan AI berprestasi tinggi yang lebih mudah dan efisien.”
Dengan membenamkan teknologinya di mana pemaju sudah bekerja, Groq bertaruh ia dapat mengukir bahagian pasaran yang signifikan dalam sektor yang diunjurkan bernilai lebih dari $ 154 bilion menjelang 2030. href=”https://groq.com/wp-content/uploads/2024/07/groqthoughts_whatalpu-vf.pdf”sasaran=”_ blank”> Senibina pemprosesan bahasa yang dibina khas (LPU) Tidak seperti GPU yang lebih serba boleh yang menguasai banyak industri AI, LPU Groq mempunyai reka bentuk asas yang berbeza yang mengira dan memori pada cip. Ini menghapuskan kemunculan jalur lebar memori luaran yang boleh menghalang prestasi GPU dalam tugas-tugas berasaskan bahasa.
Pendekatan khusus ini menghasilkan prestasi yang luar biasa. Analisis artificial firma penanda aras bebas mengesahkan bahawa penempatan Groq model QWEN3 32B berjalan pada kira-kira 535 token sesaat. Syarikat telah menekankan bahawa kelajuan ini tidak datang dengan kos keupayaan, mendakwa ia adalah satu-satunya penyedia inferensi cepat yang membolehkan pemaju membina”beban kerja peringkat pengeluaran, bukan hanya POC”dengan tetingkap konteks penuh model. Pemaju boleh mengakses model melalui API GroqCloud menggunakan pengenalpastian Qwen/Qwen3-32b. Kombinasi kelajuan dan kos rendah ini memberikan cadangan nilai yang menarik di pasaran yang sering dicirikan oleh perbelanjaan pengiraan yang tinggi.
Strategi ini secara langsung mensasarkan perniagaan teras penyedia awan utama. Walau bagaimanapun, bagi pembuat keputusan perusahaan, bergantung kepada penyedia yang lebih kecil dan lebih khusus memperkenalkan risiko yang berpotensi mengenai kestabilan rantaian bekalan dan sokongan jangka panjang berbanding dengan infrastruktur global yang ditubuhkan Amazon, Google, dan Microsoft.
Walaupun cabaran-cabaran ini, Groq tetap yakin, dengan jurucakap yang menyatakan bahawa walaupun syarikat itu menggandakan infrastruktur yang dirancang,”masih tidak akan cukup keupayaan untuk memenuhi permintaan yang sangat penting untuk pertumbuhan yang sangat penting untuk pertumbuhan ekosy. Ekosistem pemaju. Perkongsian dengan Hugging Face adalah langkah strategik transformatif yang menyediakan pintu masuk kepada berjuta-juta pemaju. Dengan memenuhi pemaju di atas platform yang telah mereka gunakan, Groq secara signifikan menurunkan halangan untuk masuk untuk teknologinya, satu strategi yang dikatakan oleh jurucakap syarikat yang memperluaskan pilihan dan mempercepatkan pengangkatan. model yang dioptimumkan. Kerjasama ini bertujuan untuk mewujudkan kesan roda tenaga: apabila lebih banyak pemaju bereksperimen dengan kelajuan Groq, permintaan untuk perkakasan khususnya dapat berkembang, terus memacu pengembangan dan keupayaannya untuk mencabar penyandang. Aspirasi Arab Saudi. Pada bulan Februari, syarikat itu memuktamadkan perjanjian pelaburan $ 1.5 bilion dengan Kerajaan, perjanjian yang direka untuk memajukan rancangan Vision 2030 Arab Saudi untuk mempelbagaikan ekonomi dan menjadi kuasa teknologi global.
Hubungan ini telah berkembang menjadi perkongsian strategik teras. Groq kini menjadi penyedia teknologi utama untuk Humain, entiti AI milik negara Arab Saudi yang baru yang melaksanakan serangan berbilang dolar untuk membina ekosistem AI yang berdaulat. Ini mencerminkan pemahaman yang bernuansa tentang landskap perkakasan AI, di mana alat yang berbeza digunakan untuk pekerjaan yang berbeza. Sentimen ini disuarakan oleh Ketua Pegawai Eksekutif Nvidia, Jensen Huang, yang telah memanggil infrastruktur AI yang penting untuk setiap negara yang ingin bersaing dalam ekonomi moden. Dengan memanfaatkan seni bina LPU yang unik, memajukan pakatan kritikal dengan platform pemaju, dan mendapatkan sokongan kewangan dan geopolitik yang kuat, syarikat itu telah mencatatkan cabaran yang boleh dipercayai. AI Dominasi.