Google meningkatkan tawarannya untuk dominasi perkakasan AI. Pada hari Khamis, syarikat
Ironwood: sebuah rumah kuasa silikon tersuai untuk umur kesimpulan
Untuk menguasai generasi akan datang model AI, Google bertaruh pada strategi bersepadu secara vertikal.
yang dibina tujuan untuk apa yang Google memanggil”umur kesimpulan”, peralihan dari latihan model besar-besaran untuk menggunakannya untuk interaksi yang berguna dan responsif pada skala. href=”https://cloud.google.com/blog/products/compute/ironwood-tpus-and-new-axion–vms-for-your-ai-workloads”sasaran=”_ kosong”> Konfigurasi terbesar, sistem kayu besi boleh mencapai 42.5 exaflops kuasa FP8 yang mengejutkan, metrik yang penting untuk aritmetik ketepatan rendah yang menguasai beban kerja AI moden. Ironwood mempunyai dua kali ganda prestasi trilium-per-watt, menjadikannya cip yang paling cekap kuasa Google sehingga kini. berfungsi sebagai superkomputer bersatu tunggal. Asas sistem ini adalah kain interkoneksi interconnect (ICI) berkelajuan tinggi yang menyediakan sehingga 9.6 terabits sesaat jalur lebar antara cip, mewujudkan topologi torus 3D yang padat. Tenggelam pekerjaan AI berskala besar.
Kain yang boleh dikonfigurasikan ini adalah kunci kepada kedua-dua skala dan daya tahan. Mewujudkan litar baru yang lengkap yang menghubungkan unit yang sihat .
Google Senibina TPU Ironwood (Sumber: Google)
Bagi pelanggan yang menjalankan pekerjaan latihan yang boleh berlangsung selama berminggu-minggu, toleransi kesalahan dinamik ini adalah ciri kritikal yang menghalang gangguan yang mahal dan memaksimumkan uptime produktif keseluruhan sistem. Pada terasnya ialah pengkompil Algebra Linear (XLA) yang dipercepatkan Google, yang menerjemahkan kod peringkat tinggi dari kerangka popular seperti Jax dan Pytorch ke dalam arahan mesin yang sangat dioptimumkan. Dengan mengendalikan operasi secara automatik ke dalam kernel yang cekap, XLA menyediakan prestasi yang kuat”out-of-the-box”. sasaran=”_ blank”> Membolehkan enjin berkhidmat yang canggih seperti VLLM pada kayu besi melalui backend yang baru, bersatu , menjadikan kuasa yang lebih besar dapat diakses oleh pemaju yang digunakan oleh pemaju yang lebih besar. Rancangan bercita-cita tinggi, dari Pusat Data AI yang strategik secara geopolitik di Pulau Krismas Australia ke projek’Moonshot’Suncatcher, yang bertujuan untuk membina pusat data yang berkuasa TPU. Compute
Di luar pemecut khusus untuk AI, aplikasi moden memerlukan tulang belakang yang kuat dan cekap untuk beban kerja seharian. Syarikat itu mengumumkan mesin maya N4A yang baru kini dalam pratonton, di samping pratonton logam C4A yang akan datang, contoh-contoh yang berasaskan lengan.
ketinggian=”600″src=”Data: Image/SVG+XML; Nitro-empty-id=mty3otoxmjk3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca4odiii Hdpzhropssixmjgwiibozwlnahq9ijg4miigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3zniJ48l3n2zz4=”> Google Axion CPU (Sumber: Google)
Maklum balas pelanggan awal menyoroti keuntungan yang ketara. Sergei Koren, ketua arkitek infrastruktur di Zoominfo, memuji contoh-contoh baru, yang menyatakan,”Dalam pratonton kami tentang contoh N4A yang baru, kami mengukur peningkatan prestasi 60% untuk kerja-kerja ini yang berpangkalan di dalamnya. Vms. AI Arms Race
Komitmen besar-besaran Anthropic berfungsi sebagai pengesahan yang kuat untuk silikon adat Google. Makmal AI, pemaju keluarga model Claude, merancang untuk mengakses sehingga 1 juta TPU, menandakan keyakinan yang kuat terhadap keupayaan platform untuk kedua-dua latihan dan kesimpulan.
James Bradbury, ketua pengiraan syarikat, menjelaskan manfaatnya:”Penambahbaikan Ironwood dalam kedua-dua prestasi kesimpulan dan skalabilitas latihan akan membantu kami skala dengan cekap sambil mengekalkan kelajuan dan kebolehpercayaan yang diharapkan oleh para pelanggan.”Walaupun perkongsian itu adalah kemenangan penting untuk Google, laporan menjelaskan bahawa antropik mengekalkan strategi infrastruktur yang pelbagai, dengan perkhidmatan web Amazon yang tersisa penyedia awan utama.
Terlibat di tengah perlumbaan AI Arms yang sengit, usaha silikon khusus Google ditujukan tepat pada dominasi pasaran Nvidia yang mencabar. Pelaburan yang mengejutkan diperlukan untuk bersaing. CPU aksion umum, Google sedang menyampaikan penyelesaian yang komprehensif, yang direka bersama.