Google diam-diam A/B menguji model AI generasi berikutnya, Gemini 3, dengan pengembang terpilih pada platform studio AI-nya menjelang acara peluncuran 9 Oktober yang dikabarkan.
Kebocoran dari tes awal mengungkapkan keuntungan kinerja yang signifikan, khususnya dalam tugas pengembangan yang kompleks dan pengembangan frontend.
Posisi gerakan google google google google google goube google google google google google google Tugas pengembangan. Keduanya baru-baru ini meluncurkan model mereka sendiri yang kuat dan berfokus pada kode, GPT-5-CODEX dan Claude Sonnet 4.5, masing-masing.
Benchmark yang bocor menandakan powerhouse pengkodean
Sekilas dari kemampuan Gemini 3 menunjukkan lompatan besar dalam kinerja, terutama untuk alur kerja teknis dan yang berfokus pada pengembang. Penguji telah membandingkan kemampuan model untuk menghasilkan grafik vektor yang dapat diskalakan kompleks (SVGS), mengungkapkan peningkatan yang nyata atas pendahulunya.
Dalam satu perbandingan langsung, output Gemini 3 terbukti lebih unggul dari format yang kurang ditangani oleh antropik Sonnet 4.5.
P> Powates untuk menangani Sonnet yang baru dirilis Sonnet 4.5. kinerja penalaran logis, memicu ekspektasi tinggi untuk utilitas model yang lebih luas.
Claude 4.5 sonnet vs Gemini 3 Pro pada tes robot svg
Saya pikir ada pemenang yang jelas di sini pic.twitter.com/3cd9hqb9df
-leo 🐾 (@synthwavedd)
29, 2025 _ blank 29, 2025
blokon> lini 29, 2025
_ blank 29, 2025
Onio> the LEUKTER 29, 2025
href=”https://www.testingcatalog.com/google-a-b-tests-gemini-3-on-ai-studio-ahead-of-october-9-release/” target=”_blank”>impressive frontend development skills.
The model appears adept at generating complex user interfaces and web designs from simple prompts, a critical and time-consuming area for modern software Rekayasa.
Fokus ini menggarisbawahi strategi Google untuk menang atas komunitas pengembang.
[konten tertanam]
balap melawan generasi baru coders AI
Peluncuran Google yang akan terjadi tidak ada dalam vakum. Itu datang di tengah kesibukan rilis berisiko tinggi dari pesaing utamanya, masing-masing bersaing untuk mendominasi di pasar pengkodean AI yang menguntungkan.
Bidang kompetitif telah meningkat dengan cepat, dengan saingan yang meluncurkan bilah yang sangat tinggi pada sebulan terakhir.
Pada 15 September, Openai meluncurkan GPT-COD-COD-5-COD.
Pada 15 September, OpenAi meluncurkan GPT-GPT-COD-5-COD.
Of Version-CODEP-COP-COP-COP-COUTS. pengkodean”.
Inovasi utamanya adalah”pemikiran dinamis,”yang memungkinkan model untuk menyesuaikan upaya komputasi secara real-time. Seperti yang dijelaskan oleh Openai Alexander Embiricos,”GPT-5-Codex dapat memutuskan lima menit menjadi masalah yang perlu menghabiskan satu jam lagi.”
Hanya dua minggu kemudian, antropik ditembakkan kembali dengan Claude Sonnet 4.5, yang diklaimnya adalah model pengkodean terbaik dan aman di dunia. Perusahaan ini menyoroti daya tahan model barunya yang luar biasa, menyatakan dapat beroperasi secara mandiri pada proyek perangkat lunak yang kompleks selama lebih dari 30 jam.
Kemampuan ini dipuji oleh mitra seperti Michael Truell, CEO Cursor, yang mencatat,”Kami melihat penasihat canggih dari Claude Sonnet 4.5, dengan perbaikan yang lebih lama pada Horiz yang lebih lama.”Tekanan luar biasa pada Google untuk memberikan produk canggih yang dapat bersaing dengan kinerja mentah dan kemampuan agen yang lama berdurasi ini.
Google telah dibangun menuju momen ini, setelah sebelumnya meningkatkan model Pro Gemini 2.5-nya dengan fitur”pemikiran mendalam”untuk mengatasi penalaran yang kompleks. Rilis Gemini 3 adalah langkah logis berikutnya dalam perlombaan senjata teknologi yang sedang berlangsung ini.
Masa depan yang lebih terintegrasi dan agen
Di luar peningkatan model inti, google yang disarankan untuk membuat berbagai hal yang disarankan untuk membuat pengalaman pengguna yang lebih koesi. Asisten daripada sekadar generator teks yang kuat.
Fitur”My Stuff”baru, terlihat dalam tes build, tampaknya dirancang untuk memberi pengguna galeri yang ramping untuk mengakses artefak yang dihasilkan seperti gambar dan cuplikan kode.
Ini mencerminkan fitur yang serupa. “Mode agen” yang telah lama ditunggu-tunggu dengan kontrol browser juga berkembang di belakang layar. Sementara detailnya langka, posting blog Google resmi mengkonfirmasi”mode agen”adalah timed with the “#GeminiAtWork”livestream, would marks a critical moment for Google.
Sudah waktunya AI bekerja untuk Anda.
Set a reminder to be notified when we’re live ↓ https://t.co/cxoULaCmBN