Google menolak model Gemini 2.5 Flash AI ke dalam pratonton awam semalam, menjadikannya mudah diakses melalui pelbagai saluran: aplikasi Gemini yang menghadap pengguna, dan platform pemaju termasuk Gemini API melalui studio Google ai dan Pengumuman Google Tugas-tugas volum tinggi. Google memposisikan nisbah prestasi-ke-kosnya sebagai meletakkannya di”perbatasan Pareto,”yang mencadangkan keseimbangan optimum untuk beban kerja tertentu. Model Pemikiran Flash Gemini 2.0 yang muncul secara eksperimen pada bulan Disember 2024 dan, tidak pernah lulus dari fasa itu.

Pengulangan 2.5 ini digambarkan sebagai menawarkan keupayaan penalaran yang lebih baik berbanding dengan penjanaan kilat 2.0, sementara direkayasa lebih cepat dan lebih murah daripada Gemini 2.5 Pro mewah yang diumumkan pada bulan Mac. Versi aplikasi pengguna pada masa ini menyokong ciri-ciri seperti kanvas Google untuk kod dan penyempurnaan teks, walaupun Google menunjukkan sokongan penyelidikan yang mendalam akan diikuti kemudian.

Sumber: Google

href=”https://developers.googleblog.com/en/start-building-with-emini-25-flash/”target=”_ blank”> Gemini Api . Pemaju boleh bertukar-tukar proses”berfikir”sepenuhnya untuk kelajuan maksimum atau membolehkannya untuk pertanyaan yang kompleks. Granularity selanjutnya datang melalui laras tugas analisis. Tahap kawalan ini membolehkan pengurusan yang tepat mengenai perdagangan antara kualiti tindak balas, latensi, dan kos operasi.

Kesesuaian ini dicerminkan dalam pratonton Blog pemaju Google . Src=”Data: Image/Svg+Xml; Nitro-empty-id=mtcwnzoxmjm4-1; base64, phn2zyb2awv3qm94psiwidagmtaynca1nzyiih dpzhropsixmdi0iibozwlnahq9iju3niigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”> sumber: Google

Flash kedudukan dalam keluarga Gemini dan evolusinya

Gemini 2.5 Flash pertama kali dibincangkan secara terbuka pada 9 April, diperkenalkan sebagai model yang berbeza dari keupayaan penalaran kompleks 2.5 Pro. Walaupun fokus Flash pada kelajuan, ia mengekalkan ciri-ciri tetingkap konteks 1 juta token yang besar dari garis pro, yang membolehkannya mengendalikan input yang luas.

Konsep”pemikiran”yang mendasari itu sendiri berkembang dari model pemikiran Flash Gemini 2.0 Disember 2024. Bahawa lelaran terdahulu bertujuan untuk memberikan ketelusan penalaran, sebahagiannya sebagai tindak balas kepada model Openai O1. Mengenai eksperimen itu, Jeff Dean, ketua saintis Google Deepmind, yang menyatakan pada X,”Dibina pada kelajuan dan prestasi 2.0 Flash, model ini dilatih untuk menggunakan pemikiran untuk mengukuhkan alasannya. Dan kita melihat hasil yang menjanjikan apabila kita meningkatkan pengiraan masa kesimpulan.”Semak demo ini di mana model menyelesaikan masalah fizik dan menerangkan alasannya. pic.twitter.com/nl0hyj7zfs

-Jeff Dean (@jeffdean) Google berhasrat untuk memanfaatkan fasa pratonton ini untuk memperbaiki”pemikiran dinamik”model berdasarkan maklum balas pemaju, terutamanya mengenai keadaan”di mana ia kurang berfikir atau berfikir lebih,”seperti yang disebutkan Doshi. Perbezaannya tetap bahawa pemaju mendapatkan kawalan API berbutir, sementara aplikasi pengguna semasa menawarkan flash sebagai pilihan eksperimen tunggal, mungkin dengan penalaran didayakan secara lalai. Kekurangan ketelusan ini meneruskan corak yang dilihat dengan beberapa siaran AI baru-baru ini, menarik pengawasan, terutamanya untuk model yang dibuat secara meluas. Walaupun Google merancang perkembangan masa depan seperti ketersediaan di premis dan memanfaatkan TPU baru, langkah segera melibatkan mengumpulkan data dunia nyata untuk membimbing 2.5 Flash ke arah pelepasan umum yang berpotensi.

Categories: IT Info