Google menolak model Gemini 2.5 Flash AI ke dalam pratonton awam semalam, menjadikannya mudah diakses melalui pelbagai saluran: aplikasi Gemini yang menghadap pengguna, dan platform pemaju termasuk Gemini API melalui studio Google ai dan Pengumuman Google Tugas-tugas volum tinggi. Google memposisikan nisbah prestasi-ke-kosnya sebagai meletakkannya di”perbatasan Pareto,”yang mencadangkan keseimbangan optimum untuk beban kerja tertentu. Model Pemikiran Flash Gemini 2.0 yang muncul secara eksperimen pada bulan Disember 2024 dan, tidak pernah lulus dari fasa itu.
Pengulangan 2.5 ini digambarkan sebagai menawarkan keupayaan penalaran yang lebih baik berbanding dengan penjanaan kilat 2.0, sementara direkayasa lebih cepat dan lebih murah daripada Gemini 2.5 Pro mewah yang diumumkan pada bulan Mac. Versi aplikasi pengguna pada masa ini menyokong ciri-ciri seperti kanvas Google untuk kod dan penyempurnaan teks, walaupun Google menunjukkan sokongan penyelidikan yang mendalam akan diikuti kemudian.
Sumber: Google
href=”https://developers.googleblog.com/en/start-building-with-emini-25-flash/”target=”_ blank”> Gemini Api . Pemaju boleh bertukar-tukar proses”berfikir”sepenuhnya untuk kelajuan maksimum atau membolehkannya untuk pertanyaan yang kompleks. Granularity selanjutnya datang melalui laras tugas analisis. Tahap kawalan ini membolehkan pengurusan yang tepat mengenai perdagangan antara kualiti tindak balas, latensi, dan kos operasi.
Kesesuaian ini dicerminkan dalam pratonton Blog pemaju Google . Src=”Data: Image/Svg+Xml; Nitro-empty-id=mtcwnzoxmjm4-1; base64, phn2zyb2awv3qm94psiwidagmtaynca1nzyiih dpzhropsixmdi0iibozwlnahq9iju3niigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”> sumber: Google
Flash kedudukan dalam keluarga Gemini dan evolusinya
Gemini 2.5 Flash pertama kali dibincangkan secara terbuka pada 9 April, diperkenalkan sebagai model yang berbeza dari keupayaan penalaran kompleks 2.5 Pro. Walaupun fokus Flash pada kelajuan, ia mengekalkan ciri-ciri tetingkap konteks 1 juta token yang besar dari garis pro, yang membolehkannya mengendalikan input yang luas.
Konsep”pemikiran”yang mendasari itu sendiri berkembang dari model pemikiran Flash Gemini 2.0 Disember 2024. Bahawa lelaran terdahulu bertujuan untuk memberikan ketelusan penalaran, sebahagiannya sebagai tindak balas kepada model Openai O1. Mengenai eksperimen itu, Jeff Dean, ketua saintis Google Deepmind, yang menyatakan pada X,”Dibina pada kelajuan dan prestasi 2.0 Flash, model ini dilatih untuk menggunakan pemikiran untuk mengukuhkan alasannya. Dan kita melihat hasil yang menjanjikan apabila kita meningkatkan pengiraan masa kesimpulan.”Semak demo ini di mana model menyelesaikan masalah fizik dan menerangkan alasannya. pic.twitter.com/nl0hyj7zfs
-Jeff Dean (@jeffdean)