Google telah mengumumkan Gemini 2.0 Flash Thinking, model penaakulan eksperimen yang direka untuk menyelesaikan masalah kompleks menggunakan berbilang jenis data. Model baharu ini membolehkan pengguna melihat langkah yang diperlukan untuk mendapatkan jawapan, menawarkan cerapan tentang proses analisisnya.

Pemikiran Kilat Gemini 2.0 ialah tindak balas langsung kepada model penaakulan o1 OpenAI, dengan Google menekankan ketelusan dan kelajuan sebagai ciri utama reka bentuknya.

Model kami yang paling bijak:) https://t.co/xIz3w5dtGJ

— Sundar Pichai (@sundarpichai) 19 Disember 2024

Proses Penaakulan Ditunjukkan Langkah demi Langkah

Ciri utama Gemini 2.0 Flash Thinking ialah tumpuannya untuk menjadikannya proses penaakulan yang boleh difahami oleh pengguna. Ini berbeza dengan beberapa sistem AI lanjutan yang proses membuat keputusan selalunya tidak jelas.

Tidak seperti model penaakulan o1 OpenAI, model baharu Google menyediakan cara untuk pengguna mengikuti langkah kognitifnya melalui antara muka pengguna. Menurut dokumentasi rasmi Google,”Mod Berfikir”dalam model ini menyediakan keupayaan penaakulan yang lebih kukuh berbanding model Gemini 2.0 Flash standard.

Ciri ini menangani kebimbangan”kotak hitam”yang sering dikaitkan dengan AI, menyelaraskan model dengan idea untuk menjadikan operasinya lebih mudah difahami. Pemerhatian awal mencadangkan bahawa model boleh menyelesaikan masalah yang sukar untuk sistem AI lain dengan berkesan dan cepat.

Pemprosesan Multimodal Terbina dalam

Satu lagi ciri penting Gemini 2.0 Flash Thinking ialah keupayaannya untuk memproses input imej bersama teks. Walaupun o1 OpenAI pada mulanya berfungsi hanya dengan teks sebelum menambah keupayaan imej kemudian, model Google direka untuk mengendalikan berbilang jenis data dari awal.

Keupayaan terbina dalam ini membolehkan model menangani situasi kompleks yang memerlukan analisis pelbagai jenis maklumat. Sebagai contoh, model itu telah dapat menyelesaikan teka-teki yang memerlukan penggunaan kedua-dua teks dan imej, menunjukkan keupayaannya untuk berfungsi dengan format data yang berbeza. Pembangun boleh mengakses ciri ini pada masa ini melalui Google AI Studio dan Vertex AI .

Keputusan Penanda Aras

Keputusan pertama daripada papan pendahulu penanda aras Arena Chatbot untuk yang diuji Model Gemini-2.0-Flash-Thinking-exp-1219 menunjukkan prestasi yang secara amnya unggul jika dibandingkan dengan model OpenAi o1 yang disenaraikan (o1-pratonton dan o1-mini).

Gemini-2.0-Flash-Berfikir #1 merentas semua kategori! pic.twitter.com/mRctNA31B9

— lmarena.ai (dahulunya lmsys.org) (@lmarena_ai) 19 Disember 2024

Terhadap o1-pratonton, Gemini-2.0-Flash-Thinking mengunggulinya dengan ketara dalam prestasi Keseluruhan, Keseluruhan dengan Kawalan Gaya, Penulisan Kreatif, Mengikuti Arahan dan Pertanyaan Lebih Lama. Mereka mencapai kedudukan yang sama dalam Gesaan Keras, Gesaan Keras dengan Kawalan Gaya, Pengekodan dan Matematik. Terhadap o1-mini, Gemini-2.0-Flash-Thinking mengunggulinya dengan ketara dalam prestasi Keseluruhan, Keseluruhan dengan Kawalan Gaya, Gesaan Keras, Gesaan Keras dengan Kawalan Gaya, Penulisan Kreatif, Mengikuti Arahan dan Lebih Lama Pertanyaan. Mereka mencapai pangkat yang sama dalam Pengekodan dan Matematik.

Adalah penting untuk ambil perhatian bahawa perbandingan ini hanya termasuk versi”pratonton”dan”mini”bagi model o1. Versi keluaran stabil o1 dan o1 Pro tidak terdapat dalam gambaran keseluruhan ini, yang bermaksud ia tidak menggambarkan perbandingan terhadap keluaran stabil yang berpotensi lebih berkebolehan bagi keluarga model o1.

Walau bagaimanapun, berdasarkan data yang tersedia, Gemini-2.0-Flash-Thinking-exp-1219 menunjukkan profil prestasi yang jauh lebih kukuh berbanding model o1-preview dan o1-mini.

Butiran Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking kini tersedia sebagai percubaan dalam Google AI Studio. Ia dibina di atas asas model Gemini 2.0 Flash yang dikeluarkan baru-baru ini.

Jeff Dean, Ketua Saintis Google DeepMind, menjelaskan bahawa model itu”dilatih untuk menggunakan pemikiran untuk mengukuhkan penaakulannya”. Beliau juga menyatakan”hasil yang menjanjikan apabila kita meningkatkan pengiraan masa inferens,”merujuk kepada jumlah sumber pengkomputeran yang digunakan semasa memproses pertanyaan.

Memperkenalkan Gemini 2.0 Flash Thinking, model eksperimen yang secara eksplisit menunjukkannya pemikiran.

Dibina pada kelajuan dan prestasi Flash 2.0, model ini dilatih untuk menggunakan pemikiran untuk mengukuhkan penaakulannya.

Dan kami melihat hasil yang menjanjikan apabila kami meningkatkan masa inferens…

— Jeff Dean (@JeffDean) 19 Disember 2024

Dekan turut berkongsi demo yang mana model itu menyelesaikan masalah kompleks masalah fizik.

Ingin melihat Gemini 2.0 Flash Thinking dalam tindakan? Lihat demo ini di mana model menyelesaikan masalah fizik dan menerangkan alasannya. pic.twitter.com/Nl0hYj7ZFS

— Jeff Dean (@JeffDean) 19 Disember, 2024

Model menyokong panjang konteks lebih daripada 128k, mempunyai had 32,000 token untuk input dan boleh menjana output sehingga 8,000 token panjang. Ia disertakan dengan potongan pengetahuan pada Ogos 2024. Dokumentasi Google menyatakan bahawa”Mod Pemikiran berkemampuan keupayaan penaakulan yang lebih kukuh dalam responsnya daripada model Gemini 2.0 Flash asas,”menekankan kebolehan analisisnya yang lebih baik.

Pada masa ini, model ditawarkan tanpa caj dalam Google AI Studio, tetapi dokumentasi menunjukkan bahawa beberapa penyepaduan, seperti kefungsian Carian Google, belum lagi tersedia Model ini direka khusus untuk tugasan”pemahaman pelbagai mod,”dan”pengekodan”.

Persaingan dengan Tawaran Premium OpenAI

Pengenalan Gemini 2.0 Flash Thinking datang sejurus selepas OpenAI melancarkan ChatGPT Pro versi penuh model penaakulan o1 pada 5 Disember, menonjolkan peningkatan persaingan dalam bidang AI lanjutan.

Pelancaran Google Gemini 2.0 Flash Thinking berlaku kerana OpenAI baru-baru ini telah mewujudkan tawaran premiumnya untuk keupayaan penaakulan lanjutan. Walaupun mod o1 pro OpenAI menekankan prestasi melalui peningkatan sumber pengiraan, Gemini 2.0 Flash Thinking Google menekankan ketelusan proses penaakulannya.

Perbezaan ini menyerlahkan strategi berbeza yang digunakan dalam pembangunan AI, dengan beberapa memfokuskan pada kuasa pengiraan dan yang lain mengutamakan pemahaman dan kepercayaan pengguna.

Categories: IT Info