Google secara signifikan memajukan keupayaan ejen AI, mengumumkan pelancaran dan kemas kini utama yang lebih luas kepada Projek Mariner semasa persidangan Google I/O 2025. AI eksperimen ini, yang direka untuk melayari dan berinteraksi dengan laman web atas nama pengguna, kini beroperasi pada mesin maya berasaskan awan dan boleh menguruskan sehingga sepuluh tugas serentak. Pembangunan ini memberi isyarat kepada Google yang intensif untuk membentuk semula interaksi web, memperkasakan AI untuk secara aktif melaksanakan tugas-tugas, satu langkah yang dapat mengubah secara asasnya bagaimana pengguna dan perniagaan terlibat dengan Internet.
Paling penting bagi pemaju, Google mengintegrasikan fungsi Projek Mariner ke API Gemini dan Vertex AI, dengan ketersediaan yang lebih luas dijangka musim panas ini.
Integrasi ini akan menyediakan alat untuk mewujudkan lebih banyak pengalaman digital autonomi, dari membeli tiket untuk memesan barangan runcit tanpa lawatan laman web langsung. Rakan kongsi ujian seperti automasi di mana-mana dan UIPath sudah membina penyelesaian dengan keupayaan ini.
Keupayaan yang dipertingkatkan dan pengalaman pengguna
Peningkatan utama untuk Projek Mariner adalah peralihannya untuk berjalan pada mesin maya di awan. Ini membolehkan ejen AI menyelesaikan tugas di latar belakang sementara pengguna meneruskan kerja lain-peningkatan yang ketara dari pendahulunya yang berlari secara langsung pada pelayar pengguna dan aktiviti serentak yang terhad. Google menyatakan bahawa lelaran baru boleh mengendalikan sehingga sepuluh tugas sekaligus, rangsangan yang besar dalam kecekapan.
[Kandungan Terbenam]
Pengguna akhirnya dapat mengakses Projek Mariner melalui mod AI pada carian Google, pada mulanya melalui makmal carian, dengan demonstrasi yang menunjukkan mod AI dengan cepat mencari dan menempah tiket permainan besbol. Google bekerjasama dengan rakan kongsi seperti Ticketmaster, StubHub, Resy, dan Vagaro untuk memudahkan beberapa interaksi yang didorong oleh ejen ini. Google menerangkan mod ejen sebagai sistem di mana pengguna hanya dapat menyatakan objektif mereka, dan Gemini akan”bijak mengatur langkah-langkah untuk mencapainya.”(Pendekatan Google terhadap teknologi sedemikian digariskan dalam mereka
Anthropic juga menjadi pemain utama, menaik taraf model Sonnet Claude 3.5 pada Oktober 2024 yang membolehkannya menguruskan tugas desktop. Alat-alat ini, termasuk Akta Nova Amazon, sebahagian besarnya dalam peringkat eksperimen, dan pengalaman awal kadang-kadang mendapati mereka perlahan atau terdedah kepada kesilapan. Integrasi Projek Mariner ke dalam mod ejen Gemini memanfaatkan model bahasa penglihatan maju untuk mentafsirkan unsur-unsur visual, pembezaan utama. Kajian Carnegie Mellon University menawarkan penilaian keupayaan ejen AI. Kajian mendapati bahawa walaupun AI memimpin sepenuhnya menyelesaikan hanya 24% tugas yang ditugaskan. Para penyelidik menunjuk kepada isu-isu seperti”kekurangan akal sehat, kemahiran sosial yang lemah, dan ketidakcekapan dalam pelayaran web,”menyimpulkan bahawa sementara agen AI dapat membantu, mereka mungkin”bukan pengganti untuk semua tugas pada masa ini,”menurut kajian itu. Laporan dari awal Mei 2025 mencadangkan Google sedang menguji fungsi”penggunaan komputer”dalam studio AI, yang berpotensi dikaitkan dengan model GEMMA 3 dan penyebaran awan yang diselaraskan. Ini sejajar dengan strategi Google Cloud yang lebih luas, yang telah merujuk kepada sistem AI multi-agen sebagai”sempadan seterusnya.”Memandangkan Google terus membangunkan teknologi agentik ini, kejayaan mereka akan bergantung bukan sahaja pada kehebatan teknikal tetapi juga untuk menangani kebolehpercayaan, keselamatan, dan cabaran-cabaran yang ditetapkan oleh automasi tugas dunia.