Google mempunyai mengumumkan pratonton pemaju Alat ini sekarang tersedia untuk pemaju melalui studio Google ai Vertex Ai .

Pelepasan ini menempatkan Google dalam persaingan langsung dengan agen AI yang sama dari saingan seperti OpenAI dan Anthropic. Teknologi ini membolehkan AI melihat apa yang ada di skrin dan kemudian klik, ketik, dan menavigasi laman web untuk mengautomasikan kerja-kerja digital yang kompleks.

Pergerakan menandakan langkah penting di luar chatbots mudah. Ia bertujuan untuk mewujudkan pembantu yang dapat menyelesaikan kerja secara aktif atas nama pengguna, meningkatkan perlumbaan untuk membina ejen AI yang benar-benar autonomi.

Bagaimana Gemini belajar untuk mengklik, menaip, dan tatal

pada terasnya, model penggunaan komputer Gemini 2.5 beroperasi dalam dokumentasi Google yang diterangkan sebagai

Selepas tindakan dilaksanakan, aplikasi klien menangkap tangkapan skrin baru dan URL semasa. Keadaan baru ini kemudiannya dihantar kembali ke model penggunaan komputer sebagai `function_response`, memulakan semula gelung. Proses berulang ini membolehkan ejen mengeluarkan `keselamatan_decision` yang memerlukan pengesahan pengguna yang jelas