Pengejaran AI industri teknologi yang dapat secara aktif mengoperasikan komputer, tidak hanya menanggapi pertanyaan, adalah melihat peserta potensial lain, karena tanda-tanda menunjuk ke Google yang mengeksplorasi fungsi”penggunaan komputer”dalam studio AI-nya.

Pengembangan ini, hinted at by code traces briefly appearing on May 5,suggests Google is looking to equip its developer platform with tools for AI agents to interact directly with graphical user interfaces and native applications, a field Sudah aktif dengan pesaing seperti Microsoft, Anthropic, dan Openai.

Google perampokan ke agen ai

Sementara Google belum membuat pengumuman formal, label yang terhubung dengan komputer, dan kompromi industri ini. Model Gemma 3 yang lebih ringan, sebagai pesan sistem yang menyertai penampakan kode menyatakan, “Gemma 3 akan digunakan sebagai layanan yang dijalankan cloud dalam proyek GCP Anda. Perbarui SDK Anda untuk menunjuk ke titik akhir yang dijalankan cloud.”

Integrasi semacam itu dapat memungkinkan pengembang menggunakan AI Studio untuk menggunakan instance Gemma yang terkemuka dengan relatif mudah, berpotensi dengan satu klik. Dokumentasi Google Resmi dari Maret COULBIBLE GEMA GEMA 3 AI dan Google Kubernetes Engine (GKE), sebagai target penyebaran yang didukung.

Dokumentasi juga menunjukkan tutorial yang ada yang menunjukkan cara mengemas Gemma menggunakan kerangka kerja seperti VLLM atau Ollama dan mengekspos titik akhir https publik, suatu proses yang mengarahkan integrasi ke dalam studio AI dapat lebih menyederhanakan. Mengintegrasikan kontrol semacam itu dapat memberikan AI Studio dengan lapisan orkestrasi dan kotak pasir eksekusi lokal, memungkinkan beberapa tugas untuk berjalan di atas perangkat sementara perhitungan yang lebih menuntut ditangani dari jarak jauh, berpotensi memperpendek jarak antara desain yang cepat dan API langsung untuk pengembang.

Ini bukan eksplorasi pertama Google ke lingkungan AI Agents.”Project Mariner,”sebuah prototipe penelitian awal menggunakan Gemini 2.0, adalah dirinci oleh Google pada bulan Desember sebagai agen AI yang dapat dipahami. Google menyatakan bahwa Mariner, sebagai pengaturan agen tunggal,”mencapai hasil canggih 83,5% di webvoyager.”

Mariner sebelumnya dikenal secara internal sebagai”Jarvis Proyek”dan bocor sebentar di toko web Chrome pada November 2024, dijelaskan sebagai teman untuk selancar web. Platform AI Studio itu sendiri telah berkembang, dengan fitur-fitur seperti Gemini 2.5 Pro Integrasi dan kemampuan berbagi layar sejak 3 Mei, menjadikannya rumah yang logis untuk alat agen yang lebih canggih.

Bidang kompetitif yang dikendalikan oleh perusahaan lain yang telah dikendalikan. Microsoft mulai melihat pratinjau fitur”Penggunaan Komputer”di studio Copilot pada bulan April, menargetkan otomatisasi perusahaan dengan memungkinkan AI untuk mensimulasikan tindakan manusia pada desktop dan aplikasi web. Charles Lamanna, wakil presiden perusahaan Microsoft untuk kopilot bisnis & industri, pada saat itu, “Jika seseorang dapat menggunakan aplikasi tersebut, agen tersebut juga dapat.”

Antropik lebih awal ke tempat kejadian, memperbarui model CLAUDE 3.5 Sonnet pada Oktober 2024 dengan fitur”penggunaan komputer”berbasis API, yang memungkinkan pengembang. Pengadopsi awal seperti Asana dan Doordash dilaporkan menggunakan ini untuk proses multi-langkah, meskipun fitur tersebut digambarkan sebagai eksperimental dan kadang-kadang rentan terhadap kesalahan saat peluncuran.

OpenAi memperkenalkan agen”operator”pada Januari 2025 untuk pelanggan CHATGPT Pro, sebuah alat web yang menginteraksi dengan menggunakan model WebsIcings dengan menggunakan chatsing, untuk membuat model WebsSINGS untuk menggunakan model webs. Pada bulan Februari, OpenAI memperluas ketersediaan operator.

Pemeriksaan kenyataan pada kinerja agen

Meskipun ada kemajuan, efektivitas praktis dari agen AI saat ini dalam menangani tugas profesional yang kompleks secara mandiri masih di bawah pengawasan. Sebuah studi Universitas Carnegie Mellon yang diterbitkan pada 5 Mei, berjudul”TheagentCompany,”memberikan penilaian yang tidak bijaksana. Simulasi perusahaan perangkat lunak, penelitian ini menemukan bahwa bahkan AI terkemuka, soneta Claude 3.5 Anthropic, hanya menyelesaikan 24% dari tugas yang ditugaskan, dengan biaya operasional rata-rata lebih dari $ 6 per tugas. Google’s Gemini 2.0 Flash mengelola penyelesaian 11,4%, sementara GPT-4O Openai mencapai 8,6%.

Para peneliti menyoroti”kurangnya akal sehat, keterampilan sosial yang buruk, dan ketidakmampuan menjelajah web”sebagai masalah umum. Misalnya, agen berjuang dengan pemahaman file dasar atau menolak pop-up di layar sederhana.

Studi ini juga mencatat kinerja yang lebih baik dalam tugas pengembangan perangkat lunak dibandingkan dengan peran administratif atau keuangan, mungkin karena korpus kode publik yang lebih besar yang tersedia untuk pelatihan. Kesimpulannya adalah bahwa sementara agen AI dapat membantu bagian dari pekerjaan manusia, mereka”kemungkinan bukan pengganti untuk semua tugas saat ini.”Ini menyajikan tolok ukur kinerja penting bahwa fitur”penggunaan komputer”baru dari Google secara implisit akan diukur.

Perbatasan otonom dan implikasinya

Di luar alat yang membantu atau mengotomatiskan di bawah pengawasan, industri ini juga melihat peningkatan agen yang lebih independen. Manus AI, dari efek kupu-kupu startup Cina, diluncurkan sekitar 6 Maret, dan dipasarkan sebagai agen otonom yang mampu merencanakan dan melaksanakan tugas-tugas digital tanpa pengawasan manusia yang konstan, dilaporkan menggunakan model-model seperti Anthropic’s Claude dan Alibaba’s Qwen.

Setelah periode awal permintaan yang tinggi untuk codes invite, manus-mononom, AI. Agen dengan cepat menarik perhatian dari regulator, dengan Manus AI menghadapi larangan di jaringan negara di Tennessee dan Alabama karena kekhawatiran keamanan dan propaganda.

Strategi Google sendiri yang lebih luas mencakup investasi yang signifikan dalam agen AI, dengan Google cloud mengacu pada multi-agent sistem AI-nya sebagai”target”_ _ blanker”> cloud google cloud ke multi-agent sistem AI-nya sebagai”cloud awan nexier never-nya awan”next cloud awan awan”_ _ _ _. 2025. Saat Google berpotensi menyiapkan fitur”Penggunaan Komputer”untuk AI Studio, keberhasilannya tidak hanya tergantung pada kemampuan teknis dan kemudahan penyebaran untuk model seperti Gemma 3 tetapi juga pada mengatasi keandalan dan pertimbangan keselamatan yang semakin menonjol dalam bidang yang dikemukakan oleh orang-orang yang digerakkan oleh AI. Hosting, berpotensi mengubah AI Studio menjadi platform yang lebih komprehensif untuk mengembangkan dengan model Gemma dan masa depan. Apakah fitur”penggunaan komputer”ini secara luas atau tetap merupakan percobaan internal kemungkinan akan tergantung pada evaluasi keselamatan yang sedang berlangsung ini dan strategi agen yang berkembang Google.

Categories: IT Info