人工智能正在從基於文本的援助轉變為能夠執行數字任務的動作驅動的AI代理。 OpenAI擴展了操作員的可用性,這是Chatgpt Pro In In In In In In In chatgpt Pro的Operaigy,允許用戶完成結構化的在線任務,例如填寫表單,檢索信息和處理基於Web的工作流程。
推出將運營商帶到澳大利亞,巴西,加拿大,印度,日本,新加坡,韓國,英國和更多國家的Chatgpt Pro訂戶。
運營商是現在向澳大利亞,巴西,加拿大,印度,日本,新加坡,韓國,英國和大多數地方Chatgpt的專業用戶推出。
仍在努力使運營商在歐盟,瑞士,挪威,挪威,挪威,列希滕斯坦和冰島-列希滕斯坦和冰島-我們更新! openai ) 2025年2月21日,2025年2月21日與投資AI驅動的任務自動化的公司直接競爭。 Google正在準備使用Project Mariner推出類似的產品,這是用Gemini 2.0構建的AI代理,該產品可以理解和理由理解和原因在瀏覽器屏幕上的所有內容中,包括像素和網絡元素,例如文本,代碼,圖像和表單“用於更複雜的自動化。
Anthropic的Claude 3.5 SONNET已經將其AI功能擴展到完整的桌面控制中,從而實現了自動化整個操作系統的整個Windows和Macos跨越。
操作員AI:它的工作原理以及它站立的位置
與傳統的AI Chatbots不同,依靠用戶提示的常規AI Chatbot每個操作,操作員都可以與基於Web的系統,諸如約會計劃,數據檢索和Web表單完成的結構化過程相互作用。
操作員在執行任何操作之前需要明確的用戶批准,並且手動收購模式允許在需要時進行干預。通過將操作員限制為基於Web的自動化,OpenAI與Anthropic的Claude 3.5十四行詩相比採取了謹慎的方法,該方法可實現完整的桌面自動化,包括UI交互,鍵盤輸入和系統導航。
[嵌入式內容]
競爭性的AI代理景觀
AI驅動的任務執行迅速成為科技公司的戰場。 Google,OpenAI和Anthropic正在使用不同的AI驅動自動化方法競爭。 Microsoft還將進入該領域,並剛剛發布了其基礎AI模型岩漿,該岩漿還可以通過多模式輸入來管理AI代理,甚至可以通過多模式輸入進行機器人系統。
Google的項目水手和操作員還使用多模式AI,這使他們能夠使用多模式AI,這使他們能夠使用。並行處理文本,圖像和代碼,使它們在復雜的工作流程中更有效,而專注於基於Web的任務。
從聊天機器人到能夠執行任務的AI代理的過渡已經發展了多年。 Openai,Google和Anthropic逐漸提高了模型,提高了自動化功能並改善了AI驅動的決策。
2023年12月,OpenAI內部測試了早期的AI代理原型。到2024年1月,引入ChatGpt的內存功能使AI模型可以保留過去的交互,從而為上下文感知的自動化奠定了基礎。幾個月後,Google,Microsoft和Meta公開引入了自己的AI驅動自動化策略。
Anthropic的Claude 3.5 SONNET的計算機使用功能成為第一個能夠控制整個Windows和Macos環境的AI工具,
OpenAI的操作員是AI驅動的自動化正在超越實驗階段並進入實用應用的最新跡象。隨著AI代理的發展,行業將需要確定AI應具有多少自主權,自動化是否應嚴格保留用戶監督,或者AI驅動的任務執行將逐漸擴展為更獨立的決策模型。