Anthropic正在為其Claude AI啟動語音模式,從而在其iOS和Android移動應用程序上啟用對話。該Beta功能由新的Claude Sonnet 4車型提供支持,在接下來的幾週內將以英語推出。這是擬人化的主要步驟,直接將其定位為OpenAI,Google和Meta的已建立的AI語音助手。
Claude語音模式用戶是一種新的,可能更直觀的方式,可以與人工智能互動,尤其是在免提情況下進行交互。
新的語音模式旨在實現更自然的交互風格。關鍵功能包括在對話過程中顯示重要點的屏幕以及討論文檔和圖像的能力。與其付費訂閱計劃有關。
免費用戶將面臨使用限制;擬人的幫助中心表示大多數可能會在20-30左右的語音對話左右。該公司還強調,安全是開發過程中的重中之重,其支持文檔為用戶提供了故障排除的技巧。
Claude的語音模式如何工作
擬人的新語音模式使用戶可以通過在Claaude移動應用程序中啟動麥克風圖片來啟動語音會話。用戶可以從五個不同的語音選項中進行選擇,可以在以後在設置中進行更改。
與簡單命令的關鍵區別在於其完整的對話能力,克勞德都在傾聽和說話。 Anthropic的文檔解釋說,聊天筆錄和匯總語音註釋可以保存在用戶的聊天歷史記錄中,類似於基於文本的交互。
我們正在Mobile上的Beta上推出語音模式。
嘗試啟動語音對話,並要求Claude並要求Claude搜索您的日曆或搜索日曆或搜索您的文檔或搜索您的文檔。 pic.twitter.com/xvo5vhiceb
– anthropic(@anthropicai) 5月27日,2025年5月27日,2025年5月27日
學習並增強可訪問性。為了獲得最佳性能,Anthropic建議在安靜的環境中使用語音模式並清晰地說話。根據擬人服務中心的說法,可以進行暫停/簡歷,靜音/取消靜音和結束對話等特定控件。
競爭性語音 ai
Anthropic進入競爭者的競爭者很快就會加入競爭者。 OpenAI一直在逐步擴展其ChatGpt高級語音模式,該模式在3月擴展到網絡,並改善了對話流動。
最初為訂戶保留其最佳語音功能,它製造了一個由較小的GPT-4O-Mini型號供電的版本,該版本在2025年2月2日提供了一些限制。微軟通過使其Copilot語音互動(包括高級推理功能)完全免費。梅塔(Meta)最近推出了一個獨立的元AI應用程序,該應用程序由其新的Llama 4型號提供支持,並具有語音互動,包括一種實驗性的“全雙工”模式,以進行更自然的對話流動。
亞馬遜在2月在2月宣布Alexa+的Alexa Assistant,並在2月份宣布了Alexa+ Alexa+ Alexa+ Premium ai-driven ai-driven driven driven driven driven driven版本。值得注意的是,這涉及40億美元的投資以及與擬人化的合作夥伴關係,以整合Claude AI,並強調了人類的影響力的日益增長。但是,他們對企業友好功能的關注可能會使他們在專業的用戶領域具有優勢。
更廣泛的趨勢和考慮因素
推動更自然的AI聲音是一種行業範圍的趨勢,並且快速發展。像芝麻AI這樣的專業公司已經在開發超現實的聲音,這些聲音模仿了猶豫不決的人類缺陷。
這種現實主義的驅動力是通過持續的挑戰平衡的。例如,Openai承認,在解釋實時視頻輸入時,其AI仍然可以體驗幻覺,該功能在2024年12月在Chatgpt高級語音模式中增加了。
。
隨著這些AI語音技術變得更加融合到日常生活中,重點仍然放在平衡創新與用戶體驗,安全性的人類互動的含義上,以及類似人類的A型AI型AI型AI。