Anthropicは、Claude AIの音声モードを起動し、iOSおよびAndroidモバイルアプリでの話し言葉の会話を可能にしています。新しいClaude Sonnet 4モデルを搭載したこのベータ機能は、今後数週間で英語で展開されています。これは、人類の主要なステップであり、Openai、Google、およびMetaの確立されたAI音声アシスタントに対して直接配置します。重要な機能には、会話中の重要なポイントの画面上の表示とドキュメントや画像について議論する機能が含まれます。有料のサブスクリプションプランに結び付けられています。

無料のユーザーは使用制限に直面します。人類のヘルプセンター が20-30の音声会話を期待できることを示しています。同社はまた、開発中の安全性が最優先事項であり、そのサポートドキュメントはユーザーのトラブルシューティングのヒントを提供することを強調しました。

Claudeのボイスモードの仕組み

新しい音声モードにより、ユーザーはClaudeモバイルアプリ内のマイクロローンICONをタップすることで音声セッションを開始できます。ユーザーは5つの異なる音声オプションから選択できます。これは設定の後半で変更できます。

単純なディクテーションとの重要な違いは、クロードが耳を傾け、話すことの両方を行う完全な会話機能です。人類のドキュメントは、テキストベースのインタラクションと同様に、ユーザーのチャット履歴にチャットのトランスクリプトと要約された音声ノートが保存されていることを説明しています。 pic.twitter.com/xvo5vhiceb

-人類(@anthropicai) 5月27日、2025年

より広範なトレンドと考慮事項

より自然なAI声の推進は、業界全体のトレンドであり、急速に進化することです。 SESAME AIのような専門企業は、ためらうような人間の欠陥を模倣する超現実的な声をすでに開発しています。 

このリアリズムへのドライブは、進行中の課題によってバランスが取れています。たとえば、Openaiは、2024年12月にChatGPTの高度な音声モードに追加されたライブビデオ入力を解釈する際にAIがまだ幻覚を経験できることを認めました。

Categories: IT Info