Antropic lansează un mod vocal pentru Claude AI, permițând conversații vorbite pe aplicațiile sale mobile iOS și Android. Această caracteristică beta, alimentată de noul model Claude Sonet 4, se desfășoară în engleză în următoarele câteva săptămâni. Acesta este un pas major pentru antropic, poziționându-l direct împotriva asistenților voci AI consacrați de la OpenAI, Google și Meta.

Claude Voice Mode Utilizatori un mod nou, potențial mai intuitiv de a interacționa cu inteligența artificială, în special în situații de mâini libere. Key features include on-screen display of important points during conversation and the ability to discuss documents and images.

While the core voice interaction is becoming more accessible, advanced capabilities like Google Workspace integration for accessing calendar and email data are Legat de planurile sale de abonament plătit.

utilizatorii gratuite se vor confrunta cu limite de utilizare; Centrul de ajutor Anthropic indică Majoritatea se pot aștepta în jur de 20-30 de conversații pentru voce. De asemenea, compania a subliniat că siguranța a fost o prioritate maximă în timpul dezvoltării, iar documentația sa de asistență oferă sfaturi de depanare pentru utilizatori.

Cum funcționează modul voce al lui Claude

noul mod vocal al Antropic permite utilizatorilor să inițieze o sesiune vocală prin atingerea unei picturi de microfon în aplicația Claude Mobile. Utilizatorii pot selecta din cinci opțiuni vocale distincte, care pot fi modificate ulterior în setări.

O diferență cheie față de dictarea simplă este capacitatea sa de conversație completă, unde Claude Ascultă și vorbește. Documentația lui Anthropic explică faptul că transcrierile de chat și notele vocale sumarizate sunt salvate în istoricul de chat al utilizatorului, similar interacțiunilor bazate pe text.

Dezvoltăm modul Voice în Beta pe mobil.

Încercați să începeți o conversație vocală și să cereți Claude să vă rezume calendarul sau să vă căutați documentele. pic.twitter.com/xvo5vhiceb

-antropic (@antropicai) 27 mai, 2025

caracteristica este concepută pentru diverse scenarii, inclusiv funcționare fără mire, BreenStorming, învățare, and. îmbunătățirea accesibilității. Pentru o performanță optimă, Antropic recomandă utilizarea modului Voice într-un mediu liniștit și vorbind clar. Sunt disponibile controale specifice, cum ar fi pauză/CV, mut/dezactivare și conversație finală, sunt disponibile, conform Centrului Anthropic de Ajutor.

The Competitive Voice ai peisaj

Intrarea antropică pe piața de asistență vocală vine, deoarece competitorii sunt avansând rapid ofertele lor. OpenAI și-a extins progresiv modul ChatGPT Avansat Voice, care în martie a fost extins pe web cu un flux de conversație îmbunătățit.

În timp ce OpenAI și-a rezervat inițial cele mai bune caracteristici vocale pentru abonați, a făcut o versiune alimentată de modelul său mai mic GPT-4O-mini disponibili pentru utilizatorii liberi în februarie 2025, deși cu unele limitări. Microsoft a luat o poziție mai agresivă, făcând interacțiunile sale vocale cu copilot, inclusiv funcții avansate de raționament, complet gratuit.

Google Gemini Live și-a îmbunătățit, de asemenea, capacitățile, inclusiv caracteristici pentru a răspunde pe baza conținutului ecranului. Meta a lansat recent o aplicație de AI Meta AI autonomă, alimentată de noile sale modele Llama 4 și cu interacțiune vocală, inclusiv un mod experimental „Full-Duplex” pentru un flux de conversație mai natural.

Amazon își îmbunătățește, de asemenea, asistentul Alexa, după ce a anunțat Alexa+ în februarie, o versiune premium orientată către AI-ul său popular. În special, aceasta implică o investiție de 4 miliarde de dolari și un parteneriat cu Antropic în sine pentru a integra Claude AI, subliniind influența crescândă a Anthropic.

pe fondul acestui peisaj competitiv, Antropic joacă captură în voce. Cu toate acestea, accentul lor pe caracteristicile prietenoase cu întreprinderea le-ar putea oferi un avantaj cu segmentele de utilizatori profesioniști.

tendințe și considerații mai largi

Apăsarea pentru mai multe voci naturale AI este o tendință la nivel de industrie și evoluția rapidă. Firme specializate precum Sesame AI dezvoltă deja voci hiperrealiste care imită imperfecțiunile umane precum ezitările. 

Această unitate pentru realism este echilibrată de provocări în curs. De exemplu, OpenAI a recunoscut că AI-ul său poate experimenta încă halucinații la interpretarea intrării video live, o caracteristică adăugată la modul vocală avansată a lui Chatgpt în decembrie 2024.

Pe măsură ce aceste tehnologii Voice AI devin mai integrate în viața de zi cu zi, se concentrează pe echilibrarea inovației cu experiența utilizatorului, siguranța și implicațiile etice ale interacțiunilor de AI de tipul uman.

Categories: IT Info