Antropik meluncurkan mode suara untuk Claude AI-nya, memungkinkan percakapan lisan di aplikasi seluler iOS dan Android-nya. Fitur beta ini, ditenagai oleh model Claude Sonnet 4 yang baru, diluncurkan dalam bahasa Inggris selama beberapa minggu ke depan. Ini adalah langkah utama untuk antropik, memposisikannya secara langsung terhadap asisten suara AI yang mapan dari Openai, Google, dan Meta.

Pengguna mode suara Claude, cara baru yang berpotensi lebih intuitif untuk berinteraksi dengan kecerdasan buatan, terutama dalam situasi interaksi yang lebih bebas. Fitur-fitur utama termasuk tampilan poin penting di layar selama percakapan dan kemampuan untuk membahas dokumen dan gambar.

menunjukkan sebagian besar dapat mengharapkan sekitar 20-30 percakapan suara. Perusahaan juga menekankan bahwa keselamatan adalah prioritas utama selama pengembangan, dan dokumentasi dukungannya menawarkan tips pemecahan masalah bagi pengguna.

Bagaimana cara kerja suara Claude

Mode suara baru antropik memungkinkan pengguna untuk memulai sesi suara dengan mengetuk ikon mikrofon di dalam Claude Mode. Pengguna dapat memilih dari lima opsi suara yang berbeda, yang dapat diubah nanti dalam pengaturan.

Perbedaan utama dari dikte sederhana adalah kemampuan percakapan lengkapnya, di mana Claude keduanya mendengarkan dan berbicara. Dokumentasi Anthropic menjelaskan bahwa transkrip obrolan dan catatan suara yang diringkas disimpan dalam riwayat obrolan pengguna, mirip dengan interaksi berbasis teks.

Kami meluncurkan mode suara dalam beta di ponsel.

Memulai percakapan suara dan meminta Claude untuk merangkum calendar Anda atau mencari dokumen Anda. pic.twitter.com/xvo5vhiceb

-antropik (@anthropicai) href=”https://twitter.com/anthropicai/status/1927463559836877214?ref_src=twsrc%5etfw”target, _ blank”fitur 2025

Suara kompetitif ai lansekap

Pengunduran diri antropik masuk ke pasar voice yang cepat hadir di pasar Voice, dengan saingannya adalah Marketors Noundsing Marketsing, dengan Marketors Oblropic Marketsing Marketors Air Assistors On. OpenAI telah secara progresif memperluas mode suara canggih chatgpt-nya, yang pada bulan Maret diperluas ke web dengan aliran percakapan yang lebih baik.

Sementara Openai awalnya memesan fitur suara terbaiknya untuk pelanggan, itu membuat versi yang ditenagai oleh model GPT-4O-Mini yang lebih kecil yang tersedia untuk pengguna bebas pada Februari 2025, meskipun dengan beberapa batasan. Microsoft telah mengambil sikap yang lebih agresif dengan membuat interaksi suara kopilotnya, termasuk fitur penalaran canggih, sepenuhnya gratis.

Google Gemini Live juga telah meningkatkan kemampuannya, termasuk fitur untuk merespons berdasarkan konten layar. Meta baru-baru ini meluncurkan aplikasi meta ai mandiri, ditenagai oleh model Llama 4 yang baru dan menampilkan interaksi suara, termasuk mode”dupleks penuh”eksperimental untuk lebih banyak aliran percakapan alami.

Amazon juga meningkatkan asisten Alexa setelah mengumumkan Alexa+ pada bulan Februari, versi premium yang digerakkan oleh AI dari Helper Populer. Khususnya, ini melibatkan investasi $ 4 miliar dan kemitraan dengan antropik itu sendiri untuk mengintegrasikan Claude AI, menyoroti pengaruh Anthropic yang semakin besar.

Di tengah lanskap kompetitif ini, Antropik bermain mengejar ketinggalan. Namun, fokus mereka pada fitur yang ramah perusahaan dapat memberi mereka keunggulan dengan segmen pengguna profesional.

tren dan pertimbangan yang lebih luas

Dorongan untuk suara AI yang lebih alami adalah tren industri dan berkembang dengan cepat. Perusahaan khusus seperti Wijen AI sudah mengembangkan suara-suara hiper-realistis yang meniru ketidaksempurnaan manusia seperti keraguan. 

Drive untuk realisme ini diimbangi oleh tantangan yang berkelanjutan. Misalnya, Openai mengakui bahwa AI-nya masih dapat mengalami halusinasi ketika menafsirkan input video langsung, fitur yang ditambahkan ke mode suara canggih ChatGPT pada bulan Desember 2024.

Ketika teknologi suara AI ini menjadi lebih terintegrasi ke dalam kehidupan sehari-hari, fokusnya tetap pada penyeimbangan inovasi dengan pengalaman pengguna, keamanan, dan implikasi etis yang semakin meningkat manusia yang ditutup manusia.

Categories: IT Info