สายพันธุ์ใหม่ของการเริ่มต้น AI กำลังสร้างคลื่นและงา AI อยู่ตรงกลาง ร่วมก่อตั้งโดย Brendan Iribe ของ Oculus และ Ankit Kumar ของ Ubiquity6 ซึ่งปัจจุบัน บริษัท กำลังเจรจารอบระดมทุนเกินกว่า 200 ล้านเหรียญสหรัฐโดยมี Sequoia Capital และ Spark Capital พันล้าน-การจัดตั้ง บริษัท เป็นหนึ่งในผู้เล่นที่มีผู้ชมมากที่สุดในการสนทนา AI.

อะไรคือสิ่งที่ทำให้เกิดความสนใจ คำตอบของงานั้นไม่ได้มีความเร็วมากขึ้นหรือมากขึ้น มันเป็นความสมจริง-AI ที่รับรู้ทางอารมณ์ที่ไม่ได้ฟังดูราบรื่น แต่ฟังดูมีชีวิตชีวา

โมเดลคำพูดสนทนาของเซซามี (CSM) ตั้งอยู่ที่แกนกลางของผลิตภัณฑ์ เพิ่มพลังผู้ช่วยดิจิตอลที่ชื่อมายาและไมล์โมเดลรวบรวมความไม่สมบูรณ์เช่นความลังเล, stutters, การเปลี่ยนแปลงวรรณยุกต์และการเว้นจังหวะที่ไม่สอดคล้องกัน นี่ไม่ใช่ข้อผิดพลาด เป็นความตั้งใจ ผู้ใช้อธิบายประสบการณ์ของพวกเขากับผู้ช่วยเสียงว่า“ การทำให้มนุษย์อย่างน่าขนลุก” และแม้กระทั่ง“ อึดอัด”

ผู้ช่วยไม่ได้เลียนแบบน้ำเสียง มันตีความสัญญาณทางอารมณ์ในเสียงของผู้ใช้-เปลี่ยนไปเป็นเสียงที่ช้าลงและผ่อนคลายมากขึ้นเมื่อตรวจพบความเครียดหรือกลายเป็นขี้เล่นในระหว่างการโต้ตอบอย่างสร้างสรรค์ ผู้ช่วยสามารถเล่นบทบาทปรับเปลี่ยนเป็นตัวละครและเปลี่ยนท่าทางขึ้นอยู่กับบริบท ได้รับการออกแบบมาเพื่อตอบสนองแบบเรียลไทม์กับรูปร่างและจังหวะของการสนทนาไม่ใช่แค่คำที่พูด

ตามที่อธิบายไว้ในสิ่งพิมพ์การวิจัยอย่างเป็นทางการของเซซามี โมเดลจะเปลี่ยนการส่งมอบแบบไดนามิกตามสัญญาณตามบริบท สิ่งนี้ช่วยให้ AI สามารถตอบสนองในรูปแบบที่รู้สึกถึงความเป็นจริงทางอารมณ์มากกว่าแบบจำลองทางกลไกทางกลไก

โมเดลโอเพนซอร์ซแผนฮาร์ดแวร์และการสาธิตใบหน้ากอด

sesame/lembulebondial GitHub ภายใต้ใบอนุญาต Apache 2.0 ที่ได้รับอนุญาตเปิดประตูให้นักพัฒนาสร้างขึ้นด้วยข้อ จำกัด น้อยที่สุด รุ่นฐานพารามิเตอร์ 1B ยังสามารถทดสอบได้โดยตรงผ่านการสาธิตโฮสต์บน กอดใบหน้า .

CSM ประมวลผลข้อมูลเหล่านี้ควบคู่ไปกับข้อมูลที่เป็นข้อความทำให้สามารถตอบสนองด้วยคำพูดที่ได้รับการปรับแต่งตามบริบท

ในขณะนี้ในขณะที่มันหลีกเลี่ยงการพึ่งพาแบบจำลองภาษาที่ผ่านการฝึกฝนขนาดใหญ่งาได้ระบุแผนการรวมระบบดังกล่าวและขยายการสนับสนุนภาษา ซึ่งแตกต่างจากชุดหูฟังที่มองเห็นได้ผลิตภัณฑ์นี้มุ่งเน้นไปที่เสียงและเสนอการโต้ตอบตลอดทั้งวันกับผู้ช่วย AI 

Anjney Midha หุ้นส่วนทั่วไปที่ Andreessen Horowitz หนึ่งในนักลงทุนที่เก่าแก่ที่สุดของเซซามีเขียนไว้ใน

ความสมจริงนี้ยังโพสต์การออกแบบและการแลกเปลี่ยนประสิทธิภาพ การใช้แบบจำลองการตอบสนองทางอารมณ์แบบเรียลไทม์โดยเฉพาะอย่างยิ่งในอุปกรณ์ที่สวมใส่ได้มาพร้อมกับค่าใช้จ่ายในการคำนวณสูง การประมวลผลบทสนทนาตามธรรมชาติในอุปกรณ์ต้องใช้ชิปที่ประหยัดพลังงานและสถาปัตยกรรมความล่าช้าต่ำ-ในพื้นที่ที่งายังไม่ได้ให้รายละเอียดต่อสาธารณะ

การเน้นความสมจริงของ บริษัท อาจทำให้เกิดความเครียดในชีวิตแบตเตอรี่หรือขีด จำกัด ทางความร้อน ระหว่างการเปิดตัวโอเพนซอร์ซการรวมฮาร์ดแวร์ที่ทะเยอทะยานและการประเมินมูลค่ามีรายงานว่าข้ามเครื่องหมายพันล้านดอลลาร์การเริ่มต้นการเรียกร้องไม่เพียง แต่เสียงของ AI-แต่มันรู้สึกอย่างไรที่จะพูดคุยกับหนึ่ง