Një racë e re e fillimit të zërit të zërit po bën valë, dhe Sesame AI ka të drejtë në mes të saj. Bashkëthemeluar nga Brendan Iribe i Oculus dhe Ankit Kumar i Ubiquity6, kompania aktualisht po negocion një raund financimi që tejkalon 200 milion dollarë, me Sequoia Capital dhe Spark Capital Miliardë-duke ankuar kompaninë si një nga lojtarët më të shikuar nga afër në AI bisedore. Përgjigja e Sesame nuk është më shumë shpejtësi ose më shumë shkallë. Është realizëm-një AI i vetëdijshëm emocionalisht që nuk tingëllon thjesht i qetë, por tingëllon i gjallë. Real

Modeli i fjalës bisedore të Sesamit (CSM) ulet në thelbin e produktit të tij. Duke fuqizuar asistentët dixhitalë të quajtur Maya dhe Miles, modeli përqafon papërsosmëritë si hezitime, stutters, ndërrime tonale dhe hapa në kundërshtim. Kjo nuk është një gabim; Shtë e qëllimshme. Përdoruesit e përshkruan përvojën e tyre me asistentin e zërit si”me zë të lartë njerëzor”dhe madje edhe”të pakëndshëm”. Ajo interpreton sinjalet emocionale në zërin e përdoruesit-duke u zhvendosur në një ton më të ngadaltë, më qetësues kur zbulohet stresi, ose duke u bërë lojëra gjatë ndërveprimeve krijuese. Ndihmësi mund të luajë me role, të përshtatet me nxitjet e karakterit dhe të zhvendosë sjelljen në varësi të kontekstit. Designedshtë krijuar për të reaguar në kohë reale në formën dhe ritmin e një bisede, jo thjesht fjalët e folura. Modeli zhvendos dinamikisht shpërndarjen e tij bazuar në sinjalet kontekstuale. Kjo i lejon AI të përgjigjet në mënyra që ndjehen më autentike emocionale sesa të paracaktuara mekanikisht. GitHub Sipas licencës lejuese Apache 2.0, duke hapur derën që zhvilluesit të ndërtojnë mbi të me kufizime minimale. Modeli i bazës së parametrave 1B gjithashtu mund të testohet direkt përmes një demonstrimi të pritur në Përqafimi i fytyrës . CSM përpunon këto së bashku me të dhënat tekstuale, duke e bërë atë të aftë të përgjigjet me fjalim të ndërgjegjshëm kontekstualisht, të akorduar emocionalisht. Për dallim nga kufjet vizuale zhytëse, produkti është i përqendruar në audio dhe ofron ndërveprim gjatë gjithë ditës me ndihmësin e tij të AI. 

Anjney Mida, partner i përgjithshëm në Andreessen Horowitz, një nga investitorët më të hershëm të Sesamit, shkroi në një

Ky realizëm gjithashtu paraqet tregtinë e projektimit dhe performancës. Drejtimi i modeleve të përgjegjshme emocionale në kohë reale, veçanërisht në pajisjet e veshshme, vjen me kosto të larta llogaritëse. Përpunimi i dialogut natyror mbi pajisjen kërkon patate të skuqura me efikasitet të energjisë dhe arkitekturën me latencë të ulët-zonat që susami nuk duhet të detajojë publikisht. Midis lëshimeve të burimit të hapur, integrimit ambicioz të harduerit dhe një vlerësimi që raportohet se kalon shenjën miliardë dollarë, fillimi po krijon një pretendim jo vetëm se si tingëllon AI-por se si ndjehet të flasë me një.