Intsik na higanteng tech na si Tencent ay naglabas ng Hunyuanworld-Voyager, isang bagong modelo ng AI na nagiging isang solong larawan sa isang explorable 3D mundo. Ang kumpanya ay nakabukas ang tool sa Setyembre 2. Lumilikha ito ng mga 3D-consistent na video na maaaring ilipat ng mga gumagamit, na ginagawang tencent ang isang nangungunang karibal sa lahi upang makabuo ng mga modelo ng mundo ng mundo. Napakahusay na hardware, na nangangailangan ng isang GPU na may hindi bababa sa 60GB ng memorya. Hinahadlangan din ng lisensya ng modelo ang paggamit nito sa Europa at UK. Ang paglabas na ito ay bahagi ng mas malawak na Hunyuan AI ecosystem ng Tencent, na kinabibilangan ng mga modelo para sa pagsasalin at pangangatuwiran. Ang dalawahang output na ito ay kritikal, dahil pinapayagan nito para sa direktang pagbabagong-tatag ng 3D ng nabuong eksena. Ang mga gumagamit ay maaaring tukuyin ang isang landas ng camera na may mga simpleng utos tulad ng”pasulong”o”turn_left”upang mag-navigate sa kapaligiran, paggalugad ng isang static na imahe bilang isang dynamic na puwang. Mga makabagong ideya. Ang isang sangkap na”pare-pareho na pagsasabog ng video”ay nagsisiguro na ang nabuong video ay nananatiling magkakaugnay. Samantala, ang isang ‘long-range world exploration’system ay gumagamit ng isang world cache at point culling upang alalahanin ang mga elemento ng off-screen, na pumipigil sa visual artifact na naganap ang maraming mga generative na modelo ng video. Ang iba pang mga pangunahing manlalaro tulad ng Google DeepMind, na bumubuo ng sariling mga modelo ng mundo tulad ng Genie 3.
Tulad ng nabanggit ng isang malalim na siyentipiko,”Sa palagay namin ang mga modelo ng mundo ay susi sa landas patungo sa AGI, partikular na para sa mga naka-embod na ahente, kung saan ang pag-simulate ng mga tunay na senaryo sa mundo ay partikular na mapaghamong.”Sa stanford-binuo worldscore benchmark , nakamit ni Voyager ang isang nangungunang pangkalahatang marka ng 77.62. Inilalagay ito nang maaga sa mga nakikipagkumpitensya na mga modelo tulad ng Wonderworld (72.69) at CogVideox-I2V (62.15), ayon sa