A németországi kutatók kifejlesztettek egy AI látásmodellt, amely „látja” inkább egy embert. A Nature Human Behavior Journal-ban részletezve, az egész topográfiai ideghálózat (all-tnn) a valós world spatialis torzítókat tanulja meg. A hagyományos AI, figyelemre méltó energiahatékonysággal működik, ez az alacsony fogyasztású eszközök kulcsfontosságú előnye. Noha ez még nem verte meg a standard modelleket nyers pontosságban, az agyszerű felépítése új utat kínál az AI fejlődéshez. Ez a munka megkérdőjelezi az egyre törő modellek felépítésének domináns tendenciáját. Az Az IEEE spektrumban szereplő jelentés, az All-TNN célja az emberi agy vizuális kéregének topográfiai, szervezett szerkezetének utánozása. Ez jelentős eltérés a hagyományos AI-től. Ez a technika megismétli az azonos jellemzők detektorokat egy képen. Tim C. Kietzmann professzor, a tanulmányi felügyelő ezt „mérnöki hacknek egy kicsit hatékonyabbnak nevezi”, megjegyezve, hogy ez nem biológiailag hihető. Az agy egyszerűen nem működik így. Az All-TNN elkerüli a súlymegosztást. Ehelyett egy „simaság-korlátozást” használ, amely arra ösztönzi a szomszédos mesterséges idegsejteket, hogy hasonló, de nem azonos tulajdonságokat tanuljanak meg.

Ez a megközelítés sima, térképszerű szerkezetet hoz létre. A tesztek során az All-TNN megtanulta az emberszerű térbeli torzításokat. Zejin Lu társszerzője elmagyarázta: „Az emberek számára, amikor bizonyos tárgyakat észlel, tipikus helyzetük van. Már tudod, hogy a cipő általában az alján, a földön van. A repülőgép, a tetején van.”A modell háromszor erősebben korrelált az emberi látással, mint a szokásos CNN-vel, megmutatva, hogy ezeket a kontextusos szabályokat az adatokból megtanulta. Az All-TNN képosztályozási pontossága, körülbelül 36 %, alacsonyabb, mint a vizsgált CNN által elért 43,2 százalék. A nyers besorolási teljesítményt igénylő feladatok esetében a megalapozott modellek továbbra is élnek. A modell tízszer kevesebb energiát fogyasztott, mint a CNN, annak ellenére, hogy körülbelül 13-szor több paraméterrel rendelkezik. Ennek oka az, hogy topográfiai felépítése lehetővé teszi, hogy a feldolgozási teljesítményt a kép legfontosabb részeire összpontosítsa, hasonlóan az emberi látáshoz. A kutatás azt sugallja, hogy a jobb építészeti tervezés hatékonyabb út lehet a fejlett megismeréshez, mint a modellek és az adatok egyszerű méretezése. A vállalatok egyre inkább speciális, gyakran nyitott súlyú modelleket hoznak létre, mint a hatalmas, általános célú rendszerek alternatíváit. Ide tartoznak olyan modellek, mint a Cohere többnyelvű Aya Vision és a DeepSeek VL2 a dokumentum elemzéséhez. A konkrét képességeket-például a kutatás rugalmasságát, a dokumentum megértését vagy az él teljesítményét-prioritást élveznek, és mindenki számára megfelelő megközelítés. Az All-TNN szépen illeszkedik ebbe a tájba. Kietzmann azt állítja, hogy ez a megközelítés nem lesz kielégítő, kijelentve:”Van ez a tendencia, az az érzés, hogy a skála túlságosan unalmas a válasz a megismerés alapvető kérdésére.”Az All-TNN kényszerítő alternatívát kínál a jelenlegi paradigmának. Ez jelzi az AI kutatás potenciális eltolódását, amely túlmutat a brutális erő kiszámításán az elegánsabb, agyi ihletésű kialakítás felé.