Penyelidik di Jerman telah membangunkan model penglihatan AI yang”melihat”lebih seperti manusia. terperinci dalam jurnal alam manusia tingkah laku Sky.
Tidak seperti AI tradisional, ia beroperasi dengan kecekapan tenaga yang luar biasa, kelebihan utama untuk peranti kuasa rendah. Walaupun ia belum dapat mengalahkan model standard dalam ketepatan mentah, struktur seperti otaknya menawarkan jalan baru untuk pembangunan AI. Kerja ini mencabar trend dominan membina model yang lebih besar.
Senibina seperti otak untuk mencabar AI konvensional
Model baru secara langsung menghadapi asas seni bina sistem penglihatan komputer yang paling moden. Menurut
Pendekatan ini mewujudkan struktur yang licin, seperti peta. Dalam ujian, semua-TNN mempelajari kecenderungan spatial seperti manusia. Coauthor Zejin Lu menjelaskan,”Bagi manusia, apabila anda mengesan objek tertentu, mereka mempunyai kedudukan biasa. Anda sudah tahu kasut biasanya di bahagian bawah, di atas tanah. Model ini berkorelasi tiga kali lebih kuat dengan penglihatan manusia daripada CNN standard, menunjukkan ia telah mempelajari peraturan kontekstual ini dari data. Ketepatan klasifikasi imej All-TNN, sekitar 36 peratus, lebih rendah daripada 43.2 peratus yang dicapai oleh CNN yang diuji. Untuk tugas yang menuntut kuasa klasifikasi mentah, model yang ditubuhkan masih memegang kelebihan.
Tetapi kejayaan sebenar All-TNN adalah kecekapannya. Model yang digunakan lebih dari sepuluh kali tenaga kurang daripada CNN, walaupun mempunyai kira-kira 13 kali lebih banyak parameter. Ini kerana struktur topografinya membolehkan ia memfokuskan kuasa pemprosesan pada bahagian yang paling penting dalam imej, seperti penglihatan manusia.
Kecekapan ini mempunyai implikasi utama untuk AI pada peranti tepi dan perkakasan kuasa rendah, di mana penggunaan tenaga adalah hambatan kritikal. Penyelidikan ini menunjukkan bahawa reka bentuk seni bina yang lebih baik boleh menjadi jalan yang lebih berkesan untuk kognisi maju daripada sekadar meningkatkan model dan data.
Jalan baru dalam era model khusus
Pembangunan All-TNN sejajar dengan trend industri yang lebih luas. Syarikat-syarikat semakin mencipta model khusus, sering terbuka, model sebagai alternatif kepada sistem tujuan umum. Ini termasuk model seperti Visi AYA berbilang bahasa Cohere dan DeepSeek’s VL2 untuk analisis dokumen.
Sistem-sistem ini, bersama-sama dengan RF-DETR masa nyata Roboflow, menunjukkan pivot ke arah penyelesaian yang disesuaikan. Mereka mengutamakan keupayaan khusus seperti fleksibiliti penyelidikan, pemahaman dokumen, atau prestasi kelebihan-lebih banyak pendekatan yang sesuai. All-TNN sesuai dengan landskap ini. Kietzmann berhujah bahawa pendekatan ini menjadi tidak memuaskan, menyatakan,”Ada trend ini, perasaan bahawa skala itu terlalu membosankan jawapan kepada persoalan asas bagaimana kognisi berlaku.”All-TNN menyediakan alternatif yang menarik kepada paradigma semasa.
Dengan memberi tumpuan kepada kemusnahan dan kecekapan biologi, penulis berharap kerja mereka akan menyediakan rangka kerja yang lebih lengkap untuk memahami kecerdasan-kedua-dua buatan dan manusia. Ia menandakan pergeseran yang berpotensi dalam penyelidikan AI, bergerak melampaui pengiraan kekerasan yang lebih elegan ke arah reka bentuk yang lebih elegan, yang diilhamkan oleh otak.