Pesquisadores na Alemanha desenvolveram um modelo de visão de IA que “vê”mais como um humano. detalhado na revista Nature Human Behavior , a rede neural de suportes e os sapatos, como os que estão, as que estão, as pessoas que não têm, as linhas de relevante. AI, opera com notável eficiência energética, uma vantagem fundamental para dispositivos de baixa potência. Embora possa ainda não superar os modelos padrão em precisão bruta, sua estrutura semelhante ao cérebro oferece um novo caminho para o desenvolvimento da IA. Este trabalho desafia a tendência dominante de construir modelos cada vez maiores. De acordo com um relatório no espectro IEEE , o All-TNN foi projetado para imitar a estrutura topográfica e organizada da cortex visual do cérebro humano. Este é um afastamento significativo da IA ​​convencional. Essa técnica replica detectores de recursos idênticos em uma imagem. O professor Tim C. Kietzmann, um supervisor de estudo, chama isso de”hacker de engenharia para ser um pouco mais eficiente no aprendizado”, observando que não é biologicamente plausível. O cérebro simplesmente não funciona dessa maneira.

Kietzmann explica que a maneira como o conhecimento é ordenada no cérebro é fundamentalmente diferente de como é em redes neurais profundas: “Uma das coisas que você percebe quando você olha para a maneira como o conhecimento é ordenado no cérebro, é que é fundamentalmente diferente de que é ordenado. O All-TNN evita o compartilhamento de peso. Em vez disso, usa uma”restrição de suavidade”que incentiva os neurônios artificiais vizinhos a aprender características semelhantes, mas não idênticas. Nos testes, os vieses espaciais humanos aprendidos de TNN aprendiam. O co-autor Zejin Lu explicou:”Para os seres humanos, quando você detecta certos objetos, eles têm uma posição típica. Você já sabe que os sapatos geralmente estão no fundo, no chão. O avião, está no topo”. O modelo correlacionou-se três vezes mais fortemente com a visão humana do que uma CNN padrão, mostrando que havia aprendido essas regras contextuais com os dados. A precisão da classificação da imagem do TNN, em torno de 36 %, é menor que os 43,2 % alcançados pela CNN testada. Para tarefas que exigem poder de classificação bruta, os modelos estabelecidos ainda mantêm uma vantagem.

Mas o verdadeiro triunfo do TNN é sua eficiência. O modelo consumiu mais de dez vezes menos energia que a CNN, apesar de ter aproximadamente 13 vezes mais parâmetros. Isso ocorre porque sua estrutura topográfica permite concentrar o poder de processamento nas partes mais importantes de uma imagem, assim como a visão humana. A pesquisa sugere que um melhor design arquitetônico pode ser um caminho mais eficaz para a cognição avançada do que simplesmente ampliar modelos e dados. As empresas estão criando cada vez mais modelos especializados, geralmente de peso aberto, como alternativas a sistemas maciços de uso geral. Isso inclui modelos como o Aya Vision da Cohere e o VL2 da Deepseek para análise de documentos. Eles priorizam recursos específicos-como a flexibilidade da pesquisa, o entendimento do documento ou o desempenho de borda-em uma abordagem de tamanho único. O All-TNN se encaixa perfeitamente nessa paisagem. Kietzmann argumenta que essa abordagem está se tornando insatisfatória, afirmando:”Existe essa tendência, um sentimento de que a escala é muito chata de uma resposta para a questão fundamental de como a cognição acontece”. O All-TNN fornece uma alternativa convincente ao paradigma atual.

Ao focar na plausibilidade e eficiência biológicas, os autores esperam Ele sinaliza uma mudança potencial na pesquisa de IA, indo além da computação de força bruta para um design mais elegante e inspirado no cérebro.

Categories: IT Info