Los investigadores en Alemania han desarrollado un modelo de visión de IA que”ve”más como un humano. Detallado en la revista naturaleza de comportamiento humano , la red neuronal totalmente topográfica (All-tnn) aprende los besis espatiales reales, como se espera ver los zapatos en el terreno en el cielo <. La IA tradicional, opera con notable eficiencia energética, una ventaja clave para los dispositivos de baja potencia. Si bien es posible que aún no supere los modelos estándar con precisión cruda, su estructura cerebral ofrece un nuevo camino para el desarrollo de IA. Este trabajo desafía la tendencia dominante de construir modelos cada vez mayores.
Una arquitectura similar al cerebro para desafiar la IA convencional
El nuevo modelo enfrenta directamente la base arquitectónica de la mayoría de los sistemas de visión de computadora modernas. De acuerdo con Un informe en el espectro IEEE , el All-TNN está diseñado para imitar la estructura topográfica y organizada de la corteza visual del cerebro humano. This is a significant departure from conventional AI.
Standard models like Convolutional Neural Networks (CNNs) rely on “weight sharing.”Esta técnica replica detectores de características idénticos en una imagen. El profesor Tim C. Kietzmann, un supervisor de estudio, llama a esto un”truco de ingeniería para ser un poco más eficiente en el aprendizaje”, señalando que no es biológicamente plausible. El cerebro simplemente no funciona de esa manera.
Kietzmann explica que la forma en que se ordena el conocimiento en el cerebro es fundamentalmente diferente de cómo se encuentra en las redes neuronales profundas,”una de las cosas que nota cuando se observa el conocimiento que se ordena en el cerebro, es que es fundamentalmente diferente a cómo se ordena en redes neurales profundas, como las redes neurales convolucionales”. El All-TNN evita compartir peso. En su lugar, utiliza una”restricción de suavidad”que alienta a las neuronas artificiales vecinas a aprender características similares, pero no idénticas. En las pruebas, el All-TNN aprendió sesgos espaciales humanos. El coautor Zejin Lu explicó:”Para los humanos, cuando detectas ciertos objetos, tienen una posición típica. Ya sabes que los zapatos generalmente están en la parte inferior, en el suelo. El avión, está en la parte superior”. El modelo se correlacionó tres veces más fuertemente con la visión humana que un CNN estándar, mostrando que había aprendido estas reglas contextuales de los datos.
rendimiento versus eficiencia: sin embargo, la compensación humana
este comportamiento humano viene con una compensación. La precisión de clasificación de imágenes de All-TNN, de alrededor del 36 por ciento, es menor que el 43.2 por ciento alcanzado por el CNN probado. Para las tareas que exigen potencia de clasificación sin procesar, los modelos establecidos aún tienen una ventaja.
pero el verdadero triunfo de todo TNN es su eficiencia. El modelo consumió más de diez veces menos energía que el CNN, a pesar de tener aproximadamente 13 veces más parámetros. Esto se debe a que su estructura topográfica le permite enfocar la potencia de procesamiento en las partes más importantes de una imagen, al igual que la visión humana.
Esta eficiencia tiene implicaciones importantes para los dispositivos AI en borde y el hardware de baja potencia, donde el consumo de energía es un cuello de botella crítico. La investigación sugiere que un mejor diseño arquitectónico puede ser una ruta más efectiva hacia la cognición avanzada que simplemente ampliar modelos y datos.
una nueva ruta en una era de modelos especializados
El desarrollo de los TNN se alinea con una tendencia de la industria más amplia. Las empresas están creando cada vez más modelos especializados, a menudo de peso abierto, como alternativas a los sistemas masivos de propósito general. Esto incluye modelos como la visión AYA multilingüe de Cohere y el VL2 de Deepseek para el análisis de documentos.
Estos sistemas, junto con RF-Detr en tiempo real de RoboFlow, muestran un giro hacia las soluciones a medida. Priorizan capacidades específicas, como la flexibilidad de la investigación, la comprensión de los documentos o el rendimiento de los bordes, sobre un enfoque único para todos. El All-TNN se ajusta perfectamente a este paisaje.
Los desafíos de la investigación. La filosofía de”la escala es todo lo que necesita”que haya dominado la IA durante años. Kietzmann argumenta que este enfoque se está volviendo insatisfactorio, afirmando:”Existe esta tendencia, una sensación de que la escala es una respuesta demasiado aburrida a la pregunta fundamental de cómo se produce la cognición”. El All-TNN proporciona una alternativa convincente al paradigma actual.
al enfocarse en la plausibilidad y la eficiencia biológica, los autores esperan que su trabajo proporcione un marco más completo para comprender la inteligencia, tanto artificiales como humanos. Se indica un cambio potencial en la investigación de IA, que va más allá del cálculo de la fuerza bruta hacia un diseño más elegante e inspirado en el cerebro.