IBM ha lanzado sus nuevos modelos AI de Granite 4.0, ofreciendo un gran salto en eficiencia para las empresas.

lanzado esta semana, la familia de código abierto usa un diseño híbrido novedoso, mezcla Mamba-2 y Transformer Architectures. Este enfoque reduce las necesidades de memoria en más del 70 por ciento, lo que reduce los costos de hardware para tareas complejas.

Los modelos están creados para uso empresarial, centrándose en la confianza y el alto rendimiento. Están disponibles ahora en watsonx.ai de IBM , Face abrazando , y otras plataformas.

>

Granite 4.0 marca el movimiento de IBM para proporcionar una herramienta de inteligencia artificial poderosa pero asequible para el mercado global, posicionándolo como un competidor clave.

Este lanzamiento indica un impulso estratégico de IBM para recuperar un papel de liderazgo en el panorama de IA de fuente abierta. Contender.

Una arquitectura híbrida para abordar el problema de eficiencia de la IA

en el corazón de Granite 4.0 es una solución inteligente para uno de los mayores desafíos de la IA: los inmensos costos computacionales de los modelos de transformadores. Esto los hace costosos de ejecutar.

Los nuevos modelos de IBM esquivan este problema combinando dos arquitecturas diferentes. Ellos Combine las capas de Mamba-2 altamente eficientes con un pequeño número de bloques transformadores tradicionales en una relación 9: 1 .

modelo, procesa información linealmente, lo que lo hace mucho más adecuado para documentos largos .

Este diseño híbrido ofrece lo mejor de ambos mundos. Mantiene la precisión contextual por la que los transformadores son conocidos al tiempo que aprovechan la velocidad y la eficiencia de la memoria de Mamba.

El resultado es una reducción significativa en el hardware necesario para ejecutar una potente IA, disminuir la barrera de entrada para muchas organizaciones .

La mudanza es parte de una carrera de la industria ai. Los investigadores están explorando varios métodos, desde las cascadas especulativas de Google hasta técnicas de compresión sin pérdidas como DFLOAT11, todos con el objetivo de hacer que los modelos grandes sean más accesibles y sostenibles. La innovación arquitectónica de IBM es una entrada importante en este campo.

rendimiento y practicidad para las cargas de trabajo empresariales

El enfoque de IBM está directamente en el rendimiento de la empresa y la practicidad. La compañía afirma que la nueva arquitectura puede reducir los requisitos de memoria de GPU en más del 70% durante la inferencia, especialmente para cargas de trabajo con contextos largos o muchos usuarios simultáneos. Esto se traduce directamente en costos operativos más bajos.

La familia Granite 4.0 incluye varios tamaños para satisfacer diferentes necesidades. La alineación presenta dos modelos de mezcla de expertos (MOE), H-Small (~ 9B de parámetros activos) y H-Tiny (~ 1b activo), junto con un modelo híbrido 3B denso.

también se ofrece un transformador 3B puro para las plataformas que aún no admiten el diseño híbrido.

Estos modelos perforan sobre su peso en los contenedores de la industria clave. El modelo Granite-4.0-H-Small sobresale en las tareas de seguimiento de instrucciones (Ifeval) y es altamente competitiva en las llamadas de funciones (BFCLV3), de acuerdo con los datos de IBM.

Esto demuestra su preparación para flujos de trabajo complejos y agentes comunes en entornos comerciales.

Para manejar datos empresariales exigentes, los modelos fueron capacitados en un corpus masivo de 22 billones de token. También fueron entrenados en secuencias de muestra de hasta 512k tokens de largo, asegurando un rendimiento robusto en tareas que requieren ventanas de contexto muy largas.

modelos de código abierto construidos sobre una base de confianza

Más allá del rendimiento, IBM está enfatizando la confianza y el gobierno responsable. Granite 4.0 se publica bajo la licencia Permisive Apache 2.0, alentando una amplia adopción y modificación.

Este enfoque abierto es un claro diferenciador en un mercado a menudo dominado por sistemas cerrados y patentados.

En un primer primer href=”https://www.iso.org/standard/88934.html”target=”_ blank”> logrado ISO/IEC 42001: 2023 certificación .

Este estándar internacional verifica que el sistema de gestión de IBM cumple con los requisitos rigorosos para la responsabilidad, la transparencia y los datos de los datos, el privado de los stander en el entorno de la IBM que se reúne con los requisitos de la AI de IBM en la transferencia, la transparencia, la transparencia y los datos de los datos, el privado de la IBM en el entorno de la IBM. Industrias.

Para reforzar aún más la seguridad, cada punto de control del modelo está firmado criptográficamente, lo que permite a los desarrolladores verificar su autenticidad e integridad.

su compromiso con un ecosistema abierto y seguro es fundamental para la estrategia de IBM. La compañía planea expandir a la familia con variantes de”pensamiento”centradas en el razonamiento más tarde en 2025.

Categories: IT Info