Amazon Web Services ha lanzado oficialmente a Nova Premier, haciendo que su IA multimodal más avanzada generalmente esté disponible a través de su servicio de rock de Amazon.

Capaz de procesar texto, imágenes y entradas de video (pero explícitamente no audio) dentro de una ventana de contexto de un millón de personas, presente aproximadamente a 750,000 palabras: Aws es una posición de cuidadosamente un paremier. Challenger en la arena de razonamiento de IA dedicada, pero más bien como un modelo de”maestro”poderoso y rentable diseñado para facilitar la destilación de modelos de IA más pequeños y especializados adaptados a las necesidades específicas de los clientes. Distillation, in this context, involves transferring the knowledge and capabilities of a large model (the teacher) to a smaller one (the student) to create efficient, task-specific systems.

La destilación toma el centro del escenario

El énfasis de AWS está directamente en el papel de Nova Premier dentro del marco de destilación del modelo de roca madre de Amazon. La idea es que los clientes aprovechen las sofisticadas capacidades de análisis de Premier (tareas complejas que se extienden, la planificación de varios pasos y la coordinación en todas las herramientas) para generar conjuntos de datos de capacitación de alta calidad.

Estos conjuntos de datos pueden luego ajustar modelos más eficientes como Nova Pro, Lite o Micro para entornos de producción. AWS ilustró esto con un escenario de investigación de inversiones de múltiples agentes donde Premier, que actuaba como agente de supervisor, coordinó sub-agentes especializados. Para el despliegue, AWS sugiere destilar las habilidades de supervisión de Premier en un modelo Nova Micro personalizado, incluso señalando que los registros de invocación de roca en la base pueden optimizar la preparación de datos para este proceso.

capacidades y cápsulas y puntos de referencia

La naturaleza multimodal de novas de nova, la naturaleza multimodal de nota, permite procesarlo y comprender la información, las imágenes, y el contenido de videos y el videos. Su ventana de contexto de un millón de token permite un análisis profundo de documentos largos o conjuntos de datos complejos.

Premier demuestra una fuerza particular en la comprensión visual, capaz de interpretar gráficos, gráficos e infografías dentro de los documentos. Los puntos de referencia oficiales se detallan en Informe técnico Muestra calificaciones de logro Premier como 87.1% en MMLU y 80.5% en Humeval+. <. Retrajes detrás de algunos competidores, como Gemini 2.5 Pro de Google, en puntos de referencia de codificación específicos (verificados por Bench SWE) y ciertas evaluaciones de matemáticas/ciencias (GPQA Diamond, AIME 2025). 

A pesar de esto, AWS afirma que Premier es el modelo más rápido y rentable en comparación con otros modelos de no razonamiento en su nivel de inteligencia en Bedrock, con un precio de $ 2.50 por millón de tokens de entrada y $ 12.50 por millón de tokens de salida a través de la API Converse. 

ajustado en la creciente familia Nova

Premier se une a un conjunto de modelos Nova en expansión de AWS Re: Invent en diciembre de 2024. Ese lanzamiento inicial incluyó el texto centrado en el texto de Nova Micro, Multimodal Lite y Pro Models, y las herramientas creativas Nova Canvas (generación de imágenes) y NovA Reel (Video Micro (generación). Esa vez, el CEO de Amazon, Andy Jassy, ​​enfatizó la rentabilidad de la familia:”Los modelos Nova son un 75% menos costosos que los otros modelos líderes en Bedrock… Son los modelos más rápidos que encontrará”. Desde entonces, AWS ha agregado el SDK de la Ley Nova para la creación de agentes web, abrió el portal Nova.amazon.com para la experimentación del modelo público (que permite la interacción sin necesidad de una cuenta de AWS) y lanzó el modelo de voz a voz de Nova Sonic.

La llegada de Premier agrega el modelo de capacidad general más alto de nivel a este ecosistema. Sin embargo, su lanzamiento también subraya la estrategia continua de AWS de ofrecer a los clientes una opción de modelos en Bedrock, incluidas opciones de terceros como el Claude de Anthrope, en lugar de promover exclusivamente los suyos.

La pregunta de razonamiento sigue abierta

Es importante que no sea importante que no sea el primer ministro es explícitamente strong> strong> strong el motivo de dedicado de Amazoniced de Aymo, no es importante que no sea el primer ministro. desarrollándose en marzo. Ese modelo separado, potencialmente que presenta”razonamiento híbrido”para un análisis rápido y profundo, todavía se anticipa a mediados de 2025, según informes anteriores y las propias comunicaciones de Amazon.

Premier, aunque capaz de tareas complejas, no emplea los enfoques computacionales específicos e intensivos en el tiempo característicos de los motivos de razonamiento dedicados como el O4-Mini de OpenAi o las profundidades de R1. AWS ha incluido controles de seguridad incorporados dentro de Premier para promover el uso responsable de la IA. El modelo está actualmente disponible en Bedrock a través de la inferencia de región cruzada de US East (N. Virginia), US East (Ohio) y las regiones de AWS de US West (Oregon).

Categories: IT Info