Microsoft ha lanzado una vista previa pública de la”recuperación de agente”en la búsqueda de ai de Azure. Este movimiento tiene como objetivo avanzar significativamente en las capacidades de IA conversacionales. El nuevo sistema emplea modelos de idiomas grandes (LLM) para analizar los historiales de chat.
Luego descompone las preguntas complejas de los usuarios en múltiples subcontrol enfocadas. Estas subconsules se ejecutan en paralelo a través de datos de texto y vectores, de acuerdo con el anuncio de microsoft . La compañía afirma que este enfoque puede mejorar la relevancia de la respuesta hasta en un 40% en comparación con el método de generación de recuperación tradicional (RAG).
Este desarrollo es importante para los desarrolladores de agentes de IA sofisticados. La recuperación de agente tiene como objetivo proporcionar datos de base de mayor calidad y contexto. Dichos datos son esenciales para aplicaciones de IA más inteligentes. Se puede acceder a la característica a través de un nuevo objeto”Agentes de conocimiento”en la API REST de vista previa y los próximos SDK de Azure, como lo detalla microsoft aprendiendo . Se integra con Azure OpenAi y requiere Ranker semántico de Azure Ai Search.
Esto significa que se destaca en términos supermentales oficiales , que la recuperación de la agente carece de un acuerdo de servicio y aún no es una gran cantidad de producción para la producción de la producción de la producción de la producción. tener características restringidas o sin apoyo. Un nuevo modelo de facturación también se aplicará, vinculado a Azure OpenAi y Azure AI Search Usage.
cómo la recuperación de agente redefine la búsqueda
El aspecto”agente”de esta tecnología implica una LLM, como GPT-4O, examinando la conversación que los hilos de conversación para disco verdadero usuarios intent. En lugar de una sola consulta, el modelo formula múltiples subconsules en función de la entrada del usuario, el historial de chat y los parámetros de solicitud. Microsoft explica que esto permite características como reescritura de consultas, corrección de ortografía y deconstruir preguntas multifacéticas. Por ejemplo, puede manejar una consulta como”Encuentra un hotel junto a la playa con transporte en el aeropuerto cerca de los restaurantes vegetarianos”.
El componente de”recuperación”y luego ejecuta estas subcontratas simultáneamente. Los resultados se fusionan, se clasifican semánticamente y se devuelven en una respuesta de tres partes. Esta respuesta incluye datos de base para conversación, datos de referencia para la inspección de origen y un plan de actividad que detalla los pasos de ejecución. Matthew Gotteiner, durante una sesión de compilación de Microsoft, señaló que la velocidad general se relaciona con el número de subconsules.
consultas más complejas que necesitan numerosas subcontratías podrían llevar más tiempo. En contraintuitivamente, agregó, un”mini”planificador que genera menos subcontratadas más amplias podría devolver los resultados más rápido que un planificador de”tamaño completo”que crea muchas subconsules altamente enfocadas.
[Contenido integrado]
Los cambios estratégicos y las consideraciones del desarrollador
Agente de la recuperación de la actualización de la recuperación de la actualización de la actualización de microsofts con microsofts de microsofts con microsofts. 11 de agosto. Los desarrolladores están siendo guiados hacia Azure AI Agent Service, que incluye una característica de”Bing Bing Search”. Esta transición, sin embargo, ha presentado desafíos.
Algunos desarrolladores han expresado su preocupación sobre el manejo de datos, ya que la información podría moverse fuera de los límites estándar de cumplimiento de Azure, y tienen Con herramientas como C# Semántica Kernel.
A pesar de estos obstáculos de transición, el movimiento hacia herramientas de IA más avanzadas como Agentic Rag (Arag) se considera un progreso. Akshay Kokane, un ingeniero de software de Microsoft,
Agregó que Arag”aborda esta brecha al introducir razonamiento dinámico, selección de herramientas inteligentes y refinamiento iterativo”. Interior de la industria, AT&T declaró su entusiasmo, señalando que”esperan usar la recuperación de agente de Azure Ai Search con nuestros agentes para que coincidan con la velocidad, la complejidad y la diversidad de la información que necesitaremos para alcanzar nuestros objetivos”, según el anuncio de los Hub de la Comunidad de Microsoft. Azure AI Search, que se conecta a un LLM en Azure OpenAi para construir y ejecutar planes de consulta. Actualmente, la configuración es solo a través de las API REST de vista previa, según lo detallado por Ranker semántico , en todos los niveles de búsqueda de Azure AI, excepto el libre, según los de Microsoft. Billing involucrados por la factura de la factura, los paseos, los paseos, los que se basan en la gran cantidad de la gran cantidad de la reducción de la reducción de la factura de la factura, los paseos, los paseos. Planificación de consultas a través de Azure OpenAi . Se aplican cargos similares para la clasificación semántica a través de Azure AI Search. Sin embargo, Microsoft afirma que estos costos de clasificación se renuncian inicialmente para la recuperación de agente Durante la vista previa. Microsoft ofrece documentos extensos y muestras para python , . net , y REST Para ayudar a los desarrolladores. La recuperación de agente también es parte de las recientes actualizaciones de Foundry de Azure Ai.