Microsoft tiene presentó tres nuevos modelos a su familia Phi-3 de modelos de lenguaje pequeño (SLM): Phi-3-small y Phi-3-medium ya están disponibles, y Phi-3-vision es un modelo nuevo. Estos modelos están diseñados para ser eficientes y potentes, y se adaptan a diversos entornos con recursos limitados, como escenarios de inferencia en el dispositivo, en el borde y fuera de línea. Microsoft anunció inicialmente la familia Phi-3 el mes pasado.

Capacidades y optimización

Los modelos Phi-3 están diseñados para ofrecer un alto rendimiento y al mismo tiempo ser rentables. Están optimizados para entornos donde los tiempos de respuesta rápidos son esenciales, lo que los hace adecuados para dispositivos móviles y otras plataformas con recursos computacionales limitados. Esta optimización garantiza que los modelos puedan funcionar de manera eficiente sin consumir excesiva memoria o potencia de procesamiento.

Phi-3-Vision: un modelo multimodal

Entre los nuevos lanzamientos, Phi-3-Vision se destaca como un modelo multimodal capaz de procesar tanto texto como imágenes. Este modelo, que cuenta con 4.200 millones de parámetros, destaca en tareas generales de razonamiento visual. A diferencia de otros modelos de IA que generan imágenes, Phi-3 Vision se centra en comprender y analizar datos visuales, lo que lo hace útil para tareas como la interpretación de cuadros y gráficos.

[contenido integrado]

Microsoft ha integrado el modelo Phi-3-mini en su Plataforma de modelos como servicio (MaaS) de Azure AI. Esta integración permite a los usuarios aprovechar las capacidades de Phi-3-mini para diversas aplicaciones a través de la infraestructura de Azure. Además, Microsoft está mejorando sus ofertas de API para admitir experiencias multimodales, lo que permite aplicaciones de IA más versátiles.

Nuevas funciones en Azure AI Speech

Junto con la Anuncios del modelo Phi-3, Microsoft también está presentando nuevas funciones para Azure AI Speech. Estas características incluyen análisis de voz y traducción universal, destinadas a ayudar a los desarrolladores a crear aplicaciones habilitadas para voz de alta calidad. Se espera que estas mejoras proporcionen herramientas más sólidas para el procesamiento y análisis de voz.

La familia Phi-3 se presentó inicialmente en abril con el lanzamiento de Phi-3-mini, un modelo con 3.800 millones de parámetros. Las nuevas incorporaciones, Phi-3-small y Phi-3-medium, tienen 7 mil millones y 14 mil millones de parámetros, respectivamente. Estos modelos están diseñados para consumir menos recursos informáticos, lo que los hace adecuados para una amplia gama de dispositivos, incluidos teléfonos inteligentes y portátiles.

Categories: IT Info