Alibaba Cloud ha anunciado una reducción de precio del 85 % para su modelo de inteligencia artificial de razonamiento visual, Qwen-VL-Max. La movimiento se produce mientras los gigantes tecnológicos chinos, incluidos ByteDance y Baidu, luchan por el dominio en el sector de IA empresarial en rápido crecimiento.
El precio reducido, que posiciona Qwen-VL-Max a 0,003 yuanes (0,00041 dólares) por cada mil tokens, refleja la estrategia agresiva de ByteDance para reducir los costos de su Modelo de inteligencia artificial de razonamiento visual lanzado a principios de diciembre.
La serie Qwen-VL de Alibaba abarca varios otros modelos avanzados que integran datos visuales y textuales para tareas como subtítulos de imágenes, respuesta visual a preguntas y generación de contenido multimodal. La línea incluye Qwen-VL, Qwen-VL-Chat, Qwen2-VL y el QVQ-72B-Preview experimental. Qwen2-VL, con su rendimiento de última generación, ha sobresalido en pruebas comparativas como MathVista y DocVQA, superando a menudo a competidores líderes como GPT-4V de OpenAI y Gemini Ultra de Google.
Con más de 252 modelos de IA generativa aprobados en Este año, el mercado de China se ha saturado, lo que ha llevado a las empresas a adoptar estrategias innovadoras de precios y tecnología para asegurar su participación en el mercado.
Los precios estratégicos como patrón consistente
El anuncio de diciembre es el tercer ajuste importante de precios de IA de Alibaba en 2024, luego de una reducción del 55% en febrero para los productos principales de la nube y un descuento del 97% en mayo para la suite Qwen AI. Estos movimientos reflejan un enfoque constante en la asequibilidad, con el objetivo de atraer a clientes empresariales que exploren herramientas avanzadas de IA para procesos y análisis de negocios.
Al reducir costos, Alibaba busca posicionar sus ofertas de IA como herramientas indispensables para las empresas que navegan por las complejidades. de adoptar inteligencia artificial. La facturación basada en tokens, que cobra a los usuarios por interacciones específicas de IA, se ha convertido en un elemento central de las estrategias de precios, lo que permite un acceso escalable a modelos potentes sin inversiones iniciales prohibitivas.
Avanzando en la IA multimodal con QVQ-72B
A principios de esta semana, Alibaba presentó QVQ-72B, un modelo de IA multimodal de código abierto que integra capacidades de razonamiento visual y textual. Esta versión se basa en su predecesor, Qwen2-VL-72B, y mejora la funcionalidad para la investigación científica y el análisis avanzado.
Los puntos de referencia han validado las capacidades del QVQ-72B, y el modelo alcanzó una puntuación de 70,3 en el punto de referencia MMMU. una prueba diseñada para evaluar el razonamiento multimodal a nivel universitario y sobresalir en MathVista y OlympiadBench. Estos resultados colocan al QVQ-72B entre los modelos de código abierto más competitivos de la industria.
QwQ-32B: un modelo de precisión lógica
En noviembre , Alibaba presentó QwQ-32B, un modelo diseñado para razonamiento lógico, codificación y tareas matemáticas avanzadas. Su función de cálculo en tiempo de prueba asigna recursos computacionales adicionales durante la ejecución, lo que mejora la precisión de los problemas complejos. Si bien esto ralentiza los tiempos de respuesta, la precisión ofrecida por QwQ-32B ha sido elogiada en evaluaciones comparativas y aplicaciones empresariales.
El lanzamiento de QwQ-32B bajo la licencia Apache 2.0 refleja el compromiso de Alibaba de equilibrar la colaboración y el control propietario.. Al centrarse en la IA centrada en el razonamiento, Alibaba compite directamente con modelos como R1-Lite-Preview de DeepSeek y el modelo o1 de OpenAI, los cuales priorizan la profundidad lógica y la resolución iterativa de problemas.
El sector de IA generativa de China ha sido testigo una rápida proliferación de modelos, con más de 250 ofertas aprobadas para uso público solo en 2024. Esta saturación ha impulsado una intensa competencia entre los líderes de la industria y las nuevas empresas, cada uno de los cuales compite por diferenciarse a través de precios y características tecnológicas únicas.
DeepSeek, por ejemplo, ha enfatizado la transparencia con su modelo R1-Lite-Preview, que utiliza razonamiento en cadena de pensamiento para dividir los problemas en pasos incrementales, lo que permite a los usuarios seguir su proceso de toma de decisiones. Mientras tanto, ByteDance y Alibaba se centran en la asequibilidad para impulsar la adopción en un mercado cada vez más saturado.