Tongyi Lab de
Alibaba ha presentado R1-AMNI, un modelo de inteligencia artificial (IA) de código abierto capaz de interpretar las emociones humanas a través del análisis de datos visuales y auditivos.
R1-AMNI utiliza el aprendizaje de refuerzo con recompensa verificable (RLVR), mejorando su razonamiento, precisión y adaptabilidad. El modelo posiciona Alibaba junto con los principales competidores de IA como OpenAI y Deepseek, marcando un avance estratégico en el sector de modelos de IA.
Según Alibaba, R1-OMNI aplica RLVR por primera vez dentro de un modelo de lenguaje grande multimodal. La compañía establece :”R1-OMNI es la primera aplicación de la industria de aprendizaje de refuerzo con recompensa verificable (RLVR) a un modelo omni-Multimodal grande. Nos centramos en el reconocimiento de emociones, una tarea donde las modalidades visuales y de audio juegan roles cruciales, para validar el potencial de combinar RLVR con el modelo OMNI”. > rlvr y cómo avanza el aprendizaje de R1-AMNI
RLVR opera recompensando el modelo AI solo cuando las salidas cumplen con los criterios verificables, asegurando que el proceso de aprendizaje del modelo se guíe por los comentarios de R1-OMNI.
El proceso de capacitación del modelo incorporó grandes conjuntos de datos como MAFW y DFEW, con más de 15,000 muestras de video, mejorando su capacidad para generalizar el reconocimiento en diversos escenarios.
Para agilizar la eficiencia de capacitación, R1-OMNI integra