El Instituto de Innovación Tecnológica (TII) de los Emiratos Árabes Unidos (EAU) ofrece ahora su nuevo Falcon 180B modelo de lenguaje grande (LLM) como herramienta de acceso abierto para aplicaciones comerciales y de investigación.
En términos de tareas de lenguaje natural, Falcon 180B logra resultados de última generación, encabezando la clasificación de Hugging Face para modelos de acceso abierto y competir con modelos propietarios como PaLM-2 de Google.
Después de que su predecesor Falcon 40B alcanzara la cima de la tabla de clasificación Hugging Face para LLM en mayo de 2023, TII continúa su liderazgo en IA generativa. Falcon 40B fue uno de los primeros modelos de código abierto disponibles para una amplia audiencia. Si no está familiarizado con la tabla de clasificación de Hugging Face, es una clasificación de modelos de lenguaje grandes según su grado de apertura.
Especificaciones y logros
Falcon 180B, con sus 180 mil millones de parámetros, se sometió a entrenamiento con 3,5 billones de tokens. En varios puntos de referencia, superó a sus competidores en áreas como pruebas de razonamiento, codificación, competencia y conocimientos. Falcon 180B iguala el rendimiento del GPT 4 de OpenAI y del PaLM 2 de Google, aunque tiene la mitad del tamaño de este último. El modelo opera bajo la’Licencia Falcon 180B TII’, inspirada en Apache 2.0.
H.E. Faisal Al Bannai, secretario general del Consejo de Investigación de Tecnología Avanzada, enfatizó el compromiso del instituto de”democratizar el acceso a la IA avanzada”y garantizar que todos compartan los”beneficios de la IA”.
Dr. Ebtesam Almazrouei, director ejecutivo e investigador jefe interino de la unidad intercentro de IA de TII, destacó el potencial del Falcon 180B, señalando que”marca una nueva era de IA generativa”y enfatiza la importancia de los”avances colaborativos”para abordar los desafíos globales./p>
Desde el lanzamiento inicial de Falcon, más de 12 millones de desarrolladores lo han adoptado. Falcon 180B sirve como una nueva opción para diversas aplicaciones, desde chatbots hasta generación de código. Admite los principales idiomas, como inglés, alemán, español y francés, y ofrece capacidades en varios otros idiomas.