Solo algunos Días después de los rumores de que se retrasaría, Google ha presentó oficialmente su enérgica respuesta a la decisión de Microsoft. y los avances de OpenAI en IA generativa con un nuevo conjunto de modelos denominados colectivamente Gemini. El gigante tecnológico ha desarrollado tres versiones distintas del modelo Gemini AI, cada una dirigida a diferentes niveles de complejidad computacional y entornos de aplicaciones.
[contenido integrado]
La cartera Gemini: Ultra, Pro y Nano
A la vanguardia del anuncio de Google está Gemini Ultra, diseñado para manejar”tareas altamente complejas”con una marcada ventaja en el rendimiento. Mientras tanto, Gemini Pro está diseñado para ofrecer una funcionalidad robusta y versátil en un espectro más amplio de tareas. , Gemini Nano está diseñado con un objetivo más específico: llevar capacidades de IA directamente a los dispositivos a través de tareas que requieren menos esfuerzo computacional.
Google sostiene que Gemini Ultra supera al GPT-4 de OpenAI, el motor actual detrás de Copilot de Microsoft, en una mayoría de importantes puntos de referencia de modelos lingüísticos. En un movimiento estratégico para entrelazar diferentes tipos de datos, Google desarrolló Gemini con capacidades multimodales desde el principio, asegurando que pudiera comprender y procesar entradas como texto, imágenes, audio y video de manera más integral que cualquier modelo existente de un tipo similar.
[contenido incrustado]
Implicaciones para codificadores y consumidores
Google destaca la destreza del modelo con el código y afirma que la versión inaugural La versión de Gemini puede comprender y generar de forma autónoma fragmentos de código de calidad en lenguajes de programación ampliamente utilizados como Python, Java, C++ y Go. Este aspecto lo marca como un modelo fundamental líder para aplicaciones de codificación.
“Hemos estado probando rigurosamente nuestros modelos Gemini y evaluando su rendimiento en una amplia variedad de tareas”, explica Google en su anuncio. “De Desde la comprensión de imágenes naturales, audio y video hasta el razonamiento matemático, el desempeño de Gemini Ultra supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje grande (LLM).
Con una puntuación del 90,0 %, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU ( comprensión masiva del lenguaje multitarea), que utiliza una combinación de 57 materias como matemáticas, física, historia, derecho, medicina y ética para evaluar tanto el conocimiento mundial como la capacidad de resolución de problemas”.
Al mismo tiempo, la empresa ha lanzó una actualización de su chatbot Bard, incorporando Gemini Pro para enriquecer las capacidades avanzadas de razonamiento y comprensión de la herramienta, inicialmente disponible en inglés. Google prevé más mejoras con la futura integración de Gemini Ultra en Bard, prometiendo características aún más sofisticadas.
[contenido integrado]
Los usuarios de Pixel 8 Pro también experimentarán la fortaleza de Gemini modelo, ya que Google lanza una actualización de funciones que inyecta el Gemini Nano del dispositivo en el teléfono inteligente. Permite al dispositivo resumir audio grabado, como conversaciones y entrevistas, así como proponer respuestas sugeridas a mensajes.
Al impulsar esto, Google está preparando el escenario para una competencia aguda en el ámbito de la IA generativa, proporcionando Nuevas y poderosas herramientas en varias plataformas y señalando la innovación continua en el sector.