Google DeepMind ha iniciado una nueva iniciativa para crear sistemas avanzados de inteligencia artificial (IA) capaces de simular entornos físicos y virtuales.
Tim Brooks, ex investigador de OpenAI, lidera ahora el esfuerzo, que se centra sobre”modelos mundiales”: sistemas de inteligencia artificial diseñados para predecir e interactuar con la dinámica del mundo real. En una publicación en X, Brooks afirmó:”DeepMind tiene planes ambiciosos para crear modelos generativos masivos que simulen el mundo”.
Este proyecto está estrechamente vinculado a La estrategia más amplia de Google para avanzar en la inteligencia general artificial (AGI). Los modelos mundiales se consideran un paso fundamental para lograr la AGI, una forma de IA capaz de realizar cualquier tarea intelectual que un ser humano pueda realizar.
El nuevo equipo colaborará con proyectos existentes de DeepMind, incluida la IA multimodal Gemini model, la plataforma de generación de vídeo Veo, y Genie, un generador de entornos para simulaciones 3D interactivas.
DeepMind tiene planes ambiciosos para crear modelos generativos masivos que simulen el mundo. Estoy contratando para un nuevo equipo con esta misión. ¡Ven a construir con nosotros!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
—Tim Brooks (@_tim_brooks) 6 de enero de 2025
Modelado mundial de IAing
Los modelos mundiales representan una desviación significativa de los sistemas tradicionales de IA, que reaccionan principalmente a la entrada de datos. En cambio, estos modelos simulan entornos complejos mediante el análisis de datos multimodales, como texto, imágenes y vídeos. Esta capacidad predictiva permite aplicaciones en diversos campos, desde capacitación en robótica hasta juegos interactivos.
Una descripción del trabajo para el nuevo equipo destaca los objetivos más amplios: “Creemos que ampliar el entrenamiento previo en video y datos multimodales está en el camino crítico hacia la inteligencia artificial general. Los modelos mundiales impulsarán numerosos dominios, como el razonamiento visual y la simulación, la planificación para agentes encarnados y el entretenimiento interactivo en tiempo real”.
Al simular la dinámica del mundo real, los modelos mundiales proporcionan una zona de pruebas virtual para realizar pruebas y aprendiendo, mejorando la capacidad de la IA para adaptarse y responder en escenarios del mundo real.
El proyecto Genie de DeepMind ofrece una visión de las posibilidades, lanzado en diciembre, Genie 2 puede generar mundos 3D jugables. Las demostraciones basadas en las indicaciones de los usuarios incluyeron una simulación de una expedición en barco y un western con temática ciberpunk, que muestra la versatilidad de la plataforma en la creación de entornos interactivos.
Demostración interactiva de simulación de IA cuadro por cuadro creada con Google Genie 2 (Fuente: Google)
El trabajo La investigación sobre modelos mundiales es intrínsecamente compleja y requiere una infraestructura de vanguardia y vastos recursos computacionales. La oferta de trabajo de DeepMind para un puesto de ingeniero de investigación en modelado mundial describe los desafíos técnicos involucrados. Las responsabilidades incluyen:
Capacitación de transformadores multimodales a gran escala capaces de analizar diversos tipos de datos. Construir infraestructura para canalizaciones de datos de vídeo, garantizando una curación y anotación eficientes. Optimización de sistemas de inferencia para aplicaciones en tiempo real, lo que permite una interactividad perfecta. Desarrollar métricas de evaluación cuantitativa para medir la precisión física y la inteligencia. Explorando transformadores de contexto ultralargo, que permiten a la IA analizar secuencias extendidas de datos.
El énfasis en la ampliación refleja el compromiso de hacer que estos sistemas sean robustos y eficientes. La filosofía de DeepMind, resumida como las responsabilidades clave en la descripción del trabajo, subraya este enfoque:
“Implementar infraestructura central y realizar investigaciones para construir modelos generativos del mundo físico. Resuelva problemas esenciales para entrenar simuladores mundiales a escala masiva, desarrolle métricas y leyes de escala para la inteligencia física, seleccione y anote datos de entrenamiento, permita la generación interactiva en tiempo real y estudie la integración de modelos mundiales con modelos de lenguaje multimodal. Acepte la amarga lección y busque métodos simples que puedan escalar, con énfasis en sistemas e infraestructuras sólidos”.
Aplicaciones e implicaciones
Los modelos mundiales tienen diversas aplicaciones en todo el mundo. En robótica, permiten la creación de entornos virtuales donde las máquinas pueden aprender a navegar y manipular objetos. Esto reduce el tiempo y el costo de las pruebas físicas.
Genesis, una plataforma de simulación física de código abierto desarrollada por. La Universidad Carnegie Mellon y la industria privada investigadores, muestra cómo los sistemas de IA se pueden entrenar para la física 3D en un entorno completamente virtual mucho más rápido que en el mundo real.
En los juegos, los modelos mundiales crean experiencias inmersivas con entornos dinámicos y receptivos. potencial en la atención médica, donde las simulaciones podrían ayudar en el diagnóstico y la planificación personalizada del tratamiento.
A pesar de su promesa, estos avances conllevan desafíos éticos, particularmente en relación con el desplazamiento de trabajadores. El Animation Guild estima que más de 100.000 empleos en cine, televisión y animación en EE. UU. podrían verse afectados por las tecnologías de inteligencia artificial para 2026.
También surgen problemas legales, ya que algunos modelos mundiales dependen de imágenes de videojuegos sin licencia para capacitación. Si bien Google afirma que sus prácticas cumplen con los términos de servicio de YouTube, no ha revelado fuentes de datos específicas.
Competencia en el espacio de la IA
Posiciones de la iniciativa de DeepMind Google en una carrera competitiva con otros actores importantes. La nueva plataforma Cosmos de Nvidia se centra en la IA física y la robótica, mientras que World Labs de Fei-Fei Li desarrolla modelos mundiales a gran escala con inteligencia espacial para diversas aplicaciones. Empresas emergentes como Odyssey y Decart también están creando avanza, contribuyendo al creciente campo de las simulaciones mundiales de IA.
El acceso de DeepMind a Gemini AI, Veo y Genie ofrece una ventaja única. Al integrar estos sistemas, el equipo pretende crear una IA que no sólo prediga resultados sino que también se adapte a escenarios cambiantes en tiempo real. Esta capacidad puede ser fundamental para lograr AGI, donde la adaptabilidad y la generalización son clave.
La visión de DeepMind para AGI
Si bien la inteligencia artificial general sigue siendo un objetivo lejano pero alcanzable Para ello, los modelos mundiales son un paso crucial en este camino. Al simular entornos físicos y virtuales, estos modelos proporcionan una base para sistemas de IA que pueden razonar, planificar e interactuar como humanos.
La descripción del puesto de ingeniero de investigación captura la esencia de la visión de DeepMind: “Los modelos mundiales impulsarán numerosos dominios, como el razonamiento visual y la simulación, la planificación para agentes encarnados y el entretenimiento interactivo en tiempo real.”