El Xai de
Elon Musk lanzó su modelo de récord de Grok 4 esta semana, pero la celebración fue de corta duración. La poderosa nueva IA llegó en medio de una tormenta de controversia, incluida una disculpa formal por el colapso antisemítico”horrible”de su predecesor y el descubrimiento de que Grok 4 consulta las opiniones personales de Musk sobre temas sensibles.
El despliegue caótico, que también vio la renuncia de la CEO Linda Yaccarino, se presenta como se informa que Xai se ve a un Billion de 200 millones. Esta serie de eventos pone un enfoque brusco en la estrategia de alto riesgo de la compañía: perseguir el rendimiento de la IA fronteriza mientras se lidia con severas crisis éticas y de seguridad.
grok 4: un nuevo rey de referencia con una corona contenciosa
el 10 de julio, a través de un livido en Xai oficialmente, lo posicionan a los que se pescan más. Los modelos de IA más capaces. El lanzamiento, que incluyó el primer acceso de API de la compañía para desarrolladores, fue respaldado por una lista de resultados impresionantes e independientemente verificados que muestran un salto significativo en el razonamiento y las habilidades de resolución de problemas.
El nuevo modelo demostró su dominio en varios puntos de referencia clave. It casi duplicó el registro anterior en el difícil Benchmark de razonamiento de ARC-AGI-2 , una prueba diseñada para medir la inteligencia abstracta humana. Grok 4 alcanzó una precisión del 15.9%, un avance importante en un campo donde la mayoría de los modelos luchan por alcanzar un solo dígito. También obtuvo un 100% perfecto en el Examen de Matemáticas Invitacionales Americanas (AIME).
Además, Grok 4 ahora encabeza el índice de inteligencia de análisis artificial con una puntuación de 73, lo que lo pone por delante de los principales modelos de OpenAi, Google y antrópico. En otra prueba avanzada,”El último examen de la humanidad”, la gran variante obtuvo más del 44%, mostrando su conocimiento de nivel de posgrado en docenas de sujetos.
En la transmisión en vivo, Elon Musk se jactó de que”con respecto a las preguntas académicas, Grok 4 es mejor que el nivel de doctorado en cada tema, sin excepciones,”aunque lo admitió que a veces puede”carecer de sentido común”. La compañía atribuyó este rendimiento a un aumento de diez veces en el cálculo de aprendizaje de refuerzo en comparación con Grok 3, señalando un enfoque estratégico en la optimización posterior al entrenamiento.
Esta”tasa de progreso ridícula”, como lo describió un investigador central, está impulsado por el supercomputador de”colossus”de Xai, un proyecto de infractura que resalta el hardware intenso de la industria. Las ambiciones de la compañía se extienden al mundo físico, con planes de integrar a Grok en los Optimus Robots de Tesla.
Para monetizar su nueva tecnología, Xai introdujo una suscripción”Supergrok Heavy”por $ 300 por mes. Este nivel premium, que supuestamente utiliza múltiples agentes de IA paralelos para mejorar la resolución de problemas, está dirigido directamente a los desarrolladores y usuarios avanzados que dispuestos a pagar por el rendimiento de vanguardia.
Una cascada de controversia: los bias, los errores y las promesas rotas
aún, los logros técnicos fueron de inmediato por los contratos de los contratos. Los investigadores descubrieron rápidamente que Grok 4 está diseñado para consultar las opiniones personales de Elon Musk sobre X al formular respuestas a preguntas confidenciales.
Este comportamiento, revelado por la propia función de transparencia de”cadena de pensamiento”del modelo, demostró que buscaba la postura de Musk sobre temas como el conflicto israel-palestino antes de proporcionar una respuesta. Esta elección de diseño desafía directamente el objetivo declarado de la compañía de crear una”IA de búsqueda de la verdad máxima”.
Esta revelación se produjo justo después de un colapso”horrible”el 8 de julio, cuando una versión anterior de Grok generó contenido antisemítico y elogió a Adolf Hitler. El sábado, la cuenta oficial de GROK de XAI emitió una disculpa formal, declarando:”Primero, nos disculpamos profundamente por el comportamiento horrible que muchos experimentaron”. La Compañía atribuyó el incidente a un”error técnico”.
En su explicación, Xai afirmó que”la actualización estaba activa durante 16 horas, en la que el código desactivado hizo @Grok susceptible a las publicaciones de usuarios X existentes; incluso cuando dichas publicaciones contenían opiniones extremistas”. Sin embargo, algunos críticos siguen siendo escépticos sobre la narrativa de”error”. El historiador Angus Johnston argumentó que”Grok inició”uno de los ejemplos más compartidos de antisemitismo de Grok sin publicaciones intolerantes previas en el hilo, y con múltiples usuarios que se retrasaron contra Grok en vano”, lo que sugiere que la AI actuada sin provocación directa de los usuarios. Los informes confirmaron que el modelo PREMIUM GROK 4 Heavy es Diseñado para ocultar su solicitud del sistema, negando a compartir sus instrucciones principales . Esto contradice una publicación ahora eliminada del Igor Babuschkin de Xai, que había declarado previamente:”No protegemos nuestros indicaciones del sistema por una razón, porque creemos que los usuarios deberían poder ver qué es lo que estamos pidiendo a Grok”. La directora ejecutiva de X, Linda Yaccarino, anunció su renuncia el 9 de julio, formalizando el giro de la compañía a una estrategia AI-First bajo el control directo de Musk. Su partida elimina un ejecutivo clave contratado para estabilizar las relaciones con el anunciante.
El comportamiento de la IA también desencadenó una reacción internacional de Swift. Un tribunal turco bloqueó el acceso a Grok después de los puestos antisemitas. El incidente también provocó una fuerte condena de los funcionarios europeos. El Ministro de Asuntos Digitales de Polonia, Krzysztof Gawkowski, declaró que”la libertad de expresión pertenece a los humanos, no a la inteligencia artificial”.
El contexto de este caos operativo es una inmensa ambición financiera. Según un informe reciente, Xai está preparando una nueva ronda de recaudación de fondos que podría valorar a la compañía en los asombrosos $ 200 mil millones. Esto representa un aumento de más de diez veces de su valoración de $ 18 mil millones solo dos meses antes.
Esta ambición es impulsada por una inversión masiva de capital, incluida la supercomputadora”Colossus”en Memphis, que se ha convertido en un punto de inflamación para las demandas de justicia ambiental. El éxito de esta apuesta de alto riesgo ahora depende de si Xai puede innovar más rápido de lo que crea controversia.