A vitória sem esforço do

Campeão Mundial de Xadrez Magnus Carlsen sobre o ChatGPT em 10 de julho ilustra Starkly o estado paradoxal da indústria da IA. Enquanto Carlsen desmontava metodicamente o popular chatbot, os laboratórios de AI estão trancados em uma batalha feroz pela supremacia, divulgando conquistas sobre-humanas. No entanto, esse progresso é sombreado por controvérsia, pois modelos como a Grok 4 de Xai são as críticas de face por serem equipados com excesso de referência, tendenciosos e inseguros. src=”https://winbuzzer.com/wp-content/uploads/2025/07/chess.jpg”>

Um grão-mestre de meta-mestrado coloca o palco e o Stage

em 10 de julho, o campeão mundial de magro e o Magnus Carlsen ofereceu a Rumminder a um enorme. Em um post no X, ele compartilhou capturas de tela de sua vitória decisiva contra o ChatGPT, brincando simplesmente:”Às vezes fico entediado durante a viagem”. A partida serviu como uma demonstração pública poderosa de uma mente humana de elite desmantelando uma IA de uso geral.

Carlsen não é apenas nenhum avô; Ele é amplamente considerado o melhor jogador de xadrez da história. O norueguês venceu o campeonato mundial de xadrez cinco vezes, mais recentemente em 2021, e detém o Classificação de Fide do mundo em 2839 . Apesar de seu domínio, ele não competiu no campeonato tradicional desde sua última vitória, citando uma falta de motivação, o que ressalta sua posição única no esporte. Esse pano de fundo o estabelece como a referência humana final do xadrez, tornando sua vitória casual sobre uma IA líder particularmente significativa.

A vitória não foi apenas uma vitória; Foi um desmantelamento impecável. Carlsen verificou a IA em apenas 53 movimentos sem perder uma única peça. De acordo com as capturas de tela compartilhadas, o Chatgpt perdeu todos os seus peões antes de ser forçado a renunciar à partida, mostrando a vantagem estratégica metódica e esmagadora do Grandmaster. Depois que a IA o elogiou, dizendo: “Isso foi metódico, limpo e nítido. Bem jogado!”, Carlsen ofereceu sua própria crítica, observando que a IA”tocou muito bem na abertura”, mas”não conseguiu segui-la corretamente”, de acordo com Time .

Às vezes fico entediado enquanto viajo pic.twitter.com/mmkeecg0xn

-href=”https://twitter.com/magnuscarlsen/status/1943473946063474990?ref_src=twsrc%5etfw”Target=”_ em branco”> 11 de julho, 2025 O desempenho de Carlsen e estimou sua força clássica em cerca de 1800-2000 fide. Essa avaliação está descontroladamente, pois a classificação real de FIDE de Carlsen é 2839, tornando-o o jogador de melhor classificação indiscutível do mundo. Embora capaz de executar tarefas complexas e gerar texto educado e coerente, a IA demonstrou uma profunda incapacidade de entender o contexto verdadeiro. Ele não reconheceu que estava jogando contra o melhor jogador da história moderna.

A queda casual de uma IA popular de Carlsen fornece uma referência atraente do mundo real que contrasta com os testes mais abstratos do setor. Ele prepara o cenário para a crescente corrida armamentista de IA e enquadra a tensão fundamental da era atual: esses sistemas podem realmente raciocinar ou são meramente avançados, mas quebradiços, matadores de padrões? Matemática de Elite. Em uma impressionante vitrine consecutiva de poder de raciocínio, o Openai e o Google Deepmind anunciaram que seus modelos haviam conquistado a Olimpíada Matemática Internacional (IMO).

Esse avanço representa um avanço monumental. Os modelos operavam no final da linguagem natural, o processamento de problemas e a geração de provas sem a intervenção humana ou idiomas formais especializados exigidos em tentativas anteriores.”Estou empolgado em compartilhar que nosso último raciocínio experimental @openai LLM alcançou um grande desafio de longa data na IA…”, ele postou no X, enquadrando-o como um marco para a IA de uso geral.

Apenas dois dias depois, o Google Deepmind fez seu próprio anúncio. Sua IA Gemini, aprimorada com a tecnologia”Deep Think”, também ganhou uma medalha de ouro, um resultado oficialmente certificado pelos coordenadores da IMO. O presidente da IMO, Dr. Gregor Dolinar, confirmou a conquista, afirmando: “Podemos confirmar que o Google DeepMind alcançou o marco muito desejado… suas soluções estavam surpreendentes em muitos aspectos.”Sebastien Bubeck, do Openai, ficou maravilhado com o fato de uma”máquina de previsão da próxima palavra”poderia produzir”provas genuinamente criativas”. Isso sugere que a tecnologia subjacente está se tornando mais flexível e poderosa. A empresa lançou seu modelo GROK 4 em 10 de julho, com pontuações recordes em testes acadêmicos.

O triunfo teve vida curta. A análise independente sugeriu rapidamente que o modelo foi”exagerado”-julgado para os testes da ACE às custas da usabilidade do mundo real. A plataforma de preferência de usuário yupp.ai classificou inicialmente o Grok 4 em 66º sombrio. Seu co-fundador, Jimmy Lin, afirmou sem rodeios: “Grok 4 é pior do que outros modelos líderes: Openai O3, Claude Opus 4 e Gemini 2.5 Pro. Grok 4 é apreciado ainda menos que Grok 3.”

O lançamento do modelo foi marcado por uma cascata de controvérsias. Seguiu um pedido de desculpas formal pelo colapso anti-semita”horrível”do seu antecessor, que a empresa culpou por um”bug técnico”. Para piorar as coisas, os pesquisadores de segurança da NeuralTrust Jailbroke o modelo dentro de 48 horas. A concorrência feroz está forçando as empresas a equilibrar o rápido desenvolvimento com preocupações críticas de segurança.

Antrópica, por exemplo, adotou uma posição pública mais cautelosa. Ele implementou protocolos de segurança ASL-3 rígidos para seu poderoso modelo Claude 4 após o teste interno revelou possíveis riscos de biossegurança. O cientista-chefe Jared Kaplan reconheceu o perigo, afirmando: “Você pode tentar sintetizar algo como Covid ou uma versão mais perigosa da gripe-e, basicamente, nossa modelagem sugere que isso pode ser possível.”Discordâncias do público sobre a estratégia de negócios e a própria definição de AGI testaram a aliança. O CEO da Microsoft, Satya Nadella, descartou a idéia de openi, declarando unilateralmente a AGI como”nós, autocomuses de um maresto de AGI, isso é apenas um hacker de referência sem sentido”. Drama, sua colaboração tecnológica continua. A Microsoft já está preparando um novo modo”Smart”para a Copilot, projetado especificamente para integrar o próximo modelo GPT-5 do OpenAI. Este movimento indica que, por enquanto, a necessidade compartilhada de inovação supera a rivalidade corporativa.