O CEO da Openai, Sam Altman, reconheceu o impacto disruptivo do modelo R1 de Deepseek, chamando-o de”impressionante”e anunciando planos de acelerar o lançamento de novos modelos Openai. Puxe também alguns lançamentos”, escreveu Altman sobre X. Sua declaração destaca a pressão sobre o Openai, pois enfrenta seu primeiro grande desafio de um concorrente econômico cujas conquistas chocou a indústria da IA.

O R1 de Deepseek tem demonstrou um novo nível de eficiência no desenvolvimento da inteligência artificial, alcançando métricas de desempenho de primeira linha por uma fração do custo normalmente associado a modelos avançados. O aplicativo da empresa aumentou para o número 1 na App Store da Apple, destronando o chatgpt. JPG”>

Ao confiar em apenas US $ 6 milhões em recursos e 2.000 GPUs NVIDIA H800, o R1 superou as expectativas e estabeleceu um novo padrão para o que é possível com hardware limitado. O modelo ultrapassou o Open’s O1 em vários benchmarks de raciocínio, incluindo uma pontuação de 97,3% em Math-500 e 79,8% no Aime 2024. Modelos multimodais de automação de IA e contexto de 1M

Um novo modelo força uma mudança na estratégia

A resposta de Altman reflete a admiração e a urgência. Enquanto ele elogiou as realizações de Deepseek, ele também reafirmou o compromisso da Openai com investimentos em infraestrutura em larga escala.”Mais computação é mais importante agora do que nunca para ter sucesso em nossa missão”, observou Altman, enfatizando a crença da organização no poder computacional como base do desenvolvimento avançado da IA.

Mas, principalmente, estamos excitados Continuar a executar em nosso roteiro de pesquisa e acreditar que mais computação é mais importante agora do que nunca para ter sucesso em nossa missão. pelos modelos da próxima geração. a>

A OpenAI divulgou recentemente a iniciativa Stargate Project Stargate de US $ 500 bilhões, lançada em parceria com o SoftBank e o Oracle, ressalta essa abordagem, com o objetivo de construir uma expansiva infraestrutura de data center para apoiar as inovações da IA. Esses esforços, o surgimento do Deepseek R1 levantou questões sobre a sustentabilidade de estratégias intensivas em recursos. A abordagem enxuta de Deepseek, combinada com o uso de GPUs Nvidia H800-uma versão acelerada de chips de alto desempenho restrito aos controles de exportação dos EUA-demonstraram o potencial de otimização sobre o poder computacional bruto.

O fundador Liang Wenfeng explicou esse foco, afirmando: “Estimamos que os melhores modelos domésticos e estrangeiros podem ter uma lacuna de uma dobra na estrutura do modelo e na dinâmica do treinamento. Por esse motivo, precisamos consumir quatro vezes mais poder de computação para alcançar o mesmo efeito. O que precisamos fazer é restringir continuamente essas lacunas”(Fonte: Deepseek). Enviou ondas de choque através do setor de tecnologia global A NASDAQ 100 viu declínios significativos à medida que os mercados financeiros absorveram as implicações do sucesso econômico da Deepseek. descreveu sua divisão de IA como estando no”modo de pânico”após o lançamento do R1. As discussões anônimas sobre a plataforma de redes profissionais cegas revelam frustração interna com a dependência de Meta de estratégias pesadas de recursos e ineficiências organizacionais.

Um engenheiro observou: “A gerência está preocupada em justificar o custo maciço da Org Genai. Como eles enfrentariam a liderança quando todos os’líderes’da Genai Org estivessem ganhando mais do que o que custa para treinar completamente o Deepseek V3? Post, atribuindo parte do sucesso da empresa à sua abordagem de código aberto. Detalhes. Essas GPUs, projetadas para cumprir com as restrições de exportação dos EUA, apresentam desempenho acelerado em comparação com os chips H100 da NVIDIA.

A capacidade da DeepSeek de obter resultados de classe mundial com essas restrições reacendeu debates sobre a eficácia das políticas dos EUA com o objetivo de limitar o acesso da China à tecnologia avançada. Ao estocar GPUs H800 e focando na otimização, a Deepseek transformou as limitações de hardware em uma vantagem. O lançamento da empresa de R1 e sua subsequente série Janus Model Série sob a licença do MIT de código aberto permitiram a colaboração e a transparência globais.

Os modelos Janus, que incluem recursos multimodais avançados, já ultrapassaram concorrentes como o Dall-E 3 do Openai em benchmarks de geração de imagem

Altman sugerem que o OpenAI está se adaptando a este novo competitivo ambiente. Enquanto a empresa permanece comprometida com seus investimentos em larga escala de infraestrutura, o cronograma de liberação acelerado indica um reconhecimento da urgência criada pelo sucesso de Deepseek.

Categories: IT Info