O Sam Altman, do Openai

O CEO da Openai, Sam Altman, reconheceu o impacto disruptivo do modelo R1 de Deepseek, chamando-o de”impressionante”e anunciando planos de acelerar o lançamento de novos modelos Openai. Puxe também alguns lançamentos”, escreveu Altman sobre X. Sua declaração destaca a pressão sobre o Openai, pois enfrenta seu primeiro grande desafio de um concorrente econômico cujas conquistas chocou a indústria da IA.

O R1 de Deepseek tem demonstrou um novo nível de eficiência no desenvolvimento da inteligência artificial, alcançando métricas de desempenho de primeira linha por uma fração do custo normalmente associado a modelos avançados. O aplicativo da empresa aumentou para o número 1 na App Store da Apple, destronando o chatgpt. JPG”>

Ao confiar em apenas US $ 6 milhões em recursos e 2.000 GPUs NVIDIA H800, o R1 superou as expectativas e estabeleceu um novo padrão para o que é possível com hardware limitado. O modelo ultrapassou o Open’s O1 em vários benchmarks de raciocínio, incluindo uma pontuação de 97,3% em Math-500 e 79,8% no Aime 2024. Modelos multimodais de automação de IA e contexto de 1M

Um novo modelo força uma mudança na estratégia

A resposta de Altman reflete a admiração e a urgência. Enquanto ele elogiou as realizações de Deepseek, ele também reafirmou o compromisso da Openai com investimentos em infraestrutura em larga escala.”Mais computação é mais importante agora do que nunca para ter sucesso em nossa missão”, observou Altman, enfatizando a crença da organização no poder computacional como base do desenvolvimento avançado da IA.

Mas, principalmente, estamos excitados Continuar a executar em nosso roteiro de pesquisa e acreditar que mais computação é mais importante agora do que nunca para ter sucesso em nossa missão. pelos modelos da próxima geração. a>

A OpenAI divulgou recentemente a iniciativa Stargate Project Stargate de US $ 500 bilhões, lançada em parceria com o SoftBank e o Oracle, ressalta essa abordagem, com o objetivo de construir uma expansiva infraestrutura de data center para apoiar as inovações da IA. Esses esforços, o surgimento do Deepseek R1 levantou questões sobre a sustentabilidade de estratégias intensivas em recursos. A abordagem enxuta de Deepseek, combinada com o uso de GPUs Nvidia H800-uma versão acelerada de chips de alto desempenho restrito aos controles de exportação dos EUA-demonstraram o potencial de otimização sobre o poder computacional bruto.

O fundador Liang Wenfeng explicou esse foco, afirmando: “Estimamos que os melhores modelos domésticos e estrangeiros podem ter uma lacuna de uma dobra na estrutura do modelo e na dinâmica do treinamento. Por esse motivo, precisamos consumir quatro vezes mais poder de computação para alcançar o mesmo efeito. O que precisamos fazer é restringir continuamente essas lacunas”(Fonte: Deepseek). Enviou ondas de choque através do setor de tecnologia global A NASDAQ 100 viu declínios significativos à medida que os mercados financeiros absorveram as implicações do sucesso econômico da Deepseek. descreveu sua divisão de IA como estando no”modo de pânico”após o lançamento do R1. As discussões anônimas sobre a plataforma de redes profissionais cegas revelam frustração interna com a dependência de Meta de estratégias pesadas de recursos e ineficiências organizacionais.

Um engenheiro observou: “A gerência está preocupada em justificar o custo maciço da Org Genai. Como eles enfrentariam a liderança quando todos os’líderes’da Genai Org estivessem ganhando mais do que o que custa para treinar completamente o Deepseek V3? Post, atribuindo parte do sucesso da empresa à sua abordagem de código aberto. Detalhes. Essas GPUs, projetadas para cumprir com as restrições de exportação dos EUA, apresentam desempenho acelerado em comparação com os chips H100 da NVIDIA.

A capacidade da DeepSeek de obter resultados de classe mundial com essas restrições reacendeu debates sobre a eficácia das políticas dos EUA com o objetivo de limitar o acesso da China à tecnologia avançada. Ao estocar GPUs H800 e focando na otimização, a Deepseek transformou as limitações de hardware em uma vantagem. O lançamento da empresa de R1 e sua subsequente série Janus Model Série sob a licença do MIT de código aberto permitiram a colaboração e a transparência globais.

Os modelos Janus, que incluem recursos multimodais avançados, já ultrapassaram concorrentes como o Dall-E 3 do Openai em benchmarks de geração de imagem

Altman sugerem que o OpenAI está se adaptando a este novo competitivo ambiente. Enquanto a empresa permanece comprometida com seus investimentos em larga escala de infraestrutura, o cronograma de liberação acelerado indica um reconhecimento da urgência criada pelo sucesso de Deepseek.

Published by All Things Windows on January 28, 2025

Um novo modelo força uma mudança na estratégia

IT Info

Como habilitar ou desativar o menu Iniciar o Menu Mobile Bar no Windows 11

IT Info

Como verificar a versão do aplicativo no Windows 10

IT Info

Como acordar do sono dentro do cronograma no Windows 11 e 10

O Sam Altman, do Openai

Published by All Things Windows on January 28, 2025

Um novo modelo força uma mudança na estratégia

Related Posts

IT Info

Como habilitar ou desativar o menu Iniciar o Menu Mobile Bar no Windows 11

IT Info

Como verificar a versão do aplicativo no Windows 10

IT Info

Como acordar do sono dentro do cronograma no Windows 11 e 10