A ascensão rápida de
Deepseek aos escalões superiores de inteligência artificial surpreendeu muitos no setor de tecnologia.
Na superfície, parece ter alcançado um feito notável: treinando um modelo sofisticado, apelidado de R1, por uma fração do custo típico e com menos recursos computacionais do que os principais laboratórios ocidentais.
No entanto, evidências crescentes sugerem que as reivindicações de Deepseek podem não refletir a realidade. Pesquisadores, jornalistas e especialistas do setor agora questionam se as realizações da empresa resultam de engenharia avançada ou se eles dependem de hardware contrabandeado, dados de treinamento de IA roubados e uma campanha de propaganda orquestrada pelo Partido Comunista Chinês (CCP).
Relacionado: Modelo de raciocínio de Deepseek R1 da China e Open O1 é fortemente censurado
O Momento Deepseek R1
Deepseek capturou atenção mundial no início de janeiro deste ano, anunciando que seu modelo de raciocínio em larga escala, R1, supostamente havia Combinou ou superou o Open’s O1 em benchmarks técnicos-por uma mera fração dos custos usuais de treinamento. Os executivos apontaram para 2.048 GPUs NVIDIA H800 como o único hardware usado e estimou a despesa total em menos de US $ 6 milhões.
Isso foi impressionante quando definido contra centenas de milhões gastos pelos laboratórios ocidentais para desenvolver modelos de IA semelhantes.
Muitos especialistas da indústria acharam a narrativa implausível. O treinamento de sistemas de IA de ponta requer enorme poder computacional.
Mesmo pequenas melhorias na eficiência vêm de ganhos incrementais de pesquisa em períodos prolongados. As dúvidas cresceram até Alexandr Wang, CEO da SCALE AI, falou no Fórum Econômico Mundial em 24 de janeiro e revelou que o DeepSeek poderia ter hardware muito mais avançado do que admite. Eles não podem falar sobre isso porque viola os controles de exportação dos EUA. Os laboratórios chineses, eles têm mais H100 do que as pessoas pensam. A realidade é que eles estocaram antes que as sanções completas tenham em vigor, e agora estão alavancando-as para impulsionar sua IA.”
Os comentários de Wang, exibidos em uma entrevista da CNBC, contradizem a insistência de Deepseek que se baseou apenas em As unidades H800-uma versão reduzida do H100 para cumprir as sanções dos EUA. Edição.
“Esta não é apenas uma empresa de IA. O R1 da Deepseek pode deve seu desempenho a hardware obtido ilícito.
A questão de como 50.000 chips H100 acabaram na China, sob restrições comerciais destinadas a manter a tecnologia avançada de IA fora das mãos do PCC, levanta preocupações sobre uma operação de contrabando em larga escala com potencial apoio do governo.
alegações de que a DeepSeek pode ter adquirido mais do que apenas GPUs não autorizadas se intensificaram após a morte de balaji , um 26-Ex-pesquisador do Aberto de Ano,”https://www.sfexaminer.com/news/technology/bay-area-officials-say-suchir-balaji-death-must-prompt-probe/article_8f1d1596-d923–11EF-8109-7F47649F523F.HTML”> Encontrado em seu apartamento em São Francisco em 26 de novembro de 2024 .
Relacionado: Alibaba Qwen desafia o OpenAi e DeepSeek com automação multimodal de AI e modelos de contexto de 1M-Token
Jornalista Investigativa George Webb has tied balaji A possibilidade de roubo de dados da IA . Balaji se especializou em oleodutos de treinamento de modelos de IA-um papel que lhe concedeu uma visão de como os grandes modelos de idiomas do OpenAi foram construídos e refinados. Para construir seus sistemas de IA, incluindo o ChatGPT. Em um Entrevista com o New York Times , Balaji afirmou que os métodos da Openai poderiam desestabilizar a economia para os criadores de conteúdo que geram os dados em que esses sistemas dependem.
A morte de Balaji foi declarada suicídio dentro de 40 minutos da chegada das autoridades, deixando pouco espaço para uma investigação mais profunda. Webb, que acompanhou a suposta espionagem chinesa no setor de IA, descreveu por que a experiência de Balaji poderia ter feito dele um alvo:
“Balaji foi encontrado morto em seu apartamento em São Francisco e, em 40 minutos, foi governado um suicídio. Nenhuma investigação real, nenhum esforço para conectar os pontos. Mas se você olhar para o que ele estava trabalhando-treinando pipelines de dados, webGPT, conjuntos de dados que poderiam ser levantados e reaproveitados-as implicações são arrepiantes. Há sussurros de que ele estava prestes a apitar sobre como os dados de treinamento do Openai entraram nas mãos de Deepseek.”
Essa conexão aponta para uma suspeita mais ampla de que o modelo R1 da DeepSeek pode integrar técnicas proprietárias tiradas do OpenAI.
Qual é o segredo da busca profunda de toda a competição de IA?.co/PbRPkzIupl”>pic.twitter.com/PbRPkzIupl
— George Webb – Investigative Journalist (@RealGeorgeWebb1) 29 de janeiro de 2025
Até pequenas quantidades de dados ou código roubados podem reduzir significativamente a linha do tempo para o treinamento de sistemas de larga escala, explicando assim como o Deepseek apareceu para compactar anos de pesquisa em alguns meses. Se a DeepSeek treinou seu modelo R1 nos dados roubados do OpenAI, isso significaria uma das maiores operações de espionagem corporativa da história. Estamos falando de IA que vale bilhões, possivelmente trilhões, sendo entregues a uma entidade apoiada pelo Estado na China. Balaji sabia alguma coisa, e agora ele se foi.”
Relacionado: Deepseek derruba outro Openai-buster com Janus multimodal modelos, superando Dall-e 3
OpenAi As autoridades se recusaram a abordar publicamente a morte de Balaji, provocando especulações adicionais. Este é um exemplo gritante de quão altos as apostas na pesquisa de IA se tornaram-em busca de colocar os próprios pesquisadores em risco.
laços com as ambições estratégicas da China
A ascensão de Deepseek é cada vez mais vista como alinhada com os objetivos oficiais da China de superar os concorrentes ocidentais em pesquisas e desenvolvimento avançados. Envolvimento do Estado. Cobertura da mídia:
“Eles desfilam Deepseek como prova da força da China na IA, mas qualquer um que tenta verificar suas alegações vê as portas se fecharem. É tudo muito familiar: hype o campeão local, feche o escrutínio estrangeiro e o rotule um grande sucesso.”A velocidade na qual a Deepseek aparentemente acessou vastos recursos da GPU-apesar dos controles de exportação rígidos dos EUA-indica um pipeline de recursos que não seria viável para uma entidade comercial típica. Ao impulsionar as capacidades da IA homegrown. Os analistas argumentam que esse retrato promove a posição da China nos círculos globais de tecnologia, mesmo que a realidade envolva o apoio de estado pesado e as cadeias de suprimentos opacas. >
Revelações sobre o suposto contrabando de GPUs da NVIDIA H100 de Deepseek e os rumores sobre o uso não autorizado de pesquisas de Openai provocaram debate entre os formuladores de políticas nos Estados Unidos e na União Europeia.
A divulgação por escala AI Alexandr Wang-“Deepseek tem cerca de 50.000 GPUs NVIDIA H100”-acertou em um momento em que os legisladores já estavam reconsiderando os mecanismos de controle de exportação.
Vários senadores dos EUA possuem Medidas propostas para apertar o rastreamento do hardware de computação de alto desempenho. Aquisições ocultas em escala, mas os críticos apontam que qualquer registro pode ser evitado através de Hong Kong ou outros nós intermediários sobre se as empresas locais inadvertidamente ajudaram o estoque de Deepseek. Avertem que um reclamação unilateral corre o risco de impedir colaborações de pesquisa benéfica. Os proponentes das regras mais rigorosas contrariam que hardware e dados avançados de IA representam não apenas recursos comerciais, mas ativos estratégicos. No meio, as empresas de tecnologia são obrigadas a navegar por um espaço cada vez mais polarizado.
Uma indústria de IA em evolução: a cautela substitui a abertura
As supostas táticas da Deepseek-aquisições de saúde de hardware dos EUA, possível roubo de dados do OpenAI e estratégias de marketing que dependem No suporte do PCC-causou ondas de choque entre as empresas de IA em todo o mundo.
Onde o campo comemorou pesquisas abertas, muitos laboratórios agora estão adotando medidas de segurança mais fortes para proteger bases de código e conjuntos de dados.
George Webb, que primeiro levantou dúvidas públicas sobre a morte de Suchir Balaji, teme que o caso Deepseek represente um ponto de virada: “Empresas como OpenAi, Anthropic ou Meta podem ter que tratar o modelo de linguagem grande P&D como uma operação de inteligência. O sigilo vai aumentar, e isso pode impedir o compartilhamento de conhecimento.”
Essa mudança pode diminuir o progresso dos esforços de pesquisa colaborativa, que historicamente estimularam os avanços na IA.
LEI Notas em sua análise que, além do domínio da engenharia, os efeitos da ondulação se estendem à governança de dados, privacidade e até segurança pessoal/P>
Ao mesmo tempo, ela destaca que as comunidades que conhecem a tecnologia na China também estão seguindo a história, ciente de que o Deepseek pode ter ofuscado as empresas locais mais legítimas: “É irônico. Siga, mas os pesquisadores chineses reais se preocupam que ele define um precedente para cortar cantos, ou pior, por serem cúmplices na espionagem.”
As participações para a supervisão global da IA
Alguns estudiosos defenderam”Conselhos de Resolução de Conflitos de AI”envolvendo grandes partes interessadas do governo, indústria e academia. Outros propõem mecanismos de verificação descentralizados, em que os metadados dos processos de treinamento podem ser auditados para confirmar a proveniência dos modelos.
As palavras de Alexandr Wang destacam a urgência dessas discussões: “Os EUA precisam de muito mais capacidade computacional. estar competindo conosco-eles liderarão. Se os métodos relatados por trás do sucesso da Deepseek permanecerem incontestados, outras empresas poderão adotar rotas igualmente secretas, exacerbando as dificuldades na detecção de violações. Por outro lado, os regulamentos exagerados correm o risco de sufocar os empreendimentos legítimos, especialmente para laboratórios menores operando nas bordas da pesquisa atual. Continua a se desenrolar, com divulgações adicionais em torno de possíveis canais de financiamento, compartilhamento de tecnologia e outros aspectos obscuros de suas operações. O escrutínio internacional, juntamente com as investigações sobre a morte de Suchir Balaji, pode levar a profundidade a esclarecer seus métodos-ou, se continuar a bloquear revisões externas, intensificar as suspeitas de que é mais ativo do Estado do que Startup.
O caso ressalta Essa IA, uma vez considerada um campo impulsionado principalmente por experimentação científica, expandiu-se para um domínio onde a concorrência sobre o conhecimento, o alcance do mercado e os objetivos do estado pode convergir de maneiras perturbadoras. Se o Deepseek continua sendo um exemplo isolado ou sinaliza uma mudança duradoura na dimensão política da IA, ainda não se sabe. restaurado. Mas, por enquanto, a Deepseek continua sendo um símbolo potente de como a tecnologia avançada pode se tornar um poderoso instrumento de política, prestígio nacional e estratégia econômica-tudo acontecendo a portas fechadas e redes guardadas.