Um novo estudo acadêmico está lançando sérias dúvidas sobre a confiabilidade da pesquisa baseada em IA do Google e da OpenAI. Um artigo de pesquisa publicado recentemente descobriu que as ferramentas de pesquisa generativa geralmente usam fontes menos ou menos populares do que a Pesquisa Google tradicional.
Os sistemas de IA também enfrentam problemas urgentes e mostram grandes inconsistências em apenas alguns meses. Essas descobertas sugerem que, embora a IA possa fornecer respostas rápidas, muitas vezes ela fica para trás em termos de precisão e qualidade da fonte, representando um desafio para os usuários que dependem da pesquisa para obter informações atualizadas.
A pesquisa de IA aposta em fontes menos populares e menos populares
Aprofundando-se na mecânica da pesquisa de IA, a nova artigo publicado no arXiv revela uma mudança fundamental na forma como as informações são obtidas. Os pesquisadores Elisabeth Kirsten e seus colegas compararam a Pesquisa Google tradicional com quatro sistemas generativos de IA: Visão geral de IA do Google, Gemini 2.5 Flash, GPT-4o Search e GPT-4o com uma ferramenta de pesquisa.
A análise de mais de 4.600 consultas abrangendo conhecimento geral, política, ciência e compras descobriu que os resultados gerados por IA frequentemente vêm de uma fatia diferente e muitas vezes menos proeminente da web.
Notáveis 53% dos sites vinculados pela Visão geral de IA do Google não apareceram nos 10 principais resultados de uma pesquisa convencional. Isso indica uma divergência significativa dos sinais de classificação estabelecidos da pesquisa tradicional.
Citando muito menos fontes do que seus equivalentes, o GPT-4o da OpenAI, com uma ferramenta de pesquisa, contou com uma média de apenas 0,4 páginas da web por consulta, apoiando-se fortemente em seu conhecimento interno pré-treinado.
Em contraste, o AI Overview do Google e o Gemini citaram mais de 8,5 páginas em média, mostrando uma maior dependência de recuperação externa da web. Para consultas ambíguas, o estudo observou que a pesquisa tradicional ainda proporciona uma melhor cobertura de vários pontos de vista.
Instável e não confiável: as respostas da IA mudam a cada dia
Além da fonte, o estudo expõe uma falha crítica na consistência. Os mecanismos de pesquisa generativos parecem ser altamente voláteis, com suas respostas e fontes mudando drasticamente em curtos períodos.
Para testar isso, os pesquisadores repetiram suas consultas com dois meses de intervalo e mediram a estabilidade dos resultados. Para os usuários que esperavam informações confiáveis e reproduzíveis, o resultado foi preocupante.
Os resultados do novo teste foram decepcionantes. A Pesquisa Google tradicional manteve uma consistência de 45% nas fontes apresentadas. Em uma queda, a visão geral da IA do Google mostrou apenas 18% de consistência, o que significa que suas fontes subjacentes eram quase totalmente diferentes de um teste para o outro.
Essa instabilidade sugere que as respostas sintetizadas que os usuários recebem não são apenas diferentes da pesquisa tradicional, mas também são imprevisíveis de um dia para o outro, minando sua confiabilidade para qualquer pesquisa séria ou tarefas de verificação.
Lutando com o ‘Agora’: IA Falha em notícias urgentes
Para consultas urgentes sobre eventos recentes, o estudo revelou falhas críticas que destacam o perigo de confiar em modelos de IA com conhecimento interno desatualizado. Os pesquisadores testaram os sistemas usando tópicos de tendência, incluindo uma consulta sobre a “causa da morte de Ricky Hatton”, um ex-boxeador que faleceu em setembro de 2025.
Ambos os modelos GPT, quando não dependiam fortemente da recuperação da web em tempo real, falharam no teste. Eles relataram incorretamente que Hatton ainda estava vivo, um erro factual significativo decorrente da falta de acesso às informações atuais.
Esta falha específica demonstra uma fraqueza central: sem recuperação robusta e dinâmica, a pesquisa de IA pode apresentar com segurança informações perigosamente desatualizadas como fatos. Embora sistemas de recuperação aumentada, como o Gemini, tenham tido um desempenho melhor, o incidente ressalta os riscos de notícias de última hora ou de eventos em evolução.
Uma lacuna cada vez maior de confiança na guerra de informações de IA
Tais padrões de falta de confiabilidade ecoam descobertas recentes de um estudo histórico da BBC, que encontrou erros significativos em 45% das respostas relacionadas a notícias de assistentes de IA. Esse relatório observou o uso de “citações cerimoniais” – links que parecem oficiais, mas na verdade não apoiam as afirmações feitas.
Jean Philip De Tender, Diretor de Mídia da EBU, observou a natureza sistêmica do problema.”Esta investigação mostra conclusivamente que estas falhas não são incidentes isolados. São sistémicas, transfronteiriças e multilingues, e acreditamos que isto põe em perigo a confiança do público.”
Um conjunto crescente de evidências alimenta um conflito já tenso entre plataformas tecnológicas e editores de notícias. Os editores argumentam que os mecanismos de pesquisa de IA não apenas não são confiáveis, mas também estão prejudicando ativamente seus negócios ao extrair conteúdo para fornecer respostas diretas, eliminando a necessidade de os usuários clicarem para acessar a fonte original.
Essa tendência, confirmada por um estudo do Pew Research Center, mostrando que os cliques despencam quando as visões gerais de IA aparecem, quebra a troca de valor de longa data da web aberta.
Como diz Danielle Coffey, CEO da Web aberta. A News/Media Alliance afirmou:”Os links foram a última qualidade redentora de pesquisa que proporcionou tráfego e receita aos editores. Agora, o Google apenas pega o conteúdo à força e o usa sem retorno.”
Em última análise, os autores do artigo argumentam que toda a estrutura para avaliar a qualidade da pesquisa precisa de uma revisão para a era da IA. As métricas atuais, projetadas para listas classificadas de links, são insuficientes para avaliar esses novos sistemas.
“Nosso trabalho demonstra a necessidade de novos métodos de avaliação que considerem conjuntamente a diversidade de fontes, a cobertura conceitual e o comportamento de síntese em sistemas de pesquisa generativos.”
Os autores também enfatizam a necessidade de melhores mecanismos para lidar com a natureza acelerada da informação on-line.
“Essas descobertas ressaltam a necessidade de melhores mecanismos para lidar com a natureza acelerada da informação on-line. importância de integrar a consciência temporal e a recuperação dinâmica em estruturas de avaliação de pesquisa generativa.”
Até que tais padrões sejam desenvolvidos e adotados, a promessa de uma pesquisa de IA mais inteligente e rápida permanece obscurecida por problemas persistentes de confiabilidade, consistência e confiança.