A Apple introduziu um sistema de IA projetado para condensar as análises de usuários na App Store, com o objetivo de fornecer aos usuários um resumo rápido de feedback. Reconhecendo que “as classificações e as revisões são um recurso inestimável para os usuários que exploram um aplicativo na App Store, fornecendo informações sobre como outras pessoas experimentaram o aplicativo,” Applems No iOS 18.4, os lançamentos beta em março e agora disponíveis publicamente, o sistema analisa a grande quantidade de aplicativos de comentários recebem para gerar resumos. Esses resumos aparecem diretamente acima da seção de análises individuais de usuários na página de um aplicativo, ajudando os usuários a tomar decisões mais informadas. src=”https://winbuzzer.com/wp-content/uploads/2025/04/apple-app-store-ai-review-summaries.webp”>

A iniciativa segue os princípios internos que priorizam a segurança, a justiça, a verdade e a ajuda. O conteúdo gerado pelo usuário, como as revisões de aplicativos, apresenta dificuldades únicas. A Apple identificou especificamente a necessidade de os resumos permanecerem atualizados, apesar das atualizações constantes de aplicativos (pontualidade), para capturar os estilos variados e a substância das revisões (diversidade) e filtrar observações irrelevantes ou fora do tópico para manter a confiabilidade (precisão). Para garantir a relevância, os resumos são atualizados pelo menos uma vez por semana. Começa filtrando críticas brutas para excluir spam, idioma ofensivo e postagens fraudulentas. As críticas elegíveis entram em um oleoduto alimentado por vários LLMs-modelos de AI complexos, hábeis no processamento e geração de texto do tipo humano. Um aplicativo deve ter acumulado um número suficiente de análises de usuários antes que um resumo possa ser gerado, embora a Apple não tenha especificado o limite exato. Modifica apenas um pequeno subconjunto dos parâmetros de um grande modelo-distribui cada revisão em”insights”básicos. A Apple descreve essas unidades cuidadosamente definidas:”Cada insight é uma declaração atômica, encapsulando um aspecto específico da revisão, articulado em linguagem natural padronizado e confinado a um único tópico e sentimento”. Essa representação estruturada permite uma comparação e agregação mais fáceis em inúmeras revisões. Esse modelo agrupa informações semelhantes sobre temas e gera nomes de tópicos padronizados sem depender de uma lista ou taxonomia predefinida e fixa. Esse modelo também distingue entre o feedback relacionado diretamente à “experiência do aplicativo” (como recursos ou desempenho) e comentários de “experiência fora do aplicativo” (como opiniões sobre a qualidade dos alimentos para um aplicativo de entrega), priorizando o primeiro para relevância no resumo. Essa seleção prioriza a popularidade do tópico, mas também incorpora critérios para equilíbrio, relevância, utilidade e frescura. Ele verifica que o sentimento geral refletido nas informações selecionadas se alinha com a distribuição de classificação geral do aplicativo. A Apple explicou que essa opção fornece uma perspectiva mais naturalmente formulada derivada diretamente dos comentários do usuário, resultando em resumos mais expressivos e ricos em detalhes. Este modelo foi treinado inicialmente em um grande conjunto de resumos de referência escritos por especialistas humanos. Em seguida, foi ainda recinado usando a otimização de preferências diretas ( dPO ), um método para alinhamento do modelo com focos humanos em que os pares de respostas não-rumosos.

Este LLM final gera um parágrafo entre 100 e 300 caracteres, adaptado ao estilo, voz e composição desejados da Apple. O processamento parece ser baseado em nuvem, dado que os resumos são consistentes em diferentes dispositivos, sugerindo que ele não depende apenas dos recursos de inteligência da Apple no dispositivo potencialmente presentes no hardware mais recente. Os avaliadores humanos revisaram milhares de resumos de amostra contra quatro critérios-chave: segurança (verificando conteúdo prejudicial ou ofensivo), fundamento (garantindo a representação fiel das revisões de insumos), composição (avaliação da gramática e adesão ao estilo da Apple) e utilidade (determinar se ajuda a decisões do usuário). A

De acordo com a Apple, alcançar uma alta classificação de segurança exigia um acordo unânime dos avaliadores, enquanto os outros três critérios foram baseados no acordo majoritário. A automação auxilia em partes desta avaliação, direcionando a experiência humana de maneira eficaz. Para lidar com a manutenção contínua da qualidade, usuários e desenvolvedores podem relatar resumos problemáticos diretamente à Apple através da interface da App Store ou da App Store Connect. 2024).

Enquanto alguns comentaristas veem esse tipo de resumo da IA ​​como “frutas frutas baixas’relativamente simples, com benefícios claros do usuário, existem preocupações em potencial sobre os resumos sendo manipulados por críticas falsas ou possivelmente desencorajando os usuários de se envolver com o feedback mais detalhado. A aplicação do LLMS para gerenciar o conteúdo do usuário de alto volume.

Categories: IT Info