Appleは、ユーザーにフィードバックの素早いダイジェストを提供することを目指して、App Storeでユーザーのレビューを凝縮するように設計されたAIシステムを導入しました。 「評価とレビューは、アプリストアのアプリを探索するユーザーにとって、他の人がアプリをどのように経験したかについての洞察を提供するユーザーにとって非常に貴重なリソースであることを認めている」

イニシアチブは、安全性、公平性、真実性、および助けを優先する内部原則に従います。アプリのレビューのようなユーザー生成コンテンツに取り組むことは、独自の困難をもたらします。 Appleは、絶え間ないアプリの更新(適時性)にもかかわらず、さまざまなスタイルとレビューの実体(多様性)をキャプチャし、信頼性(精度)を維持するための無関係またはトピック外の発言を除外するために、概要が最新の状態を維持する必要性を明確に特定しました。関連性を確保するために、概要は少なくとも週に1回更新されます。

AIによるユーザーフィードバックの解読

Appleが構築したシステムは、慎重に構造化されたワークフローを通じてこれらの問題に対処します。これは、スパム、攻撃的な言語、不正な投稿を除外するために生のレビューをフィルタリングすることから始まります。適格なレビューは、複数のLLMを搭載したパイプラインを入力します。これは、人間のようなテキストの処理と生成に熟知したAIモデルです。 Appleは正確なしきい値を指定していませんが、アプリは概要を生成する前に十分な数のユーザーレビューを蓄積している必要があります。

最初に、LLMは低ランク適応を使用して微調整されています( loric大規模なモデルのパラメーターの小さなサブセットのみを変更します。各レビューを基本的な「洞察」に導きます。 Appleはこれらの慎重に定義されたユニットについて説明しています。「各洞察は原子声明であり、レビューの特定の側面をカプセル化し、標準化された自然言語で明確にされ、単一のトピックと感情に限定されます。」この構造化された表現により、多数のレビュー全体で比較と集約が容易になります。

洞察抽出に続いて、別の特別に調整された言語モデルは動的トピックモデリングを実行します。このモデルは、テーマに関する同様の洞察をグループ化し、事前定義された固定リストまたは分類法に依存することなく標準化されたトピック名を生成します。

埋め込み(テキストの数値表現)やパターンマッチングなどのテクニックを使用して、意味的に関連するトピックと説明の変動について説明します。このモデルは、「アプリエクスペリエンスやパフォーマンスなど)と「アプリ外のエクスペリエンス」コメント(配信アプリの食品品質に関する意見など)に直接関連するフィードバックを区別し、要約の関連性について前者に優先順位を付けます。この選択は、トピックの人気を優先しますが、バランス、関連性、有用性、新鮮さの基準も組み込まれています。選択した情報に反映された全体的な感情がアプリの一般的な評価分布と一致することを確認します。

重要なのは、トピック名のみを使用する代わりに、これらのトピックに関連する最も代表的な洞察を最終的な要約生成ステップにフィードすることを選択します。 Appleは、この選択がユーザーのコメントから直接導き出されたより自然に表現された視点を提供し、より表現力豊かで詳細な要約を提供すると説明しました。このモデルは、当初、人間の専門家によって書かれた大規模な参照要約で訓練されました。その後、直接選好最適化( dpo )を使用してさらに洗練されました。

この最後のLLMは、Appleの希望のスタイル、声、構成に合わせて100〜300文字の段落を生成します。概要が異なるデバイス間で一貫していることを考えると、処理はクラウドベースのように見えます。これは、新しいハードウェアに潜在的に存在するデバイス上のAppleインテリジェンス機能だけに依存していないことを示唆しています。人間の評価者は、4つの重要な基準に対して数千のサンプル要約をレビューしました:安全(有害または攻撃的なコンテンツのチェック)、接地(入力レビューの忠実な表現の確保)、構成(文法とAppleのスタイルへの順守の評価)、および有用性(ユーザーのダウンロードの決定を支援するかどうかを判断する)。 Appleによると、A

高い安全性評価を達成するには、評価者からの全会一致の合意が必要でしたが、他の3つの基準は多数派の合意に基づいていました。自動化は、この評価の一部を支援し、人間の専門知識を効果的に指示します。継続的な品質メンテナンスを処理するために、ユーザーと開発者の両方が、App StoreインターフェイスまたはApp Store Connectを介して問題の概要をAppleに直接報告できます。

米国の限られた数のアプリの最初のロールアウトターゲットを絞った英語レビュー。2025を通じてより多くの言語と地域への拡張計画を述べています。 2024)。

一部のコメンテーターは、このタイプのAI要約を明確なユーザーの利点を持つ比較的単純な「低ぶらぶら果物」と見なしていますが、偽のレビューによってユーザーがより詳細なフィードバックで操作することを阻止することを思いとどまらせる潜在的な懸念は存在します。大量のユーザーコンテンツを管理するためのLLMS。

Categories: IT Info