Salesforce の Slack は、プライバシー ポリシーに関して批判にさらされています。ユーザーがオプトアウトしない限り、AI トレーニングのためにユーザー データを分析するプラットフォーム。同社は、このデータはプラットフォーム内に残り、サードパーティ モデルのトレーニングには使用されないことを明らかにしました。
Slack の機械学習モデルはプラットフォーム レベルで動作し、チャネルや絵文字のレコメンデーション、検索などの機能を強化していると説明しました。結果。これらのモデルは、提案を生成するためにダイレクト メッセージ、プライベート チャネル、またはパブリック チャネルから元のメッセージ コンテンツにアクセスしません。同社は、自社のモデルが顧客データを記憶したり再現したりするように設計されていないことを強調しました。
生成 AI と顧客データ
Slack は、Slack AI で生成 AI を利用しています。サードパーティの大規模言語モデル (LLM) を採用した製品。同社によれば、これらのサードパーティ LLM のトレーニングに顧客データは使用されません。代わりに、Slack は顧客データを保持しない既製の LLM を使用します。これらのモデルは Slack の AWS インフラストラクチャでホストされているため、顧客データが Slack の信頼境界の外に出ないことが保証され、LLM プロバイダーはこのデータにアクセスできません。
2023 年に更新されたプライバシー原則には、当初、Slack のシステムがメッセージ、コンテンツ、ファイルなどの顧客データを分析して、 AI/ML モデルを開発します。この広範なデータ使用はユーザーからの大きな反発につながり、AI トレーニングにデータが使用されることに多くの懸念が表明されました。
ユーザーの懸念と企業の対応
Slackは、同社のグローバル モデルが顧客データを利用していることは認めたものの、ワークスペース間でデータが漏洩することはないと主張している。ただし、個々のワークスペース内のメッセージは分析されます。同社はプライバシー原則を改訂し、「絵文字やチャンネルのレコメンデーションなどの機能の非生成 AI/ML モデルを開発するために、当社のシステムは顧客データを分析します。」
Slack の広報担当者は、同社のポリシーを次のように強調しました。慣行は変更されておらず、明確にするために文言のみが更新されています。データ分析機能はデフォルトで有効になっているため、ワークスペース所有者にオプトアウトするようメールを送信する必要がありますが、その期間は明記されていません。
オプトアウトすると、顧客はデータをこれらのモデルに提供しなくても、引き続きグローバルにトレーニングされたモデルから恩恵を受けることができることを意味します。Slack は、データはクエリ解析、オートコンプリート、絵文字の提案などの機能を改善するために使用されると説明しました。同社は、こうしたパーソナライズされた改善は、Slack とのユーザー インタラクションを研究することによってのみ可能であると考えています。
ジャーナリズムによる精査とドキュメントの更新
この問題を取材しているジャーナリストが報告しました。 Slack 自身のドキュメントに基づいた記事の「不正確さ」について Slack から警告を受け取りました。その後、同社はその実践を明確にするためにこのドキュメントを更新しました。 5 月 17 日の時点で、Slack は「顧客データを使用した LLM やその他の生成モデルは開発しません」と明確に述べており、同社のシステムはファイルを含む顧客データを分析して「次のような機能のための非生成 AI/ML モデルを開発する」と明記しています。
Slack の更新されたドキュメントには、オートコンプリートについて、「提案はローカルであり、ユーザーのワークスペース内の一般的なパブリック メッセージ フレーズから取得されます。潜在的な提案から選択するアルゴリズムは、事前にグローバルにトレーニングされています。私たちは、アルゴリズム内の過去のインタラクションの数値スコアとカウントのみを使用するなど、さまざまな方法で入力されたテキストと提案の間の類似性をスコアリングするルールを使用することで、データのプライバシーを保護します。」 strong>業界の背景と比較
多数のユーザーが Slack の職場を閉鎖するに至ったこの事件は、生成 AI アプリケーションでユーザー データをどのように使用するかを伝える際にソフトウェア企業が直面する課題を浮き彫りにしました。プライバシー ポリシーで検索拡張生成 (RAG) ワークフローやその他の機械学習アプローチを説明することの複雑さは、企業に評判のリスクをもたらします。
Slack は次のように述べています。「この製品を構築する際の指針となるのは、当社のプライバシー ポリシー、セキュリティ文書、SPARC および Slack 規約に詳述されているように、顧客データのプライバシーとセキュリティは神聖なものです。」 しかし、The Stack による 5 月 17 日のレビューでは、これらの文書のいずれにも生成 AI や機械学習については言及されていないことが指摘されています。
Slack は、プライバシー ポリシーによれば、「組織の傾向と洞察を特定する」ためにユーザー データも収集します。同社は、顧客データからどのような組織的傾向を引き出しているのかについての質問にはまだ回答していない。
Dropbox は 2023 年 12 月に同様の問題に直面し、その際、新しいデフォルトのトグルが「サードパーティと共有」に設定されたことをめぐる混乱があった。パーティー AI」は大騒動を引き起こした。AWS の CTO は、プライバシーに関する懸念を Dropbox に公に報告したが、後に Dropbox は「回答を生成するために、明示的なリクエストまたはコマンドに関連するコンテンツのみがサードパーティ AI パートナー [OpenAI] に送信される」と明らかにした、概要、トランスクリプトなど…あなたのデータは内部モデルのトレーニングに使用されることはなく、30 日以内に OpenAI のサーバーから削除されます。」