TL;DR
Ý chính: The New York Times đã kiện Perplexity AI vì vi phạm bản quyền và làm loãng nhãn hiệu, nhắm mục tiêu vào mô hình kinh doanh “công cụ trả lời” của họ. Chi tiết chính: Khiếu nại tiết lộ Perplexity đã chi 48 triệu USD cho các dịch vụ đám mây vào năm 2024 nhưng trả 0 USD cho nội dung NYT, mặc dù được định giá 20 tỷ USD. Tại sao lại quan trọng: Vụ kiện này thách thức tính hợp pháp của Thế hệ tăng cường truy xuất (RAG) và tìm cách buộc AI phải chịu trách nhiệm về những “ảo giác” gây tổn hại đến danh tiếng thương hiệu. Bối cảnh: Vụ việc tham gia vào làn sóng kiện tụng từ các nhà xuất bản như Dow Jones và Reddit, làm leo thang xung đột về sử dụng hợp pháp và tìm kiếm AI.
Thời báo New York đã kiện Perplexity AI, cáo buộc”công cụ trả lời”của công ty khởi nghiệp này sao chép bất hợp pháp hàng triệu bài báo để tạo ra một sản phẩm thay thế nhằm hút lưu lượng truy cập và doanh thu.
Được nộp lên Tòa án quận phía Nam New York của Hoa Kỳ, đơn khiếu nại liên bang nhắm vào cơ chế cốt lõi của Thế hệ tăng cường truy xuất (RAG). Kỹ thuật này lấy dữ liệu thời gian thực để phản hồi AI trên mặt đất. The Times lập luận rằng hành vi này cấu thành”vi phạm bản quyền quy mô lớn”ở cả giai đoạn đầu vào và đầu ra.
Ngoài các khiếu nại về bản quyền, vụ kiện còn đưa ra một lý thuyết pháp lý mới: làm loãng nhãn hiệu bằng cách”làm hoen ố”. Nhà xuất bản cáo buộc”ảo giác”AI của Perplexity (văn bản bịa đặt được gán sai cho tờ báo) làm tổn hại đến danh tiếng về độ chính xác của nó.
Quảng cáo
‘Công cụ trả lời’trong thử nghiệm: Tấn công mô hình RAG
Trọng tâm của khiếu nại là lập luận cho rằng mô hình kinh doanh của Perplexity về cơ bản là ký sinh. Vụ kiện thách thức tính hợp pháp của Thế hệ tăng cường truy xuất (RAG), công nghệ cho phép AI lấy dữ liệu thời gian thực để trả lời các truy vấn.
The Times lập luận rằng hành vi vi phạm bản quyền của Perplexity xảy ra theo hai giai đoạn riêng biệt: thu thập dữ liệu ban đầu (Đầu vào) và tạo bản tóm tắt (Đầu ra).
Khiếu nại của họ nêu ra một lý thuyết hai hướng về vi phạm bản quyền nhắm vào cả cách AI học và những gì nó tạo ra. Ở cấp độ “đầu vào”, vụ kiện cáo buộc rằng trình thu thập dữ liệu web của Perplexity, được xác định cụ thể là ‘PerplexityBot’ và ‘Perplexity-User’, thu thập trái phép lượng lớn dữ liệu.
Điều này liên quan đến việc lấy nội dung không chỉ từ miền riêng của Times mà còn từ nền tảng của bên thứ ba để xây dựng chỉ mục tìm kiếm “AI-First”. Chỉ mục này đóng vai trò là cơ sở kiến thức theo thời gian thực cung cấp Mô hình ngôn ngữ lớn (LLM) bất cứ khi nào người dùng đặt câu hỏi.
Hành vi vi phạm bị cáo buộc kéo dài đến giai đoạn “đầu ra”, nơi AI tạo ra câu trả lời. The Times khẳng định rằng những bản tóm tắt này thường giống hệt hoặc về cơ bản giống với báo cáo ban đầu, thay vì các tác phẩm mới mang tính biến đổi.
Hồ sơ tuyên bố rằng để hỗ trợ các công cụ này, Perplexity đã sao chép, phân phối và hiển thị một cách hiệu quả hàng triệu tác phẩm được bảo vệ, từ các bài báo bằng văn bản đến nội dung đa phương tiện như video và podcast mà không được phép.
Lý thuyết hai giai đoạn này cố gắng lấp đi một lỗ hổng thường được các công ty AI khai thác. Họ cho rằng dữ liệu đào tạo có tính chất biến đổi nhưng đầu ra lại có tính chất sinh sản. Bằng cách nhắm mục tiêu vào chính cơ chế truy xuất, The Times đang tấn công trực tiếp vào khái niệm”công cụ trả lời”.
Không giống như các công cụ tìm kiếm truyền thống thúc đẩy lưu lượng truy cập thông qua các liên kết, đơn khiếu nại cáo buộc Perplexity rõ ràng tự tiếp thị mình như một sự thay thế cho nguồn. Trích dẫn chiến dịch tiếp thị “Bỏ qua các liên kết” của Perplexity, hồ sơ trình bày đây là bằng chứng về ý định loại bỏ các nhà xuất bản trung gian.
Vụ kiện coi chiến lược tiếp thị này không phải là sự đổi mới mà là một nỗ lực có chủ ý nhằm vượt qua người sáng tạo nội dung:
“Perplexity cung cấp các sản phẩm thương mại cho người dùng của chính mình để thay thế The Times mà không có sự cho phép hay thù lao và trên thực tế là trước sự phản đối rõ ràng và lặp đi lặp lại của The Times.”
Hiệu ứng thay thế này có thể định lượng được; dữ liệu lưu lượng truy cập giới thiệu cho thấy các bot AI gửi lưu lượng truy cập ít hơn 95,7% so với các công cụ tìm kiếm truyền thống. Vụ kiện cho rằng mô hình kinh doanh như vậy sẽ phá hủy động cơ kinh tế cho hoạt động báo chí ban đầu mà nó dựa vào.
Giám đốc điều hành Perplexity Aravind Srinivas trước đây đã mô tả mục tiêu của công ty là cung cấp câu trả lời trực tiếp thay vì danh sách các trang web. Bảo vệ mô hình, Srinivas lập luận rằng câu trả lời trực tiếp là một sự phát triển cần thiết của công nghệ tìm kiếm:
“Nguyên tắc trong Perplexity là bạn không được phép nói bất cứ điều gì mà bạn không truy xuất được, điều này thậm chí còn mạnh hơn RAG vì RAG chỉ nói,’Được rồi, hãy sử dụng ngữ cảnh bổ sung này và viết câu trả lời.'”
Xuất hiện nhãn hiệu: Trách nhiệm pháp lý đối với ảo giác AI
Trong một sự mở rộng đáng kể của chiến lược pháp lý chống lại AI, The Times đang kiện về việc làm loãng nhãn hiệu bằng cách”làm hoen ố”. Nhà xuất bản lập luận rằng khi Perplexity gán thông tin sai lệch cho tờ báo, điều đó sẽ làm tổn hại đến danh tiếng về tính chính xác của thương hiệu.
Tuyên bố này vượt ra ngoài hành vi trộm cắp tài sản trí tuệ để giải quyết tổn hại về danh tiếng do lỗi phát sinh gây ra.
Hồ sơ nêu chi tiết một dạng tổn hại danh tiếng cụ thể bắt nguồn từ Đạo luật Lanham, lập luận rằng việc Perplexity lạm dụng thương hiệu của Times không chỉ đơn thuần là hành vi trộm cắp. Cốt lõi của lập luận này là công cụ AI thường xuyên tạo ra “ảo giác” – văn bản bịa đặt chưa từng xuất hiện trên báo – đồng thời hiển thị các nhãn hiệu nổi tiếng của Times bên cạnh những thông tin sai sự thật.
Nhà xuất bản tuyên bố rằng việc ghi công sai này đã đánh lừa người dùng tin rằng lỗi là do báo cáo của Times.
Hơn nữa, đơn khiếu nại cáo buộc rằng ngay cả khi AI truy xuất nội dung thực tế, nó thường tạo ra các bản tóm tắt không đầy đủ một cách sai lệch. Bằng cách hiển thị các phiên bản bị bóp méo này cùng với biểu trưng của Times mà không tiết lộ những thiếu sót, Perplexity bị cáo buộc coi là những bản sao chép kém chất lượng là báo chí chất lượng cao gắn liền với thương hiệu.
Cụ thể, đơn khiếu nại trích dẫn một trường hợp trong đó Perplexity bị cáo buộc đã bịa đặt một bài đánh giá Wirecutter đề xuất một sản phẩm đã bị thu hồi vì lý do an toàn. Theo vụ kiện, những lỗi như vậy không chỉ đơn thuần là trục trặc kỹ thuật mà còn là những tổn hại pháp lý có thể khởi kiện.
Vụ kiện lập luận rằng những điều bịa đặt này không chỉ gây ra thông tin sai lệch; họ chủ động đánh lừa người dùng về nguồn thông tin. Bằng cách đặt nhãn hiệu của Times cùng với”ảo giác”do AI tạo ra hoặc các bản tóm tắt được biên tập lại nhiều, Perplexity bị cáo buộc tạo ra”sự chỉ định sai về nguồn gốc”.
Hồ sơ cho rằng hành vi này đánh lừa người đọc tin rằng tờ báo đã chứng thực, tài trợ hoặc tạo nội dung một cách rõ ràng, đánh đổi một cách hiệu quả dựa trên độ tin cậy của Times trong khi đổ lỗi cho các lỗi của AI lên danh tiếng của nhà xuất bản.
Lý thuyết pháp lý này cố gắng buộc các công ty AI phải chịu trách nhiệm về chất lượng về đầu ra của họ, không chỉ là nguồn gốc của dữ liệu đào tạo của họ. Nó thúc đẩy Đạo luật Lanham để lập luận rằng ghi công sai là một hình thức gây thiệt hại cho thương hiệu.
Srinivas trước đây đã tuyên bố rằng việc trích dẫn nguồn là một cơ chế để giảm thiểu những lỗi như vậy. Khi được hỏi về vấn đề tính chính xác, ông lưu ý:”Tôi cho rằng bạn đang nói rằng bạn muốn thực sự bám vào sự thật được thể hiện bằng văn bản do con người viết trên internet? Đúng vậy.”
Tuy nhiên, vụ kiện lập luận rằng chỉ trích dẫn thôi thì không miễn trừ trách nhiệm pháp lý của nền tảng đối với việc tạo ra nội dung sai lệch.
Kinh tế khai thác: 48 triệu đô la cho đám mây, không cho nội dung
Khi tiết lộ dữ liệu tài chính cá nhân hiếm hoi, đơn khiếu nại đã tiết lộ cho thấy sự chênh lệch đáng kể trong các ưu tiên chi tiêu của Perplexity. Hồ sơ vẽ ra bức tranh về một công ty có chi phí hoạt động đáng kể nhưng không có ngân sách nội dung, hoàn toàn dựa vào lao động “tự do” của các nhà báo:
“Quả thực, theo một bản tin, vào năm 2024, Perplexity đã chi 48 triệu đô la cho các dịch vụ đám mây, trả 19 triệu đô la cho nhân tài và trả 8 triệu đô la cho Anthropic và OpenAI để sử dụng các mô hình của họ nhưng chưa trả cho The Times một khoản phí nào khi sử dụng Times Content để cung cấp năng lượng cho các sản phẩm của mình.”
Làm nổi bật sự mất cân bằng này, hồ sơ lưu ý rằng mặc dù Perplexity trả tiền cho các nhà cung cấp mô hình như Anthropic và OpenAI, nhưng nó không trả gì cho các nhà xuất bản cung cấp nền tảng thực tế. Cấu trúc kinh tế này là trọng tâm trong lập luận của vụ kiện rằng Perplexity đang”tự do”đầu tư vào các phòng tin tức.
Nhà xuất bản mô tả mô hình kinh doanh này là một hành vi bóc lột giá trị:
“Định giá mới nhất của Perplexity là 20 tỷ USD và thành công trong việc huy động vốn gần 1,5 tỷ USD là dấu hiệu cho thấy khả năng chuyển giao giá trị kinh tế lớn bất hợp pháp từ những người sáng tạo nội dung gốc như The Times sang Perplexity.”
Với mức định giá Theo đơn khiếu nại, tăng vọt lên 20 tỷ USD và gần 1,5 tỷ USD vốn đầu tư mạo hiểm, Perplexity thể hiện sự chuyển giao giá trị đáng kể từ người sáng tạo nội dung sang nền tảng công nghệ. The Times đối chiếu mức định giá này với thực tế tài chính của báo chí, cho rằng việc chiếm đoạt như vậy không phải là sự đổi mới mà là hành vi trộm cắp.
Chiến tranh kỹ thuật: Trình thu thập thông tin lén lút và khối cứng
Chi tiết về trò chơi mèo vờn chuột kỹ thuật, vụ kiện mô tả cuộc đấu tranh giữa đội bảo mật của nhà xuất bản và các bot của công ty khởi nghiệp AI. The Times đã triển khai một “khối cứng” đối với trình thu thập thông tin được khai báo của Perplexity vào tháng 11 năm 2024, sau đó là chặn tác nhân người dùng của nó vào tháng 7 năm 2025.
Bất chấp các biện pháp này, đơn khiếu nại cáo buộc Perplexity đã ghi lại hơn 175.000 lần truy cập chỉ trong tháng 8 năm 2025. Người phát ngôn của tờ báo đã lên án việc công ty coi thường việc từ chối truy cập rõ ràng:
“Mặc dù chúng tôi tin vào việc sử dụng và phát triển AI có đạo đức và có trách nhiệm, nhưng chúng tôi kiên quyết phản đối việc Perplexity sử dụng trái phép nội dung của chúng tôi để phát triển và quảng cáo sản phẩm của họ.”
Hồ sơ cáo buộc Perplexity sử dụng chiến thuật”thu thập thông tin lén lút”, chẳng hạn như giả mạo tác nhân người dùng Google Chrome và xoay địa chỉ IP để trốn tránh bị phát hiện. Những cáo buộc này chứng thực những phát hiện trước đó của công ty bảo mật web Cloudflare. Công ty này đã xác định được bằng chứng về hoạt động thu thập thông tin lén lút vào giữa năm 2025.
Cloudflare cho biết họ đã chặn 416 tỷ lượt truy cập của bot AI, nêu bật quy mô của vấn đề thu thập dữ liệu tự động mà web mở đang gặp phải.
Mô hình xung đột: Từ Amazon đến Dow Jones
Đánh dấu vụ mới nhất trong một loạt các thách thức pháp lý nổi bật, vụ kiện này báo hiệu một cuộc trấn áp phối hợp của ngành đối với Perplexity. Nó diễn ra sau các vụ kiện bản quyền tương tự do News Corp (Dow Jones) đệ trình và một vụ kiện từ Reddit, cả hai đều cáo buộc việc thu thập thông tin trái phép.
Nhóm truyền thông của Perplexity đã coi vụ kiện này là một điều tất yếu mang tính lịch sử đối với các công nghệ đột phá. Jesse Dwyer, Giám đốc Truyền thông của Perplexity AI, cho biết:
“Các nhà xuất bản đã kiện các công ty công nghệ mới trong hàng trăm năm, bắt đầu từ đài phát thanh, TV, internet, mạng xã hội và giờ là AI. May mắn thay, nó chưa bao giờ thành công, nếu không tất cả chúng ta sẽ nói về điều này qua điện báo.”
Tuy nhiên, áp lực đang gia tăng từ nhiều phía.
Amazon cũng đã đe dọa hành động pháp lý, yêu cầu Amazon ngừng hoạt động. về đại lý mua sắm “Sao chổi” của Perplexity. Ngược lại, đáng chú ý là trong khi kiện Perplexity, The Times đã đàm phán thành công một thỏa thuận trong đó họ cấp phép nội dung cho Amazon cho các nền tảng AI của mình.
Cố gắng giảm thiểu những xung đột này, Perplexity đã đưa ra mô hình chia sẻ doanh thu của nhà xuất bản, nhưng các hãng truyền thông lớn phần lớn đã từ chối mô hình này để ủng hộ kiện tụng hoặc cấp phép trực tiếp với những gã khổng lồ công nghệ lớn hơn.
Mặc dù Perplexity đảm bảo mối quan hệ đối tác với Getty Images, nhưng ngành xuất bản nói chung vẫn còn thù địch. The Times trước đó đã kiện Microsoft và OpenAI vào cuối năm 2023, tự coi mình là đương sự chính trong cuộc chiến giành bản quyền AI.