Trong một quyết định mang tính bước ngoặt, khắc một dòng quan trọng trên cát cho ngành trí tuệ nhân tạo, một thẩm phán liên bang đã phán quyết rằng đào tạo các mô hình AI trên các cuốn sách có bản quyền tạo thành một công bằng”sử dụng công bằng. Tuy nhiên, trong cùng một hơi thở, thẩm phán tuyên bố rằng công ty AI nhân học phải đối mặt với một phiên tòa cổ phần cao đối với hành động riêng biệt sử dụng các thư viện trực tuyến đã được đưa Các phương pháp cơ bản được sử dụng để xây dựng bộ dữ liệu lớn. Trong A Một chiến thắng hợp pháp cho đào tạo AI

Cốt lõi của chiến thắng nhân học nằm ở quyết định của tòa án rằng sử dụng các tác phẩm có bản quyền để đào tạo một mô hình ngôn ngữ lớn không phải là một sự thay thế cho cuốn sách gốc mà là một cái gì đó mới. Quá trình này được coi là người biến đổi tinh túy,”với thẩm phán lập luận rằng ngay cả khi AI đã ghi nhớ”các tác phẩm, mục đích của nó là tìm hiểu các mô hình ngôn ngữ và biểu hiện để tạo ra nội dung mới, không tái tạo sách cho người tiêu dùng. Tòa án thừa nhận rằng sử dụng nội dung có bản quyền để đào tạo các mô hình AI đủ điều kiện là sử dụng công bằng biến đổi, một bước tiến quan trọng đối với đào tạo AI dựa trên sách và các tác phẩm có sẵn khác. Bởi vì nhân học, Claude AI không xuất bản các bản sao vi phạm cho công chúng, thẩm phán kết luận rằng quy trình đào tạo nội bộ là một cách sử dụng hợp pháp. Quyết định này cung cấp một tiền lệ mạnh mẽ cho các công ty AI khác như Openai, Meta và Google, những người đã đưa ra các lập luận sử dụng công bằng tương tự trong các trận chiến pháp lý của riêng họ. Nó cho thấy rằng, trong con mắt của tòa án, hành động tạo ra một công cụ mới sáng tạo có thể đủ biến đổi để được bảo vệ theo luật bản quyền, với điều kiện là đầu ra cuối cùng không cạnh tranh trực tiếp với hoặc thay thế các công việc ban đầu. thư viện. Lệnh của tòa án chi tiết cách công ty đã tải xuống hơn bảy triệu cuốn sách từ các trang web cướp biển được biết đến như Libgen và Books3. Thẩm phán Alsup không rõ ràng rằng Đạo luật này không được bảo vệ, nói rằng việc tạo ra một thư viện rộng rãi, vĩnh viễn từ các nguồn vi phạm bản quyền, như một người thay thế để trả tiền cho các tác phẩm là một sự xâm phạm, hoàn toàn dừng lại. Chúng tôi sẽ có một thử nghiệm về các bản sao lậu được sử dụng để tạo ra thư viện trung tâm nhân học và các thiệt hại kết quả”, thẩm phán kết luận. Các cổ phần tài chính là rất lớn. Mặc dù thiệt hại theo luật định thấp nhất đối với vi phạm bản quyền là 750 đô la mỗi công việc, các nguyên đơn đã lập luận rằng các thiệt hại cho hành vi vi phạm cố ý có thể lên tới 150.000 đô la mỗi công việc. Điều này đặt ra giai đoạn cho một thử nghiệm tập trung không vào tính mới của AI, mà là câu hỏi lỗi thời của hành vi trộm cắp. Thẩm phán Alsup đã thu hút một sự khác biệt rõ ràng giữa hành động có được nội dung và hành động sử dụng nó để đào tạo. Cách tiếp cận này ngăn chặn ma thuật của người Viking”của sản phẩm cuối cùng làm vệ sinh các phương pháp nghi vấn được sử dụng để tạo ra nó. Thẩm phán về cơ bản là vẽ một đường nét cứng. Anh ấy nói rằng sự đổi mới của sản phẩm cuối cùng không vệ sinh vụ trộm ban đầu. Đó là một thông điệp cho toàn bộ ngành công nghiệp: Làm sạch chuỗi cung cấp dữ liệu của bạn. Hành động thay đổi không gian của người Viking”, một bản sao vật lý này để tạo ra một bản kỹ thuật số thuận tiện hơn để sử dụng nội bộ, được coi là biến đổi vì nó không tạo ra các bản sao mới hoặc gây hại cho thị trường của tác giả.

Người giữ bản quyền, quyền, không phải là sự chấp thuận chăn của tất cả các hoạt động liên quan đến Ai. Cuộc xung đột đã đốt cháy một làn sóng kiện tụng, với việc Disney và Universal nộp đơn kiện vi phạm bản quyền sâu rộng chống lại người tạo hình ảnh MidjTHER và New York Times theo đuổi một vụ kiện cao cấp chống lại Openai và Microsoft. Vấn đề cốt lõi vượt ra ngoài bản quyền đối với khả năng kinh tế của các ngành công nghiệp sáng tạo, với các nhà xuất bản báo cáo sự sụp đổ thảm khốc trong lưu lượng truy cập giới thiệu từ các công cụ tìm kiếm, mà CEO của Cloudflare, gần đây đã gọi là mối đe dọa hiện sinh của Hồi giáo”. Nó cung cấp một lộ trình một phần cho các công ty AI, cho thấy rằng hành động đào tạo có thể phòng thủ về mặt pháp lý, nhưng chuỗi cung ứng dữ liệu hiện là một trách nhiệm pháp lý và tài chính lớn. Thời đại của Scrape đầu tiên, đặt câu hỏi sau”dường như đã kết thúc, với ngành công nghiệp hiện phải đối mặt với áp lực mạnh mẽ để chứng minh dòng dữ liệu sạch và thương lượng cho nội dung thúc đẩy công nghệ biến đổi của nó.