Microsoft และ OpenAI ซึ่งเผชิญกับข้อกล่าวหาเรื่องการละเมิดลิขสิทธิ์จาก The New York Times และผู้จัดพิมพ์รายอื่น ได้โต้แย้งในศาลรัฐบาลกลางเมื่อวันอังคารว่าการใช้บทความข่าวที่เปิดเผยต่อสาธารณะเพื่อฝึกอบรมโมเดลภาษาขนาดใหญ่ (LLM) ถูกต้องตามกฎหมายภายใต้การใช้งานโดยชอบธรรม หลักคำสอน

คดีความ ซึ่งยื่นในเดือนธันวาคม 2023 และขณะนี้ได้รวมเข้ากับการเรียกร้องที่คล้ายกันจาก The New York Daily News และ Center for Investigative Reporting แล้ว ยืนยันว่าระบบ AI เช่น ChatGPT และ Microsoft Copilot ได้ใช้ประโยชน์จากเนื้อหาที่มีลิขสิทธิ์โดยไม่มี การอนุญาต บ่อนทำลายรายได้ของผู้จัดพิมพ์และสิทธิ์ในทรัพย์สินทางปัญญา

โจทก์ยืนยันว่าโมเดล AI เหล่านี้ซึ่งได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มีบทความหลายล้านบทความ สามารถทำซ้ำหรือสรุปเนื้อหาในรูปแบบที่ใช้แทนงานต้นฉบับได้ “นี่เป็นเกี่ยวกับการแทนที่เนื้อหา ไม่ใช่การเปลี่ยนแปลง” Ian Crosby ตัวแทนของ The New York Times กล่าว

Crosby เตือนว่าแนวทางปฏิบัติดังกล่าวอาจเบี่ยงเบนการรับส่งข้อมูลออนไลน์ระหว่าง 30% ถึง 50% ไปจากผู้จัดพิมพ์ เว็บไซต์

หลักการใช้งานที่เป็นธรรมเป็นหัวใจของคดี

การป้องกันของ OpenAI ขึ้นอยู่กับข้อโต้แย้งที่ว่าการใช้ข้อมูลข่าวสารของพวกเขามีการเปลี่ยนแปลงและได้รับการปกป้องโดย หลักการใช้งานโดยชอบ Joseph Gratz ทนายความของ OpenAI อธิบายให้ผู้พิพากษา Sidney Stein ทราบว่า ChatGPT ประมวลผลข้อมูลโดยแบ่งออกเป็นหน่วยเล็กๆ ที่เรียกว่าโทเค็น ช่วยให้โมเดลจดจำรูปแบบและสร้างเนื้อหาใหม่ แทนที่จะจำลองข้อความโดยตรง

Joseph Gratz ทนายความของ OpenAI กล่าวว่าการรื้อฟื้นบทความทั้งหมด”ไม่ใช่สิ่งที่ได้รับการออกแบบมาให้ทำและไม่ใช่สิ่งที่ทำ”เมื่อพูดถึงวิธีการทำงานของ ChatGPT โดยให้เหตุผลว่าผลลัพธ์ที่คล้ายกับเนื้อหาที่มีลิขสิทธิ์มักจะเกิดขึ้นเท่านั้น หลังจากที่ผู้ใช้ที่ระบุจงใจพยายามกระตุ้นการตอบสนองดังกล่าว

ทีมกฎหมายของ Microsoft สนับสนุนการกล่าวอ้างเหล่านี้ โดยวาดความคล้ายคลึงกันระหว่างการฝึกอบรม AI กับนวัตกรรมทางเทคโนโลยีก่อนหน้านี้ เช่น VCR และสำเนา เครื่องจักรซึ่งถูกโต้แย้งในตอนแรก แต่ท้ายที่สุดก็ถือว่าถูกกฎหมาย

พวกเขาแย้งว่าการใช้งานโดยชอบทำให้เกิดการพัฒนาเทคโนโลยีที่เป็นประโยชน์ต่อสังคม โดยไม่กระทบต่อสิทธิ์ของผู้สร้างเนื้อหา “กฎหมายลิขสิทธิ์ไม่เป็นอุปสรรคต่อ LLM มากไปกว่า VCR (หรือเครื่องเล่นเปียโน เครื่องถ่ายเอกสาร คอมพิวเตอร์ส่วนบุคคล อินเทอร์เน็ต หรือเครื่องมือค้นหา)” บริษัทระบุในเอกสารที่ยื่นต่อศาล

ผู้จัดพิมพ์เรียกร้องความเสียหายทางการเงินและจริยธรรม

ผู้จัดพิมพ์โต้แย้งว่าการใช้เนื้อหาของตนโดยไม่ได้รับอนุญาตไม่เพียงแต่ละเมิดกฎหมายลิขสิทธิ์ แต่ยังคุกคามความยั่งยืนทางการเงินของผู้จัดพิมพ์อีกด้วย เครื่องมือ AI สรุปบทความหรือให้คำแนะนำผลิตภัณฑ์ที่หลีกเลี่ยงเพย์วอลล์ของผู้เผยแพร่

ตามรายงานของ Times Bing Chat ของ Microsoft ซึ่งปัจจุบันเปลี่ยนชื่อเป็น Copilot ได้เปลี่ยนเส้นทางผู้อ่านที่มีศักยภาพออกจาก Wirecutter แพลตฟอร์มในเครือ ช่วยลดปริมาณการเข้าชมและรายได้

Steven Lieberman ซึ่งเป็นตัวแทนของ The New York Daily News วิพากษ์วิจารณ์ บริษัทเทคโนโลยีพึ่งพาแหล่งข้อมูลต่างๆ เช่น Common Crawl ซึ่งเป็นองค์กรไม่แสวงหาผลกำไรที่รวบรวมข้อมูลเว็บเพื่อการใช้งานสาธารณะ เขาอธิบายว่าแนวปฏิบัตินี้เป็น”การขับเคลื่อนอย่างอิสระ”ในงานของนักข่าวและผู้จัดพิมพ์ ทำให้บริษัท AI สามารถสร้างรายได้จากเนื้อหาที่พวกเขาไม่ได้สร้างหรือออกใบอนุญาต

ในขณะที่ OpenAI โต้แย้งว่าแนวทางนี้ทำให้การเข้าถึงข้อมูลเป็นประชาธิปไตย แต่นักวิจารณ์ก็ชี้ว่า เนื่องจากมีเนื้อหาที่มีลิขสิทธิ์โดยไม่มีการตรวจสอบอย่างเหมาะสม

การรวมปัญหาคือการใช้การดึงข้อมูลเสริม (RAG) ของ OpenAI ซึ่งเป็นวิธีการที่ผสานรวมข้อมูลแบบเรียลไทม์จากเว็บ ในการตอบกลับที่สร้างโดย AI แม้ว่าเทคนิคนี้จะเพิ่มความเกี่ยวข้องและความแม่นยำของผลลัพธ์ แต่ก็ทำให้เกิดคำถามเกี่ยวกับวิธีการเข้าถึงและทำซ้ำเนื้อหาของผู้เผยแพร่

เดิมพันสูง: การทำลายชุดข้อมูลที่อาจเกิดขึ้นและบทลงโทษทางการเงิน

การฟ้องร้องเรียกร้องค่าเสียหายมูลค่าหลายพันล้านดอลลาร์ และเรียกร้องให้ทำลายชุดข้อมูลที่มีเนื้อหาที่ไม่ได้รับอนุญาต คำตัดสินดังกล่าวอาจมีผลกระทบอย่างลึกซึ้ง OpenAI และ Microsoft บังคับให้พวกเขาสร้างระบบ AI ใหม่โดยใช้เนื้อหาที่ได้รับอนุญาตหรือเป็นสาธารณสมบัติเท่านั้น

กฎหมายลิขสิทธิ์ของรัฐบาลกลาง อนุญาตให้มีค่าปรับสูงสุดถึง $150,000 สำหรับการละเมิดโดยเจตนาแต่ละครั้ง

a> ตัวเลขที่อาจเพิ่มขึ้นอย่างมากเมื่อพิจารณาจากปริมาณข้อมูลที่เกี่ยวข้อง

เครื่องมือจัดการสื่อที่ล่าช้าและการตอบสนองของอุตสาหกรรม

คดีความ ยังตอกย้ำความไม่พอใจเกี่ยวกับการเปิดตัวเครื่องมือ Media Manager ที่ล่าช้าของ OpenAI ซึ่งสัญญาเริ่มแรกในเดือนพฤษภาคม 2567 เพื่อให้ผู้สร้างควบคุมวิธีการใช้เนื้อหาของตนในชุดข้อมูลการฝึกอบรม AI ได้ดียิ่งขึ้น

นักวิจารณ์แย้งว่าความล้มเหลวนี้ทำให้ผู้จัดพิมพ์รายย่อยและผู้สร้างอิสระมีทางเลือกที่จำกัดในการปกป้องทรัพย์สินทางปัญญาของตน

ในขณะที่ผู้จัดพิมพ์รายใหญ่เช่น TIME, The New Yorker, Vogue, Vanity Fair, Bon Appetit และ Wired และสิ่งพิมพ์อื่นๆ อีกกว่า 2oo รายการได้รับข้อตกลงใบอนุญาตกับ OpenAI แต่ผู้เล่นรายย่อยจำนวนมากขาดทรัพยากรในการเจรจาข้อตกลงที่คล้ายกัน.

อุตสาหกรรมในวงกว้างยังคงแตกแยก โดยบางบริษัทยอมรับความร่วมมือในการออกใบอนุญาตเนื้อหาสำหรับการพัฒนา AI ในขณะที่บริษัทอื่นๆ ดำเนินคดีตามกฎหมาย ในแคนาดา กลุ่มผู้จัดพิมพ์ได้ยื่นฟ้องโดยกล่าวหาว่า OpenAI มี”การคัดลอกข้อมูลอย่างกว้างขวาง”และนักเขียนที่มีชื่อเสียงอย่าง Michael Chabon ก็แสดงข้อกังวลที่คล้ายกัน

ผู้พิพากษาตัดสินให้มีการไล่ออก

ผู้พิพากษา Sidney Stein ซึ่งแสดงให้เห็นถึงความเข้าใจอย่างลึกซึ้งในประเด็นทางเทคนิคในระหว่างการพิจารณาคดี ยังไม่ได้ตัดสินคำร้องของจำเลยที่จะยกฟ้อง

Stein รับทราบถึงความซับซ้อนของคดีนี้ โดยระบุว่าการใช้งานโดยชอบธรรมน่าจะมีบทบาทสำคัญในการตัดสินใจของเขา ผลลัพธ์ที่ได้อาจเป็นแบบอย่างที่สำคัญสำหรับวิธีที่ระบบ AI สร้างสรรค์โต้ตอบกับเนื้อหาที่มีลิขสิทธิ์ และภาระหน้าที่ของนักพัฒนาที่มีต่อผู้สร้างเนื้อหา

ในขณะที่การดำเนินการทางกฎหมายดำเนินต่อไป ผลกระทบก็ขยายไปไกลเกินกว่า OpenAI และ Microsoft คดีนี้มีศักยภาพในการกำหนดอนาคตของ generative AI โดยสร้างสมดุลระหว่างนวัตกรรมกับสิทธิ์ของผู้เผยแพร่และ ผู้สร้าง