Openai กำลังเผชิญหน้ากับคำถามที่แหลมเกี่ยวกับโปรโตคอลความปลอดภัยหลังจาก

อ้างถึงแปดแหล่งที่คุ้นเคยกับการดำเนินงานของ บริษัท รายงานระบุว่าการทดสอบระยะเวลาซึ่งก่อนหน้านี้มีอายุหลายเดือนถูกบีบอัดเป็นเพียงไม่กี่วัน การเร่งความเร็วนี้เกิดขึ้นเมื่อ Openai เตรียมการเปิดตัวที่ใกล้เข้ามาอาจเป็นสัปดาห์หน้าของรุ่นใหม่รวมถึง O3 ที่เน้นเหตุผลออกจากผู้ทดสอบบุคคลที่สามและผู้ทดสอบภายในน้อยกว่าหนึ่งสัปดาห์สำหรับการประเมินความปลอดภัยที่สำคัญ

ตารางที่เร่งรีบ อย่างไรก็ตามความเร็วได้เพิ่มการเตือนภัยในหมู่ผู้ที่ได้รับมอบหมายให้ประเมินโมเดล “ เรามีการทดสอบความปลอดภัยอย่างละเอียดมากขึ้นเมื่อ [เทคโนโลยี] มีความสำคัญน้อยกว่า” ปัจจุบันบุคคลหนึ่งประเมินโมเดล O3 ที่กำลังจะมาถึงบอก The Financial Times

Altman อธิบายว่าการตัดสินใจส่วนหนึ่งเป็น“ การแยกแยะรูปแบบการใช้เหตุผลและโมเดลแชท/ความสำเร็จ” การเพิ่มผ่าน X ว่า“ เรารู้สึกตื่นเต้นเกี่ยวกับการแสดงที่เราเห็นจาก O3 ภายใน” และความล่าช้าจะทำให้ GPT-5“ ดีกว่าที่เราเคยเป็น `o4-mini` และ` O4-mini-high` ในการอัปเดตเว็บ CHATGPT ในขณะเดียวกันรายงานแนะนำรูปแบบหลายรูปแบบที่ได้รับการปรับปรุงชื่อ GPT-4.1 ที่มีชื่อไม่แน่นอนก็ใกล้จะเปิดตัว

คำถามเกี่ยวกับการทดสอบการปฏิบัติ

เกินกำหนดการที่ถูกบีบอัด นักวิจารณ์ตั้งคำถามถึงความมุ่งมั่นของ บริษัท ในการประเมินศักยภาพในการใช้ในทางที่ผิดเช่นการช่วยเหลือการสร้าง Bioweapon ผ่านการปรับแต่ง กระบวนการนี้เกี่ยวข้องกับการฝึกอบรมแบบจำลองในชุดข้อมูลพิเศษ (เช่นไวรัสวิทยา) เพื่อดูว่ามันพัฒนาความสามารถที่เป็นอันตราย

แต่ตามที่อดีตนักวิจัยด้านความปลอดภัยของ Openai Steven Adler และคนอื่น ๆ ที่อ้างถึงโดย FT การทดสอบรายละเอียดนี้มี จำกัด จากข้อมูลของ Adler ซึ่งมีรายละเอียดในมุมมอง ในบล็อกโพสต์ อาจหมายถึง Openai และ บริษัท AI อื่น ๆ กำลังประเมินความเสี่ยงที่เลวร้ายที่สุดของแบบจำลองของพวกเขา”คำวิจารณ์อื่นเกี่ยวข้องกับการทดสอบรุ่นรุ่นก่อนหน้าหรือ”จุดตรวจ”แทนที่จะเป็นรหัสสุดท้ายที่เผยแพร่สู่สาธารณะ “ มันเป็นวิธีปฏิบัติที่ไม่ดีที่จะปล่อยโมเดลที่แตกต่างจากที่คุณประเมิน” อดีตเจ้าหน้าที่ด้านเทคนิคของ Openai บอกกับ Ft.

OpenAI ปกป้องการปฏิบัติของตนโดยอ้างถึงประสิทธิภาพที่ได้รับจากระบบอัตโนมัติและแสดงความมั่นใจในวิธีการของมัน บริษัท ระบุว่าจุดตรวจนั้น“ เหมือนกันโดยทั่วไป” ไปยังรีลีสสุดท้ายและแบบจำลองนั้นได้รับการทดสอบอย่างละเอียดโดยเฉพาะอย่างยิ่งสำหรับความเสี่ยงที่หายนะ Johannes Heidecke หัวหน้าระบบความปลอดภัยของ Openai ยืนยันว่า“ เรามีความสมดุลที่ดีว่าเราเคลื่อนไหวเร็วแค่ไหนและเรามีความละเอียดรอบคอบแค่ไหน”

บริษัท ก็เพิ่งเปิดตัว การปรับการเสริมแรง (rft) -เทคนิคสำหรับการสร้าง”แบบจำลองผู้เชี่ยวชาญ”สำหรับแคบ อย่างไรก็ตามความคิดริเริ่มนี้ปรากฏขึ้นแตกต่างจากการประเมินความปลอดภัยพื้นฐานก่อนการเผยแพร่รายงานว่าสั้นลง

ประวัติของการอภิปรายความปลอดภัยภายใน

ความตึงเครียดระหว่างความเร็วของผลิตภัณฑ์และโปรโตคอลความปลอดภัย ในเดือนพฤษภาคม 2567 แจนเลคจากนั้นร่วมเป็นผู้นำของทีมงานการจัดตำแหน่งของ บริษัท มุ่งเน้นไปที่ความเสี่ยง AI ระยะยาวโดยระบุต่อสาธารณชนว่าในช่วงไม่กี่ปีที่ผ่านมา การจากไปของเขาและต่อมาการเข้าร่วมมานุษยวิทยาส่งสัญญาณความขัดแย้งอย่างลึกซึ้งเกี่ยวกับทรัพยากรและลำดับความสำคัญเกี่ยวกับการวิจัยความปลอดภัย AI ระยะยาว โดยเฉพาะอย่างยิ่ง OpenAI ได้ประกาศการจัดตั้งคณะกรรมการความปลอดภัยและความปลอดภัยที่นำโดยคณะกรรมการเมื่อไม่กี่วันก่อนหน้านี้ได้รับมอบหมายให้ใช้เวลา 90 วันในการประเมินและพัฒนากระบวนการด้านความปลอดภัยและให้คำแนะนำ

คู่แข่งในอุตสาหกรรมเน้นความโปร่งใส เมื่อวันที่ 28 มีนาคมมานุษยวิทยาให้รายละเอียดว่ากรอบการตีความของมันคือ”กล้องจุลทรรศน์ AI”โดยใช้

ภูมิทัศน์ด้านกฎระเบียบและความเสี่ยงอย่างต่อเนื่อง

ภูมิทัศน์อุตสาหกรรมที่กว้างขึ้นแสดงให้เห็นถึงความซับซ้อน มานุษยวิทยาในขณะที่ผลักดันกฎ AI ของรัฐบาลที่แข็งแกร่งขึ้นในต้นเดือนมีนาคมและยังได้ลบภาระผูกพันด้านความปลอดภัยโดยสมัครใจก่อนหน้านี้อย่างเงียบ ๆ ภายใต้โครงการทำเนียบขาวในปี 2023 แสดงให้เห็นถึงความตึงเครียดระหว่างการวางตำแหน่งสาธารณะและแรงกดดันจากการดำเนินงาน Openai เองเป็นปาร์ตี้ในการดำเนินการโดยสมัครใจกับรัฐบาลสหราชอาณาจักรและรัฐบาลสหรัฐฯเกี่ยวกับการเข้าถึงการทดสอบความปลอดภัยภายนอกดังที่ได้กล่าวไว้ในรายงาน FT

ในขณะเดียวกันกรอบการกำกับดูแลกำลังกระชับด้วยการกระทำ AI ของสหภาพยุโรป ความจำเป็นในการทดสอบที่แข็งแกร่งนั้นเน้นย้ำโดยการค้นพบช่องโหว่อย่างต่อเนื่องเช่น“ การเรียกใช้เครื่องมือล่าช้า” ที่พบในหน่วยความจำของ Google Gemini ในเดือนกุมภาพันธ์ การพัฒนาอย่างรวดเร็วของ OpenAi ยังคงดำเนินต่อไปแม้จะมี Altman การยอมรับความสามารถในการรับรู้ที่อาจเกิดขึ้น เมื่อต้นเดือนที่ผ่านมา

Categories: IT Info