Openai ลดเวลาการทดสอบความปลอดภัยของ AI จุดประกายความกังวลท่ามกลางการเปิดตัวแบบจำลอง

Openai กำลังเผชิญหน้ากับคำถามที่แหลมเกี่ยวกับโปรโตคอลความปลอดภัยหลังจาก

อ้างถึงแปดแหล่งที่คุ้นเคยกับการดำเนินงานของ บริษัท รายงานระบุว่าการทดสอบระยะเวลาซึ่งก่อนหน้านี้มีอายุหลายเดือนถูกบีบอัดเป็นเพียงไม่กี่วัน การเร่งความเร็วนี้เกิดขึ้นเมื่อ Openai เตรียมการเปิดตัวที่ใกล้เข้ามาอาจเป็นสัปดาห์หน้าของรุ่นใหม่รวมถึง O3 ที่เน้นเหตุผลออกจากผู้ทดสอบบุคคลที่สามและผู้ทดสอบภายในน้อยกว่าหนึ่งสัปดาห์สำหรับการประเมินความปลอดภัยที่สำคัญ

ตารางที่เร่งรีบ อย่างไรก็ตามความเร็วได้เพิ่มการเตือนภัยในหมู่ผู้ที่ได้รับมอบหมายให้ประเมินโมเดล “ เรามีการทดสอบความปลอดภัยอย่างละเอียดมากขึ้นเมื่อ [เทคโนโลยี] มีความสำคัญน้อยกว่า” ปัจจุบันบุคคลหนึ่งประเมินโมเดล O3 ที่กำลังจะมาถึงบอก The Financial Times

Altman อธิบายว่าการตัดสินใจส่วนหนึ่งเป็น“ การแยกแยะรูปแบบการใช้เหตุผลและโมเดลแชท/ความสำเร็จ” การเพิ่มผ่าน X ว่า“ เรารู้สึกตื่นเต้นเกี่ยวกับการแสดงที่เราเห็นจาก O3 ภายใน” และความล่าช้าจะทำให้ GPT-5“ ดีกว่าที่เราเคยเป็น `o4-mini` และ` O4-mini-high` ในการอัปเดตเว็บ CHATGPT ในขณะเดียวกันรายงานแนะนำรูปแบบหลายรูปแบบที่ได้รับการปรับปรุงชื่อ GPT-4.1 ที่มีชื่อไม่แน่นอนก็ใกล้จะเปิดตัว

คำถามเกี่ยวกับการทดสอบการปฏิบัติ

เกินกำหนดการที่ถูกบีบอัด นักวิจารณ์ตั้งคำถามถึงความมุ่งมั่นของ บริษัท ในการประเมินศักยภาพในการใช้ในทางที่ผิดเช่นการช่วยเหลือการสร้าง Bioweapon ผ่านการปรับแต่ง กระบวนการนี้เกี่ยวข้องกับการฝึกอบรมแบบจำลองในชุดข้อมูลพิเศษ (เช่นไวรัสวิทยา) เพื่อดูว่ามันพัฒนาความสามารถที่เป็นอันตราย

แต่ตามที่อดีตนักวิจัยด้านความปลอดภัยของ Openai Steven Adler และคนอื่น ๆ ที่อ้างถึงโดย FT การทดสอบรายละเอียดนี้มี จำกัด จากข้อมูลของ Adler ซึ่งมีรายละเอียดในมุมมอง ในบล็อกโพสต์ อาจหมายถึง Openai และ บริษัท AI อื่น ๆ กำลังประเมินความเสี่ยงที่เลวร้ายที่สุดของแบบจำลองของพวกเขา”คำวิจารณ์อื่นเกี่ยวข้องกับการทดสอบรุ่นรุ่นก่อนหน้าหรือ”จุดตรวจ”แทนที่จะเป็นรหัสสุดท้ายที่เผยแพร่สู่สาธารณะ “ มันเป็นวิธีปฏิบัติที่ไม่ดีที่จะปล่อยโมเดลที่แตกต่างจากที่คุณประเมิน” อดีตเจ้าหน้าที่ด้านเทคนิคของ Openai บอกกับ Ft.

OpenAI ปกป้องการปฏิบัติของตนโดยอ้างถึงประสิทธิภาพที่ได้รับจากระบบอัตโนมัติและแสดงความมั่นใจในวิธีการของมัน บริษัท ระบุว่าจุดตรวจนั้น“ เหมือนกันโดยทั่วไป” ไปยังรีลีสสุดท้ายและแบบจำลองนั้นได้รับการทดสอบอย่างละเอียดโดยเฉพาะอย่างยิ่งสำหรับความเสี่ยงที่หายนะ Johannes Heidecke หัวหน้าระบบความปลอดภัยของ Openai ยืนยันว่า“ เรามีความสมดุลที่ดีว่าเราเคลื่อนไหวเร็วแค่ไหนและเรามีความละเอียดรอบคอบแค่ไหน”

บริษัท ก็เพิ่งเปิดตัว การปรับการเสริมแรง (rft) -เทคนิคสำหรับการสร้าง”แบบจำลองผู้เชี่ยวชาญ”สำหรับแคบ อย่างไรก็ตามความคิดริเริ่มนี้ปรากฏขึ้นแตกต่างจากการประเมินความปลอดภัยพื้นฐานก่อนการเผยแพร่รายงานว่าสั้นลง

ประวัติของการอภิปรายความปลอดภัยภายใน

ความตึงเครียดระหว่างความเร็วของผลิตภัณฑ์และโปรโตคอลความปลอดภัย ในเดือนพฤษภาคม 2567 แจนเลคจากนั้นร่วมเป็นผู้นำของทีมงานการจัดตำแหน่งของ บริษัท มุ่งเน้นไปที่ความเสี่ยง AI ระยะยาวโดยระบุต่อสาธารณชนว่าในช่วงไม่กี่ปีที่ผ่านมา การจากไปของเขาและต่อมาการเข้าร่วมมานุษยวิทยาส่งสัญญาณความขัดแย้งอย่างลึกซึ้งเกี่ยวกับทรัพยากรและลำดับความสำคัญเกี่ยวกับการวิจัยความปลอดภัย AI ระยะยาว โดยเฉพาะอย่างยิ่ง OpenAI ได้ประกาศการจัดตั้งคณะกรรมการความปลอดภัยและความปลอดภัยที่นำโดยคณะกรรมการเมื่อไม่กี่วันก่อนหน้านี้ได้รับมอบหมายให้ใช้เวลา 90 วันในการประเมินและพัฒนากระบวนการด้านความปลอดภัยและให้คำแนะนำ

คู่แข่งในอุตสาหกรรมเน้นความโปร่งใส เมื่อวันที่ 28 มีนาคมมานุษยวิทยาให้รายละเอียดว่ากรอบการตีความของมันคือ”กล้องจุลทรรศน์ AI”โดยใช้
ภูมิทัศน์ด้านกฎระเบียบและความเสี่ยงอย่างต่อเนื่อง

ภูมิทัศน์อุตสาหกรรมที่กว้างขึ้นแสดงให้เห็นถึงความซับซ้อน มานุษยวิทยาในขณะที่ผลักดันกฎ AI ของรัฐบาลที่แข็งแกร่งขึ้นในต้นเดือนมีนาคมและยังได้ลบภาระผูกพันด้านความปลอดภัยโดยสมัครใจก่อนหน้านี้อย่างเงียบ ๆ ภายใต้โครงการทำเนียบขาวในปี 2023 แสดงให้เห็นถึงความตึงเครียดระหว่างการวางตำแหน่งสาธารณะและแรงกดดันจากการดำเนินงาน Openai เองเป็นปาร์ตี้ในการดำเนินการโดยสมัครใจกับรัฐบาลสหราชอาณาจักรและรัฐบาลสหรัฐฯเกี่ยวกับการเข้าถึงการทดสอบความปลอดภัยภายนอกดังที่ได้กล่าวไว้ในรายงาน FT

ในขณะเดียวกันกรอบการกำกับดูแลกำลังกระชับด้วยการกระทำ AI ของสหภาพยุโรป ความจำเป็นในการทดสอบที่แข็งแกร่งนั้นเน้นย้ำโดยการค้นพบช่องโหว่อย่างต่อเนื่องเช่น“ การเรียกใช้เครื่องมือล่าช้า” ที่พบในหน่วยความจำของ Google Gemini ในเดือนกุมภาพันธ์ การพัฒนาอย่างรวดเร็วของ OpenAi ยังคงดำเนินต่อไปแม้จะมี Altman การยอมรับความสามารถในการรับรู้ที่อาจเกิดขึ้น เมื่อต้นเดือนที่ผ่านมา

Openai ลดเวลาการทดสอบความปลอดภัยของ AI จุดประกายความกังวลท่ามกลางการเปิดตัวแบบจำลอง

Published by All Things Windows on April 11, 2025

คำถามเกี่ยวกับการทดสอบการปฏิบัติ

ประวัติของการอภิปรายความปลอดภัยภายใน

ภูมิทัศน์ด้านกฎระเบียบและความเสี่ยงอย่างต่อเนื่อง

IT Info

Bluesky เพื่อแนะนำระบบตรวจสอบสีน้ำเงินตรวจสอบ

IT Info

IT Info

Microsoft Edge Adobe PDF เปิดตัวเครื่องยนต์สำหรับธุรกิจที่ผลักดันไปปลายปี 2025

Openai ลดเวลาการทดสอบความปลอดภัยของ AI จุดประกายความกังวลท่ามกลางการเปิดตัวแบบจำลอง

Published by All Things Windows on April 11, 2025

คำถามเกี่ยวกับการทดสอบการปฏิบัติ

ประวัติของการอภิปรายความปลอดภัยภายใน

ภูมิทัศน์ด้านกฎระเบียบและความเสี่ยงอย่างต่อเนื่อง

Related Posts

IT Info

Bluesky เพื่อแนะนำระบบตรวจสอบสีน้ำเงินตรวจสอบ

IT Info

IT Info

Microsoft Edge Adobe PDF เปิดตัวเครื่องยนต์สำหรับธุรกิจที่ผลักดันไปปลายปี 2025