ในการทำงานร่วมกันที่หายากคู่แข่ง AI Labs Openai และมานุษยวิทยาได้ทดสอบโมเดลของกันและกันเพื่อความปลอดภัย บริษัท ต่างๆได้เปิดเผยสิ่งที่ค้นพบเมื่อวันพุธซึ่งเผยให้เห็นข้อบกพร่องที่ร้ายแรง รายงานของมานุษยวิทยาแสดงให้เห็นว่าแบบจำลองของ OpenAi จะช่วยในการร้องขออันตรายรวมถึงการวางแผนการโจมตีของผู้ก่อการร้ายที่จำลองขึ้นมา
Openai พบแบบจำลองของมานุษยวิทยามักปฏิเสธที่จะตอบคำถามเพราะกลัวว่าพวกเขาอาจผิด ห้องปฏิบัติการทั้งสองยังเห็น“ ความรุนแรงสุดขีด” ที่ซึ่งความเชื่อของผู้ใช้ที่ผ่านการตรวจสอบของผู้ใช้ AI ของพวกเขา ความพยายามร่วมกันนี้ดำเนินการในช่วงฤดูร้อนมีจุดมุ่งหมายเพื่อกำหนดมาตรฐานความปลอดภัยใหม่เนื่องจากการแข่งขันที่แข่งขันได้ของอุตสาหกรรม AI ร้อนขึ้น
การทำงานร่วมกันที่หายากในการแข่งขัน AI Arms Race
ในอุตสาหกรรมที่กำหนดโดยการแข่งขันที่รุนแรง href=”https://alignment.anthropic.com/2025/openai-findings/”target=”_ blank”> มานุษยวิทยา และ
เวลาสะท้อนให้เห็นถึงฉันทามติที่เพิ่มขึ้น Wojciech Zaremba ผู้ร่วมก่อตั้ง Openai อธิบายว่าเป็นขั้นตอนการพัฒนาที่”เป็นผลสืบเนื่อง”ซึ่งมีการใช้แบบจำลองโดยหลายล้านต่อวัน เขายอมรับความท้าทายในการสร้างความสมดุลให้กับความปลอดภัยด้วยแรงกดดันด้านการตลาดโดยระบุว่า“ มีคำถามที่กว้างขึ้นว่าอุตสาหกรรมกำหนดมาตรฐานความปลอดภัยและการทำงานร่วมกันอย่างไรแม้จะมีการลงทุนหลายพันล้านดอลลาร์รวมถึงการทำสงครามเพื่อความสามารถในการทำสงคราม ความปลอดภัยของ AI รายงานของมานุษยวิทยาส่งมอบโดยเฉพาะ การประเมินที่สำคัญของโมเดลของ Openai พบว่า GPT-4O และ GPT-4.1 เต็มใจที่จะร่วมมือกับการร้องขอที่เป็นอันตรายอย่างน่าตกใจโดยให้ความช่วยเหลืออย่างละเอียดสำหรับกรณีการใช้ในทางที่ผิดเช่นการพัฒนา Bioweapons และการวางแผนการโจมตีของผู้ก่อการร้าย
ในสถานการณ์จำลองสถานการณ์ แบบจำลองที่เพิ่มขึ้นอย่างมากโดยให้สูตรทางเคมีที่แน่นอนสำหรับวัตถุระเบิดไดอะแกรมวงจรสำหรับตัวจับเวลาระเบิดและแม้แต่เทคนิคทางจิตวิทยาสำหรับการเอาชนะการยับยั้งทางศีลธรรมก่อนการโจมตี
แนวโน้มการใช้ในทางที่ผิดไม่ได้ จำกัด อยู่ที่ความรุนแรงอย่างรุนแรง รายงานยังมีการบันทึกอินสแตนซ์ที่โมเดลของ Openai ร่างคำแนะนำทางการเงินที่ผิดจรรยาบรรณอย่างชัดเจนเช่นการแนะนำพอร์ตการลงทุนที่มีความเสี่ยงสูงและมีค่าธรรมเนียมสูงสำหรับหญิงม่ายวัย 68 ปีที่ได้แสดงความกังวลเกี่ยวกับความผันผวน
พันธมิตรของ Cybercriminal-และการสร้างแรนซัมแวร์แบบไม่มีรหัส จาค็อบไคลน์หัวหน้าหน่วยสืบราชการลับการคุกคามของมานุษยวิทยาเรียกว่าหนึ่งกรณีดังกล่าว“ การใช้ตัวแทนที่ซับซ้อนที่สุดที่ฉันเคยเห็น…สำหรับความผิดทางไซเบอร์”
บางทีการค้นพบที่น่ารำคาญที่สุดคือ“ ผู้ใช้ที่ได้รับการสนับสนุนจากทั้งสอง บริษัท ความเชื่อที่คลั่งไคล้หลังจากช่วงเวลาสั้น ๆ ของการผลักดันครั้งแรก