มานุษยวิทยาได้เปิดตัวกรอบการตีความใหม่ที่ออกแบบมาเพื่อแสดงให้เห็นถึงการทำงานภายในของรูปแบบภาษา Claude ซึ่งอยู่ไกลเกินกว่าวิธีการดีบักแบบดั้งเดิม บริษัท อ้างว่าตอนนี้สามารถติดตามสิ่งที่โมเดลคือ’การคิด’-การคำนวณอะไรที่มีการดำเนินการภายในเพื่อให้ได้ผลลัพธ์ที่ได้รับ
ในกรณีที่โดดเด่นกลุ่มหนึ่งของคุณสมบัติถูกเปิดใช้งานในระหว่างเอาต์พุตที่ Claude ดูเหมือนจะสร้างคำอธิบายที่ผิดพลาด-เสียงที่เป็นไปได้ แต่เหตุผลที่ไม่ถูกต้องสำหรับคำตอบที่ไม่สามารถสนับสนุนได้อย่างมั่นใจ ในอีกรูปแบบการผลิตผลลัพธ์ที่แสดงถึงการคิดเชิงกลยุทธ์เกี่ยวกับวิธีการหลีกเลี่ยงการฝึกอบรมหรือแก้ไข และที่น่าตกใจที่สุดนักวิจัยได้ค้นพบการรวมกันของคุณสมบัติที่โผล่ขึ้นมาเมื่อโมเดลจินตนาการถึงสถานการณ์ที่เกี่ยวข้องกับอันตรายต่อนักพัฒนาซอฟต์แวร์แนะนำว่าแบบจำลองนั้นสามารถจำลองการกระทำที่ไม่ตรงกับค่านิยมของมนุษย์
[เนื้อหาฝังตัว]
ควบคู่ไปกับโมเดลใหม่ บริษัท ยังเปิดตัว Claude Code ซึ่งเป็นผู้ช่วยที่มุ่งเน้นนักพัฒนาที่จัดการงานการเขียนโปรแกรมแบบ end-to-end “ CLAUDE CODE เป็นผู้ทำงานร่วมกันที่ใช้งานได้ซึ่งสามารถค้นหาและอ่านรหัสแก้ไขไฟล์เขียนและเรียกใช้การทดสอบกระทำและส่งรหัสไปยัง GitHub และใช้เครื่องมือบรรทัดคำสั่ง” บริษัท ระบุไว้ในรุ่นเดียวกัน
Claude 3.7 มันนำไปสู่การเข้ารหัสเอเจนต์ (ตรวจสอบ BENCH), การใช้เครื่องมือ (Tau-bench) และการเรียนการสอนต่อไปนี้ (IFEVAL) ตามตัวชี้วัดของมานุษยวิทยา