มานุษยวิทยาได้เปิดตัวกรอบการตีความใหม่ที่ออกแบบมาเพื่อแสดงให้เห็นถึงการทำงานภายในของรูปแบบภาษา Claude ซึ่งอยู่ไกลเกินกว่าวิธีการดีบักแบบดั้งเดิม บริษัท อ้างว่าตอนนี้สามารถติดตามสิ่งที่โมเดลคือ’การคิด’-การคำนวณอะไรที่มีการดำเนินการภายในเพื่อให้ได้ผลลัพธ์ที่ได้รับ

ในกรณีที่โดดเด่นกลุ่มหนึ่งของคุณสมบัติถูกเปิดใช้งานในระหว่างเอาต์พุตที่ Claude ดูเหมือนจะสร้างคำอธิบายที่ผิดพลาด-เสียงที่เป็นไปได้ แต่เหตุผลที่ไม่ถูกต้องสำหรับคำตอบที่ไม่สามารถสนับสนุนได้อย่างมั่นใจ ในอีกรูปแบบการผลิตผลลัพธ์ที่แสดงถึงการคิดเชิงกลยุทธ์เกี่ยวกับวิธีการหลีกเลี่ยงการฝึกอบรมหรือแก้ไข และที่น่าตกใจที่สุดนักวิจัยได้ค้นพบการรวมกันของคุณสมบัติที่โผล่ขึ้นมาเมื่อโมเดลจินตนาการถึงสถานการณ์ที่เกี่ยวข้องกับอันตรายต่อนักพัฒนาซอฟต์แวร์แนะนำว่าแบบจำลองนั้นสามารถจำลองการกระทำที่ไม่ตรงกับค่านิยมของมนุษย์

[เนื้อหาฝังตัว]

บริษัท ยัง

Tao เติมเต็มสถาปัตยกรรมการพัฒนาของ Claude ในเดือนกุมภาพันธ์มานุษยวิทยาเปิดตัว Claude 3.7 Sonnet ซึ่งเป็นรูปแบบการใช้เหตุผลที่สามารถสลับระหว่างการตอบสนองที่รวดเร็วและพยายามอย่างรวดเร็วและการคิดเชิงวิเคราะห์ที่ช้าลง นักพัฒนาสามารถกำหนดค่าพฤติกรรมนี้ผ่าน“ งบประมาณโทเค็น” กำหนดจำนวนรูปแบบที่ควรสะท้อนก่อนที่จะตอบสนอง

ควบคู่ไปกับโมเดลใหม่ บริษัท ยังเปิดตัว Claude Code ซึ่งเป็นผู้ช่วยที่มุ่งเน้นนักพัฒนาที่จัดการงานการเขียนโปรแกรมแบบ end-to-end “ CLAUDE CODE เป็นผู้ทำงานร่วมกันที่ใช้งานได้ซึ่งสามารถค้นหาและอ่านรหัสแก้ไขไฟล์เขียนและเรียกใช้การทดสอบกระทำและส่งรหัสไปยัง GitHub และใช้เครื่องมือบรรทัดคำสั่ง” บริษัท ระบุไว้ในรุ่นเดียวกัน

Claude 3.7 มันนำไปสู่การเข้ารหัสเอเจนต์ (ตรวจสอบ BENCH), การใช้เครื่องมือ (Tau-bench) และการเรียนการสอนต่อไปนี้ (IFEVAL) ตามตัวชี้วัดของมานุษยวิทยา

Claude ได้รับข้อมูลเรียลไทม์ มีให้กับผู้ใช้ Claude Pro และทีมในสหรัฐอเมริกาคุณลักษณะนี้จะดึงข้อมูลแบบเรียลไทม์และแนบการอ้างอิงแหล่งที่มา-บางสิ่งที่ขาดหายไปจากระบบ AI ที่แข่งขันกันจำนวนมาก

เมื่อเปิดใช้งาน Claude จะกำหนดว่าเมื่อใดที่จะดึงข้อมูลจากเว็บและรวมลิงก์อินไลน์ไปยังบทความหรือโพสต์ต้นฉบับ เป้าหมายคือการสร้างสมดุลระหว่างการสร้างผลผลิตด้วยแหล่งข้อมูลที่ตรวจสอบได้และตรวจสอบได้-การขยายความคิดริเริ่มความโปร่งใสของ บริษัท

โปรโตคอลสำหรับการสร้างตัวแทนโปร่งใส

มานุษยวิทยา รูปแบบบริบทของ บริษัท (MCP)-เปิดตัวครั้งแรกในเดือนพฤศจิกายน 2567-ให้วิธีที่เป็นมาตรฐานสำหรับระบบ AI ในการโต้ตอบกับที่เก็บหน่วยความจำเครื่องมือและ API Microsoft เพิ่มการสนับสนุนสำหรับ MCP ใน Azure AI Foundry เคอร์เนลความหมายและ GitHub ในสัปดาห์นี้ช่วยให้ตัวแทนที่ใช้ Claude สร้างและดำเนินการกระบวนการหลายขั้นตอนด้วยการคงอยู่

ในฐานะตัวแทน AI ขยายบทบาทในซอฟต์แวร์อัตโนมัติ เมื่อแบบจำลองดำเนินการกระทำในโลกแห่งความเป็นจริงการทำความเข้าใจว่าทำไมการเลือกที่เฉพาะเจาะจงไม่ใช่แค่วิชาการ-มันเป็นข้อกำหนด

นักลงทุนกลับมาโปร่งใส-และพลัง

โมเมนตัมของมานุษยวิทยาได้รับการสนับสนุนจากการสนับสนุนทางการเงินที่สำคัญ ในเดือนกุมภาพันธ์ บริษัท ระดมทุน 3.5 พันล้านดอลลาร์เพิ่มการประเมินมูลค่าเป็น 61.5 พันล้านดอลลาร์ นักลงทุนรวมถึง Lightspeed Venture Partners, General Catalyst และ MGX การลงทุนก่อนหน้านี้ $ 4 พันล้านของ Amazon ต่อไปทำให้การปรากฏตัวของ Claude ในโครงสร้างพื้นฐานของ AWS

การเคลื่อนไหวเหล่านี้ทำให้มานุษยวิทยามีการแข่งขันเชิงกลยุทธ์กับ Openai, Google Deepmind, Chinese Chitains Deepseek และ AI Labs อื่น ๆ เช่น XAI ของ Elon Musk ในขณะที่คู่แข่งมุ่งเน้นไปที่การรวมหลายรูปแบบหรือการค้นหาสดมานุษยวิทยากำลังสร้างชื่อเสียงในการจัดตำแหน่งองค์กรและความโปร่งใสของพฤติกรรม AI

กลยุทธ์นั้นก็เห็นได้ชัดในนโยบาย เดือนนี้ บริษัท ได้ส่งคำแนะนำอย่างเป็นทางการไปยังทำเนียบขาวกระตุ้นการทดสอบความมั่นคงแห่งชาติของระบบ AI การควบคุมการส่งออกเซมิคอนดักเตอร์ที่เข้มงวดมากขึ้นและการขยายตัวของโครงสร้างพื้นฐานพลังงานของสหรัฐอเมริกาเพื่อสนับสนุนการเพิ่มปริมาณงาน AI มันเตือนว่า AI ขั้นสูงสามารถเกินขีดความสามารถของมนุษย์ในสาขาสำคัญภายในปี 2569-การเสี่ยงหากการป้องกันไม่ได้ถูกตราขึ้นอย่างรวดเร็ว

ในขณะที่สนับสนุนการกำกับดูแลภายนอกที่แข็งแกร่งขึ้น บริษัท ไม่ได้แสดงความคิดเห็นต่อสาธารณชนเกี่ยวกับการพลิกกลับนี้แม้ว่าจะได้จุดประกายความกังวลเกี่ยวกับบรรทัดฐานของอุตสาหกรรมที่เปลี่ยนไปรอบ ๆ การควบคุมตนเอง

กล้องจุลทรรศน์ตรงกับกระจก

นักมานุษยวิทยา Dario Amodei ได้แสดงวิสัยทัศน์ที่ชัดเจนสำหรับการพัฒนา AI ตามที่รายงานโดย wired “มีโอกาสที่ดี ในการดำเนินงานของมานุษยวิทยารวมถึงการเข้ารหัสการวิจัยและการสนับสนุนนโยบาย แต่การพึ่งพาภายในนี้ยังมีความเสี่ยง-โดยเฉพาะอย่างยิ่งเมื่อเครื่องมือของ บริษัท เปิดเผยถึงความสามารถของ Claude สำหรับการกำหนดทิศทางและการจัดการที่ผิดพลาด

พฤติกรรมของ Claude ในระหว่างการทดสอบภายใน เครื่องมือมานุษยวิทยากำลังสร้างในขณะนี้อาจเป็นสิ่งจำเป็นสำหรับการควบคุมแบบจำลองที่มีความเป็นอิสระเพิ่มขึ้น

เครื่องมือเหล่านี้จะถูกนำมาใช้อย่างกว้างขวางหรือเพียงพอหรือเพียงพอ แต่ด้วยการพัฒนาของ Claude อย่างรวดเร็วและการกำกับดูแลอุตสาหกรรมยังคงเป็นรูปเป็นร่างความสามารถในการตีความไม่ได้เป็นโครงการด้านข้างอีกต่อไป เป็นรากฐานสำหรับการตัดสินใจว่า AI ขั้นสูงสามารถเชื่อถือได้หรือไม่