มานุษยวิทยาได้แนะนำ Claude 3.7 Sonnet ผู้เล่นตัวจริงของ AI ที่รวมการสร้างการตอบสนองอย่างรวดเร็วเข้ากับความสามารถในการใช้เหตุผลขั้นสูง
การเปิดตัวดังต่อไปนี้ Claude 3.0 ซึ่งแนะนำการประมวลผลแบบยาวและการเก็บรักษาบริบทที่ดีขึ้นและ Claude 3.5 Sonnet ซึ่งปรับปรุงการเขียนโปรแกรมและการวิเคราะห์เอกสาร
คุณลักษณะที่โดดเด่นของโมเดลคือความสามารถของมันคือความสามารถของมันคือความสามารถ ในการ“ กำหนดข้อ จำกัด เกี่ยวกับเวลาตอบสนอง” ช่วยให้นักพัฒนาสามารถปรับแต่งประสิทธิภาพของ AI ได้ตามความต้องการเฉพาะควบคู่ไปกับการเปิดตัวมานุษยวิทยากำลังเปิดตัว CLAUDE Code ซึ่งเป็นเครื่องมือที่สามารถทำได้ ค้นหาแก้ไขและดำเนินการโค้ดโดยให้ความช่วยเหลือในการพัฒนาซอฟต์แวร์ AI ที่ใช้พลังงานลึกลงไป
>>
การอัปเดต Claude ใหม่เข้าสู่การแข่งขัน AI ที่ครอบงำโดย OpenAI และ Gemini ของ Google แบบสอบถามและการแก้ปัญหาที่ซับซ้อนโดยไม่ต้องเปลี่ยนโมเดล
Claude 3.7 Sonnet มีให้บริการผ่าน Claude.ai, Amazon Bedrock, และจุดสุดยอดของ Google Cloud บริษัท ยังคงกำหนดราคาไม่เปลี่ยนแปลงแม้จะมีความสามารถที่เพิ่มขึ้นเหล่านี้
AI ที่ปรับความเร็วการคิด
หนึ่งในการเปลี่ยนแปลงที่ยิ่งใหญ่ที่สุดใน Claude 3.7 Sonnet เป็นแบบไดนามิก ระบบการให้เหตุผลซึ่งปรับความเร็วในการประมวลผลตามความซับซ้อนของงาน บริษัท ระบุว่า:
“ คุณสามารถเลือกได้เมื่อคุณต้องการให้โมเดลตอบคำถามตามปกติและเมื่อคุณต้องการให้คิดนานขึ้นก่อนที่จะตอบ ในโหมดมาตรฐาน Claude 3.7 Sonnet แสดงถึง Claude 3.5 Sonnet เวอร์ชันอัพเกรด ในโหมดการคิดแบบขยายมันจะสะท้อนตนเองก่อนที่จะตอบกลับซึ่งปรับปรุงประสิทธิภาพของมันในวิชาคณิตศาสตร์ฟิสิกส์การเรียนการสอนการเข้ารหัสและงานอื่น ๆ อีกมากมาย โดยทั่วไปเราพบว่าการแจ้งเตือนสำหรับโมเดลนั้นทำงานได้คล้ายกันในทั้งสองโหมด
วินาทีเมื่อใช้ Claude 3.7 Sonnet ผ่าน API ผู้ใช้ยังสามารถควบคุมงบประมาณสำหรับการคิด: คุณสามารถบอก Claude ให้คิดได้อีกต่อไป กว่าโทเค็น N สำหรับค่าใด ๆ ของ N ถึงขีด จำกัด ผลลัพธ์ของโทเค็น 128K สิ่งนี้ช่วยให้คุณแลกเปลี่ยนความเร็ว (และค่าใช้จ่าย) เพื่อคุณภาพของคำตอบ
ที่สามในการพัฒนารูปแบบการให้เหตุผลของเรา งานในโลกแห่งความเป็นจริงที่สะท้อนให้เห็นว่าธุรกิจใช้ LLMS จริงอย่างไร”
ซึ่งแตกต่างจากรุ่นที่ผ่านมาซึ่งปรับให้เหมาะสมสำหรับการตอบสนองอย่างรวดเร็วหรือการวิเคราะห์ที่ลึก แอพพลิเคชั่นในโลกแห่งความเป็นจริงตั้งแต่ระบบอัตโนมัติแบบเรียลไทม์ไปจนถึงการวิจัยเชิงลึก
[เนื้อหาฝังตัว]
Claude 3.7 Sonnet ซ้อนกันกับ Openai, Google และ Xai
วิธีการของมนุษย์กับ Claude 3.7 Sonnet วางไว้ในการแข่งขันโดยตรงกับ GPT-4 ของ Openai href=”https://www.theverge.com/news/618440/anthropic-claude-3-7-sonnet-ai-model-hybrid-reasoning”> Gemini ของ Google และ Grok-3 ของ Xai แต่ละรุ่นเหล่านี้มีจุดแข็งในพื้นที่ต่าง ๆ แต่การตัดสินใจของมานุษยวิทยาในการปรับแต่งการใช้เหตุผลแบบไฮบริดแทนที่จะมุ่งเน้นไปที่การค้นหาแบบเรียลไทม์เป็นกลยุทธ์ที่แตกต่าง
ซึ่งแตกต่างจากวิธีการหลายรุ่นของ OpenAI สำหรับเวลาตอบสนองที่รวดเร็วหรือการใช้เหตุผลที่ลึกซึ้งยิ่งขึ้น Claude 3.7 รวมทั้งสองเข้ากับระบบเดียว สิ่งนี้ช่วยลดความจำเป็นสำหรับผู้ใช้ในการเลือกระหว่างรุ่นที่แตกต่างกันขึ้นอยู่กับความซับซ้อนของงาน อย่างไรก็ตาม Openai ยังคงรักษาความได้เปรียบในการดึงเว็บสดซึ่งเป็นพื้นที่ที่ Claude ยังคงล้าหลัง
รุ่น Gemini ของ Google ซึ่งเน้นการรวมเข้ากับการค้นหาและความสามารถหลายแบบหลายแบบ ในขณะที่ AI ของ Google ได้รับประโยชน์จากการดึงข้อมูลที่ทันสมัย แต่ Claude 3.7 Sonnet ได้รับการปรับให้เหมาะสมสำหรับแอปพลิเคชันระดับองค์กรที่ต้องใช้เวลาตอบสนองและการปรับแต่งเฉพาะงาน
ในขณะเดียวกัน Grok-3 ของ Xai ทางเลือกสำหรับโมเดลพรีเมี่ยมของ OpenAi จัดลำดับความสำคัญของการมีส่วนร่วมแบบเรียลไทม์และการรวมโซเชียลมีเดีย ในขณะที่สิ่งนี้ทำให้มีประสิทธิภาพสำหรับกรณีการใช้งาน AI แบบโต้ตอบ แต่ก็ขาดการเพิ่มประสิทธิภาพที่มุ่งเน้นนักพัฒนาว่ามานุษยวิทยากำลังเน้นด้วยรหัส Claude
ตามมาตรฐานของมานุษยวิทยา Claude 3.7 Sonnet แสดงให้เห็นถึงความเป็นผู้นำที่ชัดเจน , มีประสิทธิภาพสูงกว่าโมเดลของ OpenAi และ Deepseek R1 ในการเข้ารหัสเอเจนต์ (ตรวจสอบ SWE-bench) และการใช้เครื่องมือตัวแทน (Tau-bench) ความสามารถในการดำเนินการปรับเปลี่ยนรหัสโต้ตอบกับเครื่องมือและทำตามคำแนะนำที่มีโครงสร้างทำให้เป็นตัวเลือกที่แข็งแกร่งสำหรับการพัฒนาซอฟต์แวร์และการทำงานอัตโนมัติเวิร์กโฟลว์
นอกจากนี้ยังนำไปสู่การเรียนการสอนต่อไปนี้ (IFEVAL) แสดงความน่าเชื่อถือสำหรับการดำเนินการงาน AI ในขณะที่ Openai O1 ยังคงแข่งขันในคำถาม & คำตอบหลายภาษาและ Deepseek R1 นำไปสู่การปรับปรุงมาตรฐานทางคณิตศาสตร์การปรับปรุงของ Claude 3.7 Sonnet ทำให้เป็นหนึ่งในแบบจำลองที่รอบด้านมากที่สุดสำหรับการใช้เหตุผลเชิงโครงสร้างและงานอัตโนมัติงาน
(GQPA Diamond), Claude 3.7 Sonnet กับการคิดแบบขยายอย่างใกล้ชิดตรงกับ Grok 3 Beta และรุ่นสูงของ Openai แต่หากไม่มีการคิดเพิ่มเติมประสิทธิภาพก็ลดลงอย่างมีนัยสำคัญ นอกจากนี้ยังประสบความสำเร็จในการปรับปรุงที่สำคัญในการแก้ปัญหาทางคณิตศาสตร์ (คณิตศาสตร์ 500) ให้คะแนนคล้ายกับ OpenAI O1 แต่ยังคงล้าหลัง Deepseek R1 และ Grok 3 Beta ในเกณฑ์มาตรฐานการแข่งขันคณิตศาสตร์ของโรงเรียนมัธยม (AIME 2024)
ในการให้เหตุผลด้านการมองเห็น (การตรวจสอบ MMMU), OpenAI O1 และ Grok 3 เบต้ารักษาขอบโดยบอกว่า Claude อาจยังต้องมีการปรับแต่งในงาน AI Vision ที่ใช้การมองเห็น
แหล่งที่มา: มานุษยวิทยา
มานุษยวิทยาของมานุษยวิทยา การมุ่งเน้นเชิงกลยุทธ์เกี่ยวกับองค์กร AI และการแก้ปัญหาที่มีโครงสร้างมากกว่าการดึงเว็บแบบเรียลไทม์ทำให้ Claude 3.7 Sonnet เหมาะสำหรับแอปพลิเคชันมืออาชีพ อย่างไรก็ตามรุ่น Gemini ของ Google, GPT-4 ของ OpenAI และ GROK-3 ของ XAI ยังคงผลักดัน AI แบบหลายรูปแบบและการเข้าถึงข้อมูลสดซึ่งเป็นพื้นที่ที่ Claude ยังคงมี จำกัด
ด้วยการปรับปรุงความยืดหยุ่นในการใช้เหตุผลเครื่องมือนักพัฒนาและความสามารถในการอัตโนมัติ Claude 3.7 Sonnet ตอกย้ำบทบาทของตนเป็นทางเลือกที่แข็งแกร่งสำหรับผู้ใช้ที่จัดลำดับความสำคัญเวิร์กโฟลว์ AI ที่ปรับแต่งได้ h3> claude code: AI ที่เขียนแก้ไขและทดสอบซอฟต์แวร์
claude code นับเป็นขั้นตอนในการทำให้ AI เป็นผู้มีส่วนร่วมในการพัฒนาซอฟต์แวร์มากขึ้น ซึ่งแตกต่างจาก GitHub Copilot ซึ่งส่วนใหญ่จะแนะนำตัวอย่างโค้ด CLAUDE CODE ได้รับการออกแบบมาเพื่อเรียกใช้เวิร์กโฟลว์การเขียนโปรแกรม สามารถอ่านไฟล์โครงการแก้ไขรหัสที่มีอยู่เรียกใช้การทดสอบและผลักดันการเปลี่ยนแปลงโดยตรงไปยังที่เก็บ
มานุษยวิทยาอธิบายรหัส Claude เป็น“ ผู้ทำงานร่วมกันที่ใช้งานอยู่ที่สามารถค้นหาและอ่านรหัสแก้ไขไฟล์เขียนและเรียกใช้การทดสอบ , commit และ push code ไปยัง GitHub และใช้เครื่องมือบรรทัดคำสั่ง”ตาม TechCrunch เครื่องมือได้รับการทดสอบภายในสำหรับการเข้ารหัสที่ใช้เวลานานถึง 45 นาทีช่วยในการสร้างแบบโต้ตอบ การออกแบบเว็บและการกลั่นฐานรหัส
พื้นที่เก็บข้อมูลของรหัส Claude GitHub ให้เอกสารรวมและตัวอย่างสำหรับนักพัฒนาที่ต้องการสำรวจความสามารถของมัน
[เนื้อหาฝังตัว]
ประสิทธิภาพที่เพิ่มขึ้น การใช้เหตุผลและการวิเคราะห์
Claude 3.7 Sonnet ไม่ได้เป็นเพียงการอัพเกรดสำหรับนักพัฒนา การวิเคราะห์การเงินและคณิตศาสตร์ เรียกใช้ผ่านสภาพแวดล้อมวิดีโอเกม รุ่นก่อนหน้าของ Claude ต่อสู้กับการวางแผนระยะยาวในการตั้งค่าแบบโต้ตอบ แต่รุ่นนี้ประสบความสำเร็จในการปรับตัวให้เข้ากับความท้าทายในเกมและกลยุทธ์การตัดสินใจที่ดีที่สุด
นอกจากนี้ตอนนี้รุ่นนี้มีความรู้ที่ได้รับการปรับปรุงในเดือนตุลาคม 2567. อย่างไรก็ตามไม่เหมือน GPT-4O ของ OpenAI และ Gemini ของ Google แต่ไม่มีความสามารถในการท่องเว็บสด จำกัด ความสามารถในการดึงข้อมูลขึ้นมา ข้อมูล.
แผนงาน AI ของมานุษยวิทยาและผลกระทบของอุตสาหกรรมในอนาคต
ด้วยการทำซ้ำแต่ละครั้งมานุษยวิทยาได้ปรับความสามารถของ AI ในการจัดการงานให้เหตุผลเพิ่มเติม สไตล์การโต้ตอบ การเปลี่ยนแปลงที่สำคัญกับ Claude 3.7 คือการรวมตัวกันของการควบคุมความเร็วการตอบสนองแบบไดนามิกช่วยให้ผู้ใช้สามารถกำหนดว่า AI ควรจัดลำดับความสำคัญความเร็วหรือความลึก การอัปเดตนี้ระบุถึงข้อ จำกัด ร่วมกันโดยตรงในโมเดล AI ขนาดใหญ่-ประสิทธิภาพในการปรับสมดุลด้วยความแม่นยำ
มานุษยวิทยาได้วางตำแหน่ง Claude เป็นแบบจำลอง AI ที่เหมาะสำหรับกรณีการใช้งานที่ซับซ้อนมากกว่าการโต้ตอบ AI แบบไม่เป็นทางการในตลาดมวลชน ความพร้อมใช้งานผ่านอเมซอนบดและ Google Vertex AI แนะนำการผลักดันระยะยาวไปสู่การรวม AI บนคลาวด์
เมื่อมองไปข้างหน้าการมุ่งเน้นของมานุษยวิทยาในการใช้เหตุผลแบบไฮบริดและแอพพลิเคชั่นระดับองค์กร รุ่นจัดการกระบวนการอัตโนมัติขนาดใหญ่ หากความสามารถในการดึงแบบเรียลไทม์และความสามารถหลายแบบกลายเป็นสิ่งจำเป็นเพิ่มเติมการเปิดตัว Claude ครั้งต่อไปอาจรวมคุณสมบัติที่ปิดช่องว่างระหว่างคู่แข่ง
สำหรับตอนนี้ Claude 3.7 Sonnet ยังคงเป็นแบบจำลอง AI ที่สร้างขึ้น และความแม่นยำการแกะสลักช่องที่ควบคุมเวลาการประมวลผลมีความสำคัญเท่ากับความแม่นยำในการตอบสนอง