Cognition ซึ่งเป็นห้องปฏิบัติการ AI ที่อยู่เบื้องหลังตัวแทน Devin ได้เปิดตัว SWE-1.5 ซึ่งเป็นโมเดลการเข้ารหัสความเร็วสูงใหม่ที่ท้าทายตลาดด้วยการจัดลำดับความสำคัญทั้งประสิทธิภาพและความเร็ว

ประกาศเมื่อวันที่ 29 ตุลาคม ขณะนี้โมเดลดังกล่าวพร้อมใช้งานใน Windsurf IDE ซึ่ง Cognition ได้รับในเดือนกรกฎาคม บริษัทอ้างว่า SWE-1.5 ทำงานเร็วกว่า Sonnet 4.5 ของ Anthropic ถึง 13 เท่า ด้วยความร่วมมือกับ Cerebras ผู้ให้บริการการอนุมาน

การเปิดตัวดังกล่าวเกิดขึ้นเมื่อ Cursor คู่แข่งเปิดตัวโมเดลที่รวดเร็วของตัวเอง นั่นคือ Composer ซึ่งส่งสัญญาณถึงเทรนด์ใหม่ที่บริษัทตัวแทน AI กำลังสร้างโมเดลที่เป็นกรรมสิทธิ์เพื่อสร้างประสบการณ์นักพัฒนาที่มีการบูรณาการอย่างแน่นหนาและมีเวลาแฝงต่ำ และลดการพึ่งพา API ของบุคคลที่สาม

มาตรฐานใหม่สำหรับความเร็วและความชาญฉลาด

ในการเคลื่อนไหวที่สะท้อนคู่แข่งโดยตรง Cognition กำลังวางเดิมพันกับการบูรณาการในแนวดิ่งเพื่อแก้ปัญหาความหงุดหงิดหลักของนักพัฒนา: การแลกเปลี่ยนระหว่างหน่วยสืบราชการลับของโมเดลและเวลาตอบสนอง

กลยุทธ์ของบริษัทสร้างขึ้นจากแนวคิดในการออกแบบแบบจำลองร่วมกัน ระบบการอนุมาน และตัวแทนควบคุมให้เป็นระบบเดียวที่เป็นหนึ่งเดียว

ตามข้อมูล ประกาศอย่างเป็นทางการ“นักพัฒนาไม่ควรต้องเลือกระหว่าง AI ที่คิดเร็วกับที่คิดดี”

ปรัชญานี้เป็นรากฐานของ SWE-1.5 ซึ่ง Cognition อธิบายว่าเป็นโมเดล”ขนาดชายแดน”ที่มีพารามิเตอร์หลายแสนล้านรายการ ออกแบบมาโดยเฉพาะเพื่อขจัดการประนีประนอมดังกล่าว และมอบทั้งประสิทธิภาพที่ยอดเยี่ยมและดีที่สุดในระดับเดียวกัน ความเร็ว

คุณลักษณะที่โดดเด่นที่สุดของโมเดลคือความเร็วที่แท้จริง ซึ่งเป็นผลมาจากความร่วมมืออย่างใกล้ชิดกับ Cerebras ผู้เชี่ยวชาญด้านการอนุมาน Cognition อ้างว่าการทำงานร่วมกันนี้ช่วยให้ SWE-1.5 สามารถบรรลุเวลาแฝงที่น่าทึ่ง โดยระบุว่า”มันยังกำหนดมาตรฐานใหม่สำหรับความเร็ว: เราร่วมมือกับ Cerebras เพื่อให้บริการได้สูงถึง 950 tok/s ซึ่งเร็วกว่า Haiku 4.5 ถึง 6 เท่า และเร็วกว่า Sonnet 4.5 ถึง 13 เท่า”

การก้าวกระโดดด้านประสิทธิภาพนี้มีจุดมุ่งหมายเพื่อให้นักพัฒนาอยู่ใน”สถานะการไหล”โดยทำงานให้เสร็จสิ้นภายในเวลาไม่ถึงห้าวินาที ซึ่งเป็นเกณฑ์สำคัญในการหลีกเลี่ยงสิ่งที่ บริษัทเรียก”หุบเขาแห่งความตายแบบกึ่งอะซิงก์”

ความพยายามในการเพิ่มประสิทธิภาพไปไกลกว่าตัวโมเดลเอง เนื่องจากความเร็วเผยให้เห็นปัญหาคอขวดใหม่ใน Windsurf IDE ทำให้ทีมต้องเขียนส่วนประกอบที่สำคัญใหม่ เช่น การตรวจสอบผ้าสำลีและไปป์ไลน์การดำเนินการตามคำสั่ง เพื่อลดค่าใช้จ่ายของระบบสูงสุดสองวินาทีต่อขั้นตอน

แม้ว่าการกล่าวอ้างความเร็วของ Cognition จะชัดเจน บริษัทยังได้จัดเตรียมข้อมูลจากเกณฑ์มาตรฐาน SWE-Bench Pro เพื่อ ยืนยันประสิทธิภาพ

บนเกณฑ์มาตรฐานซึ่งประกอบด้วยงานเขียนโค้ดเอเจนต์ที่ยากลำบาก 731 งานในที่เก็บโค้ดที่หลากหลาย 41 แห่ง SWE-1.5 แสดงให้เห็นถึงข้อดีข้อเสียที่มุ่งพิชิต

แม้ว่า Sonnet 4.5 ของ Anthropic จะได้รับคะแนนสูงสุดที่ 43.60% แต่ก็ทำได้ด้วยความเร็วเพียง 69 โทเค็น/วินาที ในทางตรงกันข้าม SWE-1.5 ให้คะแนนการแข่งขันสูงที่ 40.08% ซึ่งบรรลุถึงประสิทธิภาพที่ใกล้ระดับแนวหน้า แต่ด้วยความเร็วสูงถึง 950 โทเค็น/วินาที ทำให้เร็วขึ้นเกือบ 14 เท่า

สิ่งนี้ทำให้โมเดลนี้เป็นเครื่องมืออันทรงพลังสำหรับนักพัฒนาที่ต้องการผลลัพธ์คุณภาพสูง โดยไม่เกิดความล่าช้าในเวิร์กโฟลว์ที่รบกวนการทำงานของโมเดลระดับบนสุดอื่นๆ

ผลลัพธ์การวัดประสิทธิภาพแสดงให้เห็นว่า SWE-1.5 มีประสิทธิภาพเหนือกว่า รุ่นที่โดดเด่นอื่น ๆ อีกหลายรุ่นทั้งในด้านความแม่นยำและความเร็ว โดยแซงหน้า Haiku 4.5 ของ Anthropic (คะแนน 39.45% ที่ 142 tok/s) และเวอร์ชันระดับสูงของ GPT-5 (คะแนน 36.30% ที่ 43 tok/s)

โมเดลใหม่ยังแสดงถึงการก้าวกระโดดครั้งใหญ่ของ Cognition โดยทำคะแนนได้มากกว่าสองเท่าของรุ่นก่อนอย่าง SWE-1 ซึ่งจัดการได้เพียง 16.55% ที่ 39 ท็อก/วินาที

ข้อมูลของเขาตอกย้ำข้อโต้แย้งหลักของ Cognition: SWE-1.5 มอบประสิทธิภาพที่สามารถแข่งขันกับตลาดได้ดีที่สุด ในขณะเดียวกันก็สร้างมาตรฐานใหม่ทั้งหมดในด้านความเร็ว

การสนับสนุนโมเดลใหม่นี้เป็นการลงทุนจำนวนมหาศาลในโครงสร้างพื้นฐานที่ล้ำสมัย การรับรู้เผยให้เห็นว่า SWE-1.5 ได้รับการฝึกอบรมบน”คลัสเตอร์ชิป GB200 NVL72 ที่ล้ำสมัยหลายพันตัว”และอ้างว่าอาจเป็น”โมเดลการผลิตสาธารณะรุ่นแรกที่ได้รับการฝึกอบรมเกี่ยวกับ GB200 เจเนอเรชั่นใหม่”

การเข้าถึงฮาร์ดแวร์ในช่วงต้นเดือนมิถุนายน เมื่อเฟิร์มแวร์ยังยังไม่สมบูรณ์ ทีมงานจึงต้องสร้างระบบการตรวจสอบสุขภาพที่แข็งแกร่งและการฝึกอบรมที่ทนทานต่อข้อผิดพลาดตั้งแต่ต้นเดือนมิถุนายน

สิ่งนี้ ฮาร์ดแวร์อันทรงพลังเป็นสิ่งจำเป็นสำหรับเทคนิคการเรียนรู้การเสริมแรงแบบเข้มข้น (RL) ที่ใช้ในการปรับแต่งโมเดลโดยเฉพาะสำหรับงานที่ซับซ้อนและหลายขั้นตอนที่เกี่ยวข้องกับวิศวกรรมซอฟต์แวร์สมัยใหม่

ผลกระทบของการเสริมกำลัง

การเปิดตัว SWE-1.5 มาพร้อมกับสภาพแวดล้อมการเข้ารหัส AI Cursor เปิดตัว Composer โมเดลความเร็วสูงที่เป็นกรรมสิทธิ์ของตัวเอง

ความคล้ายคลึงระหว่างการประกาศทั้งสองนั้นเป็นไปไม่ได้ที่จะเพิกเฉยและ ชี้ให้เห็นถึงการบรรจบกันเชิงกลยุทธ์ที่ชัดเจนในตลาดเครื่องมือสำหรับนักพัฒนา AI

ทั้งสองบริษัทเปิดรับการเรียนรู้แบบเสริมกำลังในวงกว้าง Cognition ใช้ไฮเปอร์ไวเซอร์ VM ที่เรียกว่า otterlink เพื่อเรียกใช้การเปิดตัว RL ในสภาพแวดล้อมที่มีความเที่ยงตรงสูงและพร้อมกันนับหมื่นซึ่งรวมถึงการเรียกใช้โค้ดและการท่องเว็บ

วิธีนี้มีความคล้ายคลึงอย่างมากกับคำอธิบายของ Cursor เกี่ยวกับการรัน “สภาพแวดล้อมการเขียนโค้ดแบบแซนด์บ็อกซ์ที่เกิดขึ้นพร้อมกันนับแสนรายการ” สำหรับการฝึกอบรม RL ของตัวเอง

แนวทางที่ใช้ร่วมกันนี้เน้นย้ำถึงความเชื่อที่เพิ่มมากขึ้นว่าในการสร้างตัวแทนการเขียนโค้ดที่มีประสิทธิภาพอย่างแท้จริง บริษัทจะต้อง ปรับแต่งโมเดลโดยเทียบกับเครื่องมือที่พวกเขากำหนดเองและสถานการณ์ในโลกแห่งความเป็นจริง

นักวิจัย Cursor ML วางกรอบกลยุทธ์นี้ โดยระบุว่า”นี่คือข้อมูลอัจฉริยะจำนวนเล็กน้อยซึ่งจำเป็นต่อการผลิต และหากคุณสามารถจับคู่สิ่งนั้นกับความเร็วได้ก็จะยอดเยี่ยมมาก”

อีกประการที่คล้ายคลึงกันคือการขาดความโปร่งใส ทั้ง Cognition และ Cursor ต่างเป็นความลับเกี่ยวกับรากฐานของโมเดลใหม่ โดยอ้างอิงถึง”โมเดลพื้นฐานโอเพ่นซอร์สชั้นนำ”เท่านั้น

ความลับนี้ทำให้การประเมินโดยอิสระทำได้ยาก และต้องอาศัยผู้ใช้ที่ไว้วางใจเกณฑ์มาตรฐานภายในของบริษัท อย่างไรก็ตาม การแสดงผลในช่วงแรกๆ ถือเป็นเรื่องเชิงบวก ผู้เชี่ยวชาญด้าน AI และบล็อกเกอร์ Simon Willison ตั้งข้อสังเกตหลังการทดสอบโมเดลใหม่ว่า”โมเดลนี้ให้ความรู้สึกรวดเร็วมาก การร่วมมือกับ Cerebras เพื่อการอนุมานเป็นการดำเนินการที่ชาญฉลาดมาก”

จาก Ashes ของ Windsurf กลยุทธ์ใหม่

การใช้ประโยชน์จากสินทรัพย์จากโปรไฟล์ระดับสูง การเข้าซื้อกิจการ Windsurf นั้น Cognition กำลังต่อยอดจากแบรนด์และผลิตภัณฑ์ที่มีชื่อเสียง

โมเดลใหม่นี้เป็นวิวัฒนาการของกลุ่ม SWE (วิศวกรรมซอฟต์แวร์) ซึ่งเป็นโครงการที่ริเริ่มโดยทีม Windsurf เดิมในเดือนพฤษภาคม 2025 ก่อนที่ OpenAI การเข้าซื้อกิจการที่วางแผนไว้จะพังทลายลง และ Cognition ได้ก้าวเข้ามาเป็นผู้ช่วยเหลือ

ด้วยการบูรณาการ SWE-1.5 เข้ากับ Windsurf IDE โดยตรง Cognition กำลังดำเนินการ วิสัยทัศน์ของการร่วมออกแบบโมเดล การควบคุมตัวแทน และประสบการณ์ผู้ใช้ให้เป็นระบบเดียวที่เป็นหนึ่งเดียว บริษัทให้เหตุผลว่าแนวทางแบบองค์รวมนี้มีความสำคัญต่อประสิทธิภาพ

ในการประกาศ Cognition อธิบายว่า”การเลือกเอเจนต์การเขียนโค้ดไม่ได้เกี่ยวกับตัวโมเดลเท่านั้น การจัดการโดยรอบยังส่งผลกระทบอย่างมากต่อวิธีการทำงานของโมเดล”

กลยุทธ์นี้ช่วยให้บริษัทสามารถวนซ้ำได้อย่างรวดเร็ว โดยใช้ความคิดเห็นจากสภาพแวดล้อม Windsurf เพื่อปรับเครื่องมือและการแจ้งเตือน จากนั้นจึงฝึกโมเดลใหม่บนระบบที่อัปเดต

เป็นการเดิมพันว่าประสบการณ์ความเร็วสูงที่บูรณาการอย่างแน่นหนาสามารถสร้างฐานผู้ใช้ที่ภักดีได้ แม้ว่าจะไม่มีรุ่นที่ใหญ่ที่สุดในตลาดก็ตาม ในขณะที่การต่อสู้แย่งชิงเดสก์ท็อปของนักพัฒนาทวีความรุนแรงขึ้น ความสามารถในการมอบทั้งความชาญฉลาดและความเร็วภายในเวิร์กโฟลว์ที่ราบรื่นอาจกลายเป็นตัวสร้างความแตกต่างที่สำคัญ

Categories: IT Info