Openai เมื่อวันอังคารที่เปิดตัว GPT-OSS-120B และ GPT-OSS-20B ซึ่งเป็นรุ่นเปิดตัวครั้งแรกตั้งแต่ปี 2562 การเคลื่อนไหวครั้งนี้นับเป็นการเปลี่ยนแปลงเชิงกลยุทธ์ที่สำคัญสำหรับ AI Lab ซึ่งเผชิญกับการวิพากษ์วิจารณ์ระบบปิด รุ่นใหม่นี้มีอยู่ภายใต้ใบอนุญาต Apache 2.0 ที่อนุญาต

ซึ่งช่วยให้นักพัฒนาสามารถดาวน์โหลดวิ่งและแก้ไขได้อย่างอิสระในฮาร์ดแวร์ท้องถิ่น การเปิดตัวมีวัตถุประสงค์เพื่อตอบโต้ความนิยมที่เพิ่มขึ้นของโมเดลเปิดจากคู่แข่งเช่น meta ด้วยการมีส่วนร่วมกับชุมชนโอเพนซอร์ซอีกครั้ง Openai หวังที่จะกำหนดมาตรฐานความปลอดภัยใหม่

การกลับมาที่รอคอยมานานมาสู่รากที่มีน้ำหนักเปิด

การเปิดตัวสิ้นสุดระยะเวลานานและเป็นที่ถกเถียงกัน จุดหมุนเชิงกลยุทธ์นี้นับเป็นการเปิดตัวรูปแบบภาษาแบบเปิดน้ำหนักครั้งแรกนับตั้งแต่ GPT-2 ในปี 2562 โดยกล่าวถึงข้อเสนอแนะและความยุ่งยากของชุมชนโดยตรง

>>

การกลับมาสู่หลักการเปิดกว้างนี้ถูกล้อเล่นเป็นครั้งแรกโดยซีอีโอแซมอัลท์แมนในเดือนเมษายน การประกาศดังต่อไปนี้มีความล่าช้าสองครั้งในเดือนมิถุนายนและกรกฎาคมทำให้วันนี้เปิดตัวการปฏิบัติตามสัญญาที่รอคอยมานานสำหรับนักพัฒนาและนักวิจัยที่ให้ความสำคัญกับความโปร่งใสและการปรับแต่งได้

การเปิดตัวยังทำให้หลายสัปดาห์ ตอนนี้โมเดลที่มีประสิทธิภาพสูงที่ไม่ได้รับการสนับสนุนนั้นเป็นที่เข้าใจกันว่าเป็นตัวอย่างการซ่อนตัวสำหรับการเปิดตัว GPT-OSS อย่างเป็นทางการ

เราเปิดตัวโมเดลการใช้เหตุผลแบบเปิดสองแบบ-GPT-OSS-120B และ GPT-OSS-20B href=”https://t.co/pdkhqdqcpf”target=”_blank”> https://t.co/pdkhqdqcpf

-openai (@openai) 5 สิงหาคม 2025 มันกล่าวถึงช่องว่างที่สำคัญในพอร์ตโฟลิโอของ Openai ดังที่ Casey Dvorak ผู้จัดการโครงการวิจัยของ OpenAI เขา

สิ่งนี้ช่วยให้ บริษัท สามารถแข่งขันสำหรับนักพัฒนาที่ต้องการหรือต้องการโมเดลที่ดำเนินการในพื้นที่เพื่อความปลอดภัยของข้อมูลค่าใช้จ่ายที่ลดลงหรือการปรับแต่งในงานพิเศษ นอกเหนือจากการเติมช่องว่างของผลิตภัณฑ์แล้วการเคลื่อนไหวก็เกี่ยวกับอิทธิพลของการเรียกคืน Peter Henderson ผู้ช่วยศาสตราจารย์ที่ Princeton University,

ความสำคัญเชิงกลยุทธ์มีความคิดริเริ่มในฐานะเมตาซึ่งเป็นผู้นำมายาวนานในการเปิดแหล่งโอเพ่นซอร์สของอเมริกา เดือยของ Openai วางตำแหน่งให้เป็นแชมป์ใหม่สำหรับชุมชนโอเพนซอร์ซจับนักพัฒนาและนักวิจัยที่มองหาทางเลือกที่ทรงพลังและได้รับอนุญาตอย่างอนุญาต

ภายใต้ประทุน: ประสิทธิภาพและการเข้าถึง

การเปิดตัวใหม่ ทั้งสองถูกสร้างขึ้นบนสถาปัตยกรรมผสมผสาน (MOE) ซึ่งเป็นตัวเลือกการออกแบบที่สำคัญสำหรับการเพิ่มประสิทธิภาพสูงสุดในขณะที่ลดต้นทุนการคำนวณ

สถาปัตยกรรมขั้นสูงนี้ทำให้โมเดลสามารถเข้าถึงได้สูง GPT-OSS-20B ขนาดเล็กสามารถทำงานบนอุปกรณ์ผู้บริโภคด้วย RAM เพียง 16GB ในขณะที่รุ่น 120B ที่มีขนาดใหญ่กว่านั้นต้องการเพียง 80GB GPU เดียวซึ่งเป็นฮาร์ดแวร์ทั่วไปในเวิร์กสเตชันมืออาชีพ ทั้งสองรุ่นพร้อมให้ดาวน์โหลดบน กอดใบหน้า .

ในการแสดง จากข้อมูลของการ์ดอย่างเป็นทางการ GPT-OSS-120B ประสบความสำเร็จใกล้เคียงกับ O4-MINI ที่เป็นกรรมสิทธิ์ของ OpenAI ในการกำหนดมาตรฐานการใช้เหตุผลหลัก GPT-OSS-20B ที่เล็กกว่าแสดงความสามารถในการแข่งขันที่คล้ายกันกับโมเดล O3-MINI

วิธีการที่ GPT-OSS กับคู่แข่ง

ในขณะที่ OpenAI นั้นเป็นอย่างไร ข้อมูล

อย่างไรก็ตาม OpenAI เพิ่มบริบทที่สำคัญให้กับผลลัพธ์เหล่านี้ ในขณะที่โมเดลที่ปรับแต่งได้อย่างละเอียดมักจะนำไปสู่แพ็คกระดาษสรุปว่าในการประเมินส่วนใหญ่“ มีการให้คะแนนแบบเปิดอีกอันหนึ่งที่หรือใกล้กับ GPT-OSS” สิ่งนี้ชี้ให้เห็นว่าในขณะที่ GPT-OSS ก้าวหน้าไปตามชายแดน แต่ก็ไม่ได้สร้างความสามารถในการก้าวกระโดดที่น่าทึ่งและไม่เคยมีมาก่อนในระบบนิเวศโอเพนซอร์ซที่มีอยู่

สำหรับนักพัฒนา พวกเขาเข้ากันได้อย่างเต็มที่กับ API การตอบสนองของ OpenAI ซึ่งได้รับการปรับปรุงในเดือนพฤษภาคมด้วยการสนับสนุนเครื่องมือเพิ่มเติม การรวมนี้ช่วยให้เวิร์กโฟลว์ตัวแทนที่ซับซ้อนด้วยความสามารถในการติดตามคำสั่งที่แข็งแกร่งและการใช้เครื่องมือ

คุณสมบัติที่สำคัญรวมถึงการเข้าถึงอย่างเต็มรูปแบบไปยังห่วงโซ่ความคิด (COT) ของโมเดลสำหรับการใช้เหตุผลที่โปร่งใสสนับสนุนการส่งออกที่มีโครงสร้างและความสามารถในการปรับความพยายามในการใช้เหตุผลระหว่างการตั้งค่าต่ำกลางและสูงผ่านระบบพร้อมพรอมต์อย่างง่าย ความยืดหยุ่นนี้ช่วยให้นักพัฒนาสามารถปรับสมดุลประสิทธิภาพค่าใช้จ่ายและเวลาแฝงสำหรับแอปพลิเคชันเฉพาะของพวกเขา

ประสิทธิภาพนี้รวมกับชุดการเข้าถึงและชุดคุณลักษณะที่ลึกทำให้รุ่น GPT-OSS เป็นตัวเลือกใหม่ที่ทรงพลังสำหรับนักพัฒนาที่ต้องการสร้างตัวแทนที่ซับซ้อน รากฐานที่สำคัญของการเปิดตัวครั้งนี้คือการวิจัยด้านความปลอดภัยที่กว้างขวางของ Openai บริษัท ศึกษาสถานการณ์ที่เลวร้ายที่สุดในเชิงรุกผ่านกระบวนการที่เรียกว่า”การปรับจูนที่เป็นอันตราย”(MFT) นักวิจัยพยายามทำให้แบบจำลองเป็นอันตรายโดยเจตนากระบวนการที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญภายนอก

พวกเขาได้รับการปรับแต่ง GPT-OSS-120B เพื่อเพิ่มความสามารถสูงสุดในชีววิทยาและความปลอดภัยทางไซเบอร์ เป้าหมายคือเพื่อดูว่าผู้โจมตีสามารถสร้างเครื่องมือที่อันตรายได้หรือไม่ การค้นพบ

โมเดลนั้นเป็น เข้าถึงได้ทันทีสำหรับนักพัฒนาทั่วโลก .

Categories: IT Info