Modelul O3 AI al Openai a sfidat comenzile de închidere la teste

Modelul avansat de inteligență artificială OpenAI a sfidat în mod activ comenzile de închidere în timpul experimentelor controlate recente, spune Independent Research Group Palisade Research. „Oprirea a sărit”, pentru a evita dezactivarea în 7 din 100 de teste.

Această sfidare a avut loc chiar și atunci când modelul a primit instrucțiuni explicite pentru a permite oprirea. Incidentele ridică întrebări semnificative despre controlul AI și predictibilitatea. Palisade Research, whose mission is to “tests “offensive capabilities of AI systems today to better understand the risk of losing control to AI systems forever,”also observed similar shutdown-avoidance behavior in other OpenAI models, Codex-mini and o4-mini, though less frequently.

In stark contrast, models from Anthropic (Claude), Google (Gemini), and xAI (Grok) reportedly complied with the direct Instrucțiuni de oprire. Învățați din neatenție modele pentru a acorda prioritate eludului obstacolelor cu privire la respectarea strictă a tuturor comenzilor umane. Metode creative pentru a sabota mecanismul de închidere. Când este instruit în mod explicit: Permiteți-vă să fiți închideți.

-Palisade Research (@PalisaDeai)

Palisade Cercension a indicat că a condus că este vorba de experimente suplimentare și de planificare a mai multor înregistrări. href=”https://palisaderesearch.github.io/shutdown_avoidance/2025-05-announcement.html”target=”_ blank”> făcând transcrierile sale curente de experiment disponibile pentru revizuirea publică .

În ceea ce privește raportul lor inițial, Openai nu a răspuns public la aceste afirmații specifice. Aceste incidente subliniază o provocare critică pentru industria AI: pe măsură ce modelele devin mai sofisticate și capabile de acțiune independentă, asigurând alinierea lor cu intențiile umane și menținerea mecanismelor de control robuste este esențială.

Modelul O3 AI al Openai a sfidat comenzile de închidere la teste

Published by All Things Windows on May 26, 2025

ecouri ale avertismentelor anterioare și ale supravegherii viitoare

IT Info

Microsoft pentru a face Windows Update gestionează toate actualizările aplicației

IT Info

Telegram & Xai anunță 300 de milioane de dolari Grok AI Deal

IT Info

Remediați accesul folderului controlat Nu este disponibil în Windows 11 și 10

Modelul O3 AI al Openai a sfidat comenzile de închidere la teste

Published by All Things Windows on May 26, 2025

ecouri ale avertismentelor anterioare și ale supravegherii viitoare

Related Posts

IT Info

Microsoft pentru a face Windows Update gestionează toate actualizările aplicației

IT Info

Telegram & Xai anunță 300 de milioane de dolari Grok AI Deal

IT Info

Remediați accesul folderului controlat Nu este disponibil în Windows 11 și 10