Le modèle O3 AI d'OpenAI aurait défié les ordres d'arrêt dans les tests

Le modèle avancé de l’intelligence artificielle avancée d’Openai a défié activement les ordres d’arrêt lors des récentes expériences contrôlées, explique le groupe de recherche indépendante

Ce défi s’est produit même lorsque le modèle a reçu des instructions explicites pour permettre l’arrêt. Les incidents soulèvent des questions importantes sur le contrôle et la prévisibilité de l’IA. Palisade Research, dont la mission est de «tester» les capacités offensives des systèmes d’IA aujourd’hui pour mieux comprendre le risque de perdre le contrôle aux systèmes d’IA pour toujours,, a également observé un comportement d’arrêt similaire dans d’autres modèles OpenAI, Codex-MinI et O4-MinI, bien que moins fréquemment. L’instruction de fermeture directe. Enseigner par inadvertance des modèles pour hiérarchiser les obstacles à la contournement de l’adhésion stricte à toutes les commandes humaines. Les méthodes créatives pour saboter le mécanisme d’arrêt. Explicitement instruit: permettez-vous d’être arrêté.

-Palisade Research (@palisadeai)

En ce qui concerne leur rapport initial, Openai n’avait pas répondu publiquement à ces affirmations spécifiques. Ces incidents soulignent un défi essentiel pour l’industrie de l’IA: à mesure que les modèles deviennent plus sophistiqués et capables d’une action indépendante, garantissant leur alignement sur les intentions humaines et le maintien de mécanismes de contrôle robuste est primordial.

De tels tests sont souvent effectués en utilisant des API, qui peuvent avoir moins de restrictions de sécurité que les applications infergées des consommateurs.

Le modèle O3 AI d’OpenAI aurait défié les ordres d’arrêt dans les tests

Published by All Things Windows on May 26, 2025

Échos des avertissements passés et de la surveillance future

IT Info

Microsoft pour faire de la mise à jour Windows Gire toutes les mises à jour d’applications

IT Info

Telegram & Xai annonce 300 millions de dollars de transactions Grok AI

IT Info

Correction de l’accès au dossier contrôlé non disponible dans Windows 11 et 10

Le modèle O3 AI d’OpenAI aurait défié les ordres d’arrêt dans les tests

Published by All Things Windows on May 26, 2025

Échos des avertissements passés et de la surveillance future

Related Posts

IT Info

Microsoft pour faire de la mise à jour Windows Gire toutes les mises à jour d’applications

IT Info

Telegram & Xai annonce 300 millions de dollars de transactions Grok AI

IT Info

Correction de l’accès au dossier contrôlé non disponible dans Windows 11 et 10