Openai a publié aujourd’hui Harmony, un format de réponse nouveau et obligatoire pour ses nouveaux modèles de poids ouvert GPT-ASS, changeant fondamentalement la façon dont les développeurs interagissent avec eux. Le nouveau format fournit un modèle de chat structuré qui sépare le raisonnement interne du modèle, l’utilisation des outils et les réponses finales orientées utilisateur en canaux distincts.
Cela donne aux développeurs un contrôle granulaire et rend les agents d’IA complexes plus transparents et fiables. Pour rationaliser l’adoption, OpenAI a également lancé une bibliothèque officielle “ Openai-Harmony”pour Python et Rust, qui est désormais disponible sur Github et est requise pour que les modèles GPT-OSS fonctionnent correctement.
La version est intrinsèquement liée au lancement des modèles GPT-OSS, Openai a relevé la communauté ouverte depuis 2019. Standard dans un marché de plus en plus peuplé d’alternatives puissantes.
quelle est l’Openai Harmony et pourquoi est-ce nécessaire?
href=”https://cookbook.openai.com/articles/openai-harmony”cible=”_ blanc”> harmonie est un modèle de chat , un ensemble spécifique de règles et de jetons spéciaux qui structurent la conversation entre un utilisateur et le modèle. OpenAI déclare que ses modèles GPT-ASS ont été formés spécifiquement sur ce format et ne fonctionneront pas correctement sans lui. Cela fait de l’harmonie un élément fondamental de sa nouvelle stratégie de poids ouvert.
La communauté open source a longtemps aux prises avec un paysage fragmenté de modèles de chat. Différents modèles nécessitent un formatage différent, créant des frictions pour les développeurs. En obligeant l’harmonie, OpenAI applique une seule norme unifiée pour son écosystème, garantissant un comportement prévisible et simplifiant l’intégration pour tous ceux qui s’appuient sur GPT-ASS.
Le format est conçu pour amener les capacités de réponse structurées et multiples des API propriétaires d’Openai au monde ouvert. Il permet au modèle de produire des flux distincts pour le raisonnement en chaîne de pensées, les préambulations appelant à des outils et la réponse finale, fournissant une séparation plus propre des préoccupations pour les développeurs de constructions de travail de travail. Le plus important est l’utilisation de trois canaux de sortie distincts: «Analyse» pour le raisonnement, «commentaire» pour les appels à outils et «final» pour la réponse orientée utilisateur. Cela permet aux développeurs de
Le format élargit également sur le «système de développement» traditionnel. Ce nouveau rôle peut augmenter ou même remplacer l’invite du système principal, offrant une nouvelle couche de contrôle puissante pour les hiérarchies d’instructions complexes. Le rôle de «développeur» permet des instructions en couches qui peuvent modifier le comportement du modèle pour une tâche spécifique sans modifier le personnage de base «système», ce qui est crucial pour les agents adaptables.
De plus, les développeurs peuvent désormais gérer explicitement l’effort informatique du modèle. Un paramètre `Response_effort` dans le message système peut être défini sur` `Low”,« Medium »ou« High ». Cela permet un compromis direct entre la qualité de la réponse, la latence et le coût, permettant un réglage fin pour différentes applications, des chatbots rapides aux tâches analytiques profondes.
Les outils du développeur: la bibliothèque “ Openai-Harmony`’pour Rust et Python
pour s’assurer que les développeurs peuvent facilement et correctement mis en œuvre ce format, Openai a publié la bibliothèque “ Openai. La société souligne que la bibliothèque est «rapide et rapide» car sa logique de base pour le rendu et l’analyse est construite en rouille, un langage connu pour ses performances et sa sécurité de la mémoire.
Ce noyau haute performance est exposé à Python grâce à des liaisons pyo3 minces, fournissant un support de première classe pour l’une des limites les plus courantes dans le développement de l’AI. Le package est disponible sur PYPI et peut être installé avec une simple commande `Pip Install`, ce qui le rend hautement accessible à l’ensemble de la communauté des développeurs.
La décision de fournir une bibliothèque officielle est aussi importante que le format lui-même. Il empêche la dérive de la mise en œuvre et la fragmentation communautaire. En offrant un outil canonique, OpenAI garantit que chaque développeur parle exactement le même «langage» au modèle, un facteur critique pour un format obligatoire et standardisé.
Une nouvelle norme pour l’écosystème ouvert
La décision de rendre la harmonie obligatoire est stratégique. Il positionne OpenAI pour définir une nouvelle norme pour la façon dont les modèles avancés et ouverts doivent être structurés et contrôlés. Cette décision se compare plus que des spécifications techniques; Comme certains analystes le notent, «… en partie, il s’agit de réaffirmer la domination d’Openai dans l’écosystème de recherche.»
L’initiative peut être considérée comme la réalisation open source des concepts lancés dans l’API des réponses d’Openai. En externalisant le cadre de raisonnement structuré et d’utilisation d’outils dans un format public, OpenAI permet aux développeurs de construire des agents sophistiqués et gérés localement qui reflètent les capacités de ses systèmes fermés et propriétaires.
En publiant des modèles puissants avec un licence permissive et un format convivial robuste et respectueux des développeurs. La société a explicitement encadré la libération en termes géopolitiques, déclarant que «… un large accès à ces modèles de poids ouverts capables créés aux États-Unis aide à étendre les rails d’IA démocratiques».
Ce sentiment est repris par les observateurs de l’industrie. Nathan Lambert, de l’Institut Allen pour l’IA, a déclaré que cette décision est un développement positif pour la communauté ouverte, déclarant: «C’est une très bonne chose pour la communauté ouverte». Ce nouveau format, couplé aux modèles GPT-OSS, fournit une boîte à outils puissante pour les développeurs créant la prochaine génération d’applications d’IA.