Anthropic a introduit Claude 3.7 Sonnet , une mise à jour majeure de Sa gamme d’IA qui combine une génération de réponse rapide avec des capacités de raisonnement avancées.

La version suit Claude 3.0, qui a introduit un meilleur traitement et une meilleure rétention de contexte, et Claude 3.5 Sonnet, qui a amélioré la programmation et l’analyse des documents.

La fonction de vedette du modèle est sa capacité Pour «définir des contraintes sur le temps de réponse», permettant aux développeurs d’affiner les performances de l’IA en fonction des besoins spécifiques. Parallèlement à la version, Anthropic lance Claude Code, un outil qui peut rechercher, modifier et exécuter du code, offrant une assistance de développement logicielle plus profonde alimentée par AI.

La nouvelle mise à jour de Claude entre une race AI dominée par l’Openai et les Gémeaux de Google. requêtes et résolution de problèmes complexes sans modèles de commutation.

Claude 3.7 Sonnet est disponible via Claude.ai, Amazon Bedrock, et Vertex AI de Google Cloud. La société a maintenu les prix inchangés malgré ces capacités élargies.

AI qui ajuste sa vitesse de pensée

L’un des plus grands changements dans le sonnet de Claude 3.7 est sa dynamique Système de raisonnement, qui adapte la vitesse de traitement en fonction de la complexité des tâches. La société déclare:

«Vous pouvez choisir lorsque vous voulez que le modèle réponde normalement et lorsque vous voulez qu’il pense plus longtemps avant de répondre. En mode standard, Claude 3.7 Sonnet représente une version améliorée de Claude 3.5 Sonnet. En mode de réflexion étendue, il se réflexable avant de répondre, ce qui améliore ses performances sur les mathématiques, la physique, le suivi des instructions, le codage et de nombreuses autres tâches. Nous constatons généralement que l’incitation pour le modèle fonctionne de manière similaire dans les deux modes.

Deuxième que n jetons, pour toute valeur de n jusqu’à sa limite de sortie de 128k jetons. Cela vous permet de compromettre la vitesse (et le coût) pour la qualité de réponse.

Troisième Des tâches réelles qui reflètent mieux la façon dont les entreprises utilisent réellement les LLM. Applications du monde réel, de l’automatisation en temps réel à des recherches approfondies.

[Contenu intégré]

Comment Claude 3.7 Sonnet s’accumule contre Openai, Google et Xai

L’approche d’Anthropic avec Claude 3.7 Sonnet le place en concurrence directe avec gpt-4 d’Openai, Gemini de Google, et Grok-3 de Xai. Chacun de ces modèles a des forces dans différents domaines, mais la décision d’Anthropic d’affiner le raisonnement hybride plutôt que de se concentrer sur les marques de recherche en temps réel une stratégie distincte.

Contrairement à l’approche multi-model d’OpenAI, où les systèmes d’IA séparés sont optimisés Pour les temps de réponse rapide ou le raisonnement plus profond, Claude 3.7 intègre à la fois dans un seul système. Cela élimine la nécessité pour les utilisateurs de choisir entre différentes versions du modèle en fonction de la complexité des tâches. Cependant, Openai conserve un avantage dans la récupération du Web en direct, un domaine où Claude est toujours à la traîne.

Les modèles Gemini de Google, qui mettent l’accent sur l’intégration profonde avec la recherche et les capacités multimodales, contrastent avec le raisonnement structuré de Claude. Alors que l’IA de Google bénéficie de la récupération de données à la minute, Claude 3.7 Sonnet est optimisée pour les applications d’entreprise nécessitant des temps de réponse contrôlés et un réglage spécifique à la tâche.

En attendant, Grok-3 de Xai, positionné comme un Alternative aux modèles premium d’OpenAI, priorise l’engagement en temps réel et l’intégration des médias sociaux. Bien que cela ne soit efficace pour les cas d’utilisation interactifs de l’IA, il n’a pas les optimisations orientées vers les développeurs selon lesquelles Anthropic met l’accent sur le code Claude.

Selon les propres repères d’Anthropic, Claude 3.7 Sonnet démontre un leadership clair dans les tâches liées au codage, Claude 3.7 démontre un leadership clair dans les tâches liées au codage, Claude 3.7 démontre un leadership clair dans les tâches liées au codage, Claude 3.7 démontre un leadership clair dans les tâches liées au codage du codage, Claude 3.7 démontre un leadership clairement dans les tâches liées au codage du codage , surperformant les modèles d’Openai et le R1 profondément (Tau-banc). Sa capacité à exécuter des modifications de code, à interagir avec les outils et à suivre les instructions structurées en fait un choix fort pour le développement de logiciels et l’automatisation du flux de travail.

De plus, il mène dans l’instruction suivant (Ifeval), montrant sa fiabilité pour l’exécution de la tâche alimentée par AI. Alors qu’Openai O1 reste compétitif dans les questions et réponses multilingues et R1 Deepseek dans certaines références mathématiques, les améliorations de Claude 3.7 Sonnet en font l’un des modèles les plus bien équilibrés pour le raisonnement structuré et (GQPA Diamond), Claude 3.7 Sonnet avec une réflexion étendue correspond étroitement modèles, mais sans réflexion prolongée, ses performances baissent considérablement. Il réalise également des améliorations majeures de la résolution de problèmes mathématiques (mathématiques 500), marquant de la même manière que l’Openai O1, mais est toujours à la traîne derrière Deepseek R1 et Grok 3 Beta dans les références du concours de mathématiques du secondaire (AIME 2024).

Dans le raisonnement visuel (validation MMMU), OpenAI O1 et Grok 3 Beta maintiennent un bord, ce qui suggère que Claude peut encore avoir besoin de raffinements dans les tâches basées sur la vision AI.

Source: Anthropic

Anthropic’s L’accent stratégique sur l’IA de l’entreprise et la résolution de problèmes structurés plutôt que sur la récupération Web en temps réel rend Claude 3.7 Sonnet bien adapté aux applications professionnelles. Cependant, les modèles Gemini de Google, le GPT-4 d’OpenAI et le GROK-3 de XAI continuent de pousser l’IA multimodal et l’accès aux données en direct, les zones où Claude reste limité.

Avec ses améliorations de la flexibilité du raisonnement, des outils de développeur et des capacités d’automatisation, Claude 3.7 Sonnet renforce son rôle d’alternative forte pour les utilisateurs hiérarchistes des flux de travail personnalisables et une assistance de codage sur la récupération des informations en direct.

CODE CLAUDE: Une AI qui écrit, modifie et teste le logiciel

CODE CODE MARQUES A Étonnez-vous à faire de l’IA un participant plus actif au développement de logiciels. Contrairement à GitHub Copilot, qui suggère principalement des extraits de code, Claude Code est conçu pour exécuter des workflows de programmation. Il peut lire les fichiers du projet, modifier le code existant, exécuter des tests et pousser les modifications directement en référentiels.

Anthropic décrit le code Claude comme «un collaborateur actif qui peut rechercher et lire le code, modifier les fichiers, écrire et exécuter des tests , engager et pousser le code vers GitHub, et utiliser des outils de ligne de commande,”Selon TechCrunch. L’outil a été testé en interne pour des séances de codage dure jusqu’à 45 minutes, aidant à créer un Web interactif interactif Conception et affinage des bases de code.

Le référentiel Github CODE CODE fournit une documentation d’intégration et des exemples pour les développeurs qui souhaitent explorer ses capacités.

[Contenu intégré]

Performances améliorées dans le raisonnement logique et analyse

Claude 3.7 Sonnet n’est pas seulement une mise à niveau pour les développeurs-il améliore également dans des domaines tels que l’analyse juridique, Finance et mathématiques. à travers des environnements de jeux vidéo. Les modèles de Claude précédents ont eu du mal à planifier à long terme dans des paramètres interactifs, mais cette version a réussi à s’adapter aux défis du jeu et aux stratégies de prise de décision optimisées.

De plus, le modèle présente désormais une coupure de connaissances mise à jour d’octobre 2024. Cependant, contrairement à GPT-4O d’Openai et aux Gémeaux de Google, il manque de capacités de navigation en direct, limitant sa capacité à récupérer Informations.

La feuille de route de l’IA d’Anthropic et le futur impact de l’industrie

à chaque itération, Anthropic a affiné sa capacité de l’IA à gérer les tâches de raisonnement prolongés tout en maintenant un plus de conversation Style d’interaction. Le changement de clé avec Claude 3.7 est l’intégration des contrôles de vitesse de réponse dynamique, permettant aux utilisateurs de dicter si l’IA doit prioriser la vitesse ou la profondeur. Cette mise à jour aborde directement une limitation commune dans les grands modèles d’IA-l’efficacité de l’édition avec précision.

Anthropic a positionné Claude comme un modèle d’IA adapté aux cas d’utilisation complexe de l’entreprise plutôt qu’à des interactions d’IA décontractées par le marché du marché. Sa disponibilité via Amazon Bedrock et Google Vertex AI suggère une poussée à long terme vers l’intégration d’IA basée sur le cloud.

En avance, la concentration d’Anthropic sur le raisonnement hybride et les applications d’entreprise pourraient préparer le terrain pour plus de raffinements dans la façon dont l’IA Les modèles gèrent les processus automatisés à grande échelle. Si les capacités de récupération et multimodale en temps réel deviennent des ajouts nécessaires, la prochaine version de Claude peut incorporer des fonctionnalités qui comblent l’écart entre ses concurrents.

Pour l’instant, Claude 3.7 Sonnet reste un modèle d’IA construit pour un raisonnement structuré et la précision, la taille d’une niche où le contrôle sur le temps de traitement est tout aussi important que la précision de la réponse.

Categories: IT Info