antropico ha introdotto claude 3.7 sonetto , un importante aggiornamento a La sua gamma di intelligenza artificiale che combina una generazione di risposta rapida con capacità di ragionamento avanzate.

Il rilascio segue Claude 3.0, che ha introdotto una migliore elaborazione e una conservazione del contesto a lungo termine, e Claude 3.5 Sonnet, che ha migliorato la programmazione e l’analisi dei documenti.

La funzione di spicco del modello è la sua abilità per”impostare vincoli sul tempo di risposta”, consentendo agli sviluppatori di perfezionare le prestazioni dell’IA in base a esigenze specifiche. Accanto al rilascio, Antropic sta lanciando Claude Code, uno strumento che può cercare, Modifica ed esegui il codice, offrendo assistenza per lo sviluppo del software AI più profondo.

Il nuovo aggiornamento di Claude entra in una gara di intelligenza artificiale dominata da Openai e Google’s Gemini. Query e complesse risoluzione dei problemi senza modelli di commutazione.

Claude 3.7 Sonnet è disponibile tramite Claude.ai, Amazon Bedrock e Google Vertex AI di Cloud. La società ha mantenuto invariati i prezzi nonostante queste capacità ampliate.

AI che regola la sua velocità di pensiero

Uno dei maggiori cambiamenti nel sonetto Claude 3.7 è la sua dinamica Sistema di ragionamento, che adatta la velocità di elaborazione in base alla complessità delle attività. L’azienda afferma:

“Puoi scegliere quando si desidera che il modello risponda normalmente e quando vuoi che pensi più a lungo prima di rispondere. Nella modalità standard, Claude 3.7 Sonnet rappresenta una versione aggiornata del sonetto Claude 3.5. In modalità di pensiero esteso, si auto-riflette prima di rispondere, il che migliora le sue prestazioni su matematica, fisica, following delle istruzioni, codifica e molte altre attività. Generalmente scopriamo che spingere il modello funziona in modo simile in entrambe le modalità.

Secondo, quando si utilizza il sonetto Claude 3.7 tramite l’API, gli utenti possono anche controllare il budget per pensare: puoi dire a Claude di non pensare per non di n token, per qualsiasi valore di n fino al limite di output di 128k token. Ciò ti consente di scambiare velocità (e costo) per la qualità della risposta.

terzo, nello sviluppo dei nostri modelli di ragionamento, abbiamo ottimizzato un po’meno per i problemi di concorrenza matematica e informatica e abbiamo invece spostato l’attenzione Compiti nel mondo reale che riflettono meglio il modo in cui le aziende usano effettivamente LLMS.”

A differenza dei modelli passati che hanno ottimizzato per risposte rapide o analisi profonde, questa versione offre flessibilità e rende Claude 3.7 Sonnet più adattabile per Applicazioni del mondo reale, dall’automazione in tempo reale alla ricerca approfondita.

[Contenuto incorporato]

Come Claude 3.7 Sonnet si accumula contro Openi, Google e Xai

L’approccio antropico con il sonetto Claude 3.7 lo mette in diretta concorrenza con GPT-4 di Openai , Google’s Gemini e Xai’s Grok-3 . Ognuno di questi modelli ha punti di forza in diverse aree, ma la decisione di Antropico di perfezionare il ragionamento ibrido piuttosto che concentrarsi su una ricerca in tempo reale segna una strategia distinta.

A differenza dell’approccio multi-modello di Openi, in cui sono ottimizzati sistemi AI separati Per tempi di risposta rapidi o ragionamento più profondo, Claude 3.7 si integra sia in un unico sistema. Ciò elimina la necessità per gli utenti di scegliere tra diverse versioni del modello a seconda della complessità delle attività. Tuttavia, Openai mantiene un vantaggio nel recupero del web dal vivo, un’area in cui Claude è ancora indietro rispetto ai modelli Gemini di Google, che enfatizzano la profonda integrazione con la ricerca e le capacità mult-modale, in contrasto con il ragionamento strutturato di Claude. Mentre l’intelligenza artificiale di Google beneficia del recupero dei dati aggiornati al minuto, Claude 3.7 Sonnet è ottimizzato per le applicazioni aziendali che richiedono tempi di risposta controllati e messa a punto specifici delle attività. Alternativa ai modelli premium di Openi, dà la priorità al coinvolgimento in tempo reale e all’integrazione dei social media. Sebbene ciò sia efficace per i casi di utilizzo dell’intelligenza artificiale interattivi, manca delle ottimizzazioni orientate agli sviluppatori che Antropico sta enfatizzando il codice Claude.

Secondo i benchmark di Antropic, Claude 3.7 Sonnet dimostra una chiara leadership di codifica , sovraperformando i modelli di Openi e Deep-Week R1 nella codifica agente (SWE-Bench Verified) e nell’uso degli strumenti agenti (Tau-Bench). La sua capacità di eseguire modifiche al codice, interagire con strumenti e seguire le istruzioni strutturate lo rende una scelta forte per lo sviluppo del software e l’automazione del flusso di lavoro.

Inoltre, conduce nelle istruzioni seguenti (Ifeval), mostrando la sua affidabilità per l’esecuzione dell’attività alimentare. Mentre Openai O1 rimane competitivo in domande e risposte multilingue e DeepSeek R1 in alcuni benchmark matematici, i miglioramenti di Claude 3.7 Sonnet lo rendono uno dei modelli più a tutto tondo per il ragionamento strutturato e l’automazione delle attività.

(GQPA Diamond), sonetto Claude 3.7 con pensiero esteso corrisponde da vicino Grok 3 Beta e Openai di alto livello Modelli, ma senza un pensiero esteso, le sue prestazioni diminuiscono in modo significativo. Raggiunge anche importanti miglioramenti nella risoluzione dei problemi di matematica (Math 500), segnando in modo simile ad Openi O1, ma è ancora in ritardo rispetto a Deepseek R1 e Grok 3 Beta nei benchmark della concorrenza di matematica delle scuole superiori (AIME 2024).

Nel ragionamento visivo (validazione MMMU), Openai O1 e Grok 3 Beta mantengono un vantaggio, suggerendo che Claude potrebbe ancora aver bisogno di perfezionamenti in compiti basati su Visual AI.

Fonte: antropico

antropico L’attenzione strategica sull’intelligenza artificiale aziendale e sulla risoluzione dei problemi strutturate piuttosto che sul recupero web in tempo reale rende Claude 3.7 Sonnet adatto per applicazioni professionali. Tuttavia, i modelli Gemini di Google, GPT-4 di Openi e GROK-3 di XAI continuano a spingere l’intelligenza artificiale multi-modale e l’accesso ai dati in diretta, le aree in cui Claude rimane limitato.

Con i suoi miglioramenti nella flessibilità del ragionamento, negli strumenti per gli sviluppatori e nelle capacità di automazione, Claude 3.7 Sonnet rafforza il suo ruolo di una forte alternativa per gli utenti che danno la priorità ai flussi di lavoro AI personalizzabili e all’assistenza alla codifica sul recupero di informazioni in diretta. H3> Codice Claude: un’intelligenza artificiale che scrive, modifica e verifica il software

Claude Code Segna un passo verso l’IA un partecipante più attivo allo sviluppo del software. A differenza di Github Copilot, che suggerisce principalmente frammenti di codice, Claude Code è progettato per eseguire flussi di lavoro di programmazione. Può leggere i file di progetto, modificare il codice esistente, eseguire test e spingere le modifiche direttamente in repository.

antropico descrive il codice Claude come”un collaboratore attivo che può cercare e leggere il codice, modificare i file, scrivere ed eseguire test , commessa e spinge il codice a github e usa strumenti di riga di comando,”Secondo TechCrunch. Lo strumento è stato testato internamente per sessioni di codifica che durano fino a 45 minuti, aiutando a costruire interattive Web design e basi di codice di raffinazione.

Il repository Claude Code GitHub fornisce documentazione di integrazione ed esempi per gli sviluppatori che vogliono esplorare le sue capacità. Il ragionamento e l’analisi

sonetto Claude 3.7 non sono solo un aggiornamento per gli sviluppatori: migliora anche in settori come l’analisi legale, Finanza e matematica. Attraverso ambienti di videogiochi. Precedenti modelli di Claude hanno lottato con la pianificazione a lungo termine in contesti interattivi, ma questa versione si è adattata con successo alle sfide in-game e alle strategie di processo decisionale ottimizzate.. Tuttavia, a differenza di Openai GPT-4o e Google GEMINI, manca di funzionalità di navigazione web dal vivo, limitando la sua capacità di recuperare il minuto Informazioni.

Laadmap AI di Antropic e Future Industry Impact

Con ogni iterazione, Antropic ha perfezionato la capacità della sua AI di gestire compiti di ragionamento estesi pur mantenendo una conversazione più conversazionale stile di interazione. Lo spostamento della chiave con Claude 3.7 è l’integrazione dei controlli di velocità di risposta dinamica, che consente agli utenti di dettare se l’IA dovrebbe dare la priorità alla velocità o alla profondità. Questo aggiornamento affronta direttamente una limitazione comune nei grandi modelli di intelligenza artificiale: l’efficienza di bilanciamento con accuratezza.

Antropico ha posizionato Claude come modello di intelligenza artificiale adatto a casi d’uso aziendale complessi piuttosto che interazioni AI casuali di massa. La sua disponibilità tramite Amazon Bedrock e Google Vertex AI suggerisce una spinta a lungo termine verso l’integrazione dell’IA basata su cloud.

Guardando al futuro, l’attenzione di Antropic sul ragionamento ibrido e sulle applicazioni aziendali potrebbe preparare le basi per ulteriori perfezionamenti su come AI I modelli gestiscono processi automatizzati su larga scala. Se le capacità di recupero in tempo reale e multi-modale diventano necessarie aggiunte, la prossima versione di Claude può incorporare caratteristiche che colmano il divario tra i suoi concorrenti.

Per ora, Claude 3.7 Sonnet rimane un modello AI costruito per il ragionamento strutturato e precisione, ritagliarsi una nicchia in cui il controllo sul tempo di elaborazione è importante quanto l’accuratezza della risposta.

Categories: IT Info