ANTROPIC wprowadził Claude 3.7 sonnet , główna aktualizacja, w której można by Skład AI, który łączy generowanie szybkiego reakcji z zaawansowanymi możliwościami rozumowania.
Wydanie następuje następuje Claude 3.0, która wprowadziła lepszą długą formę przetwarzania i retencję kontekstu, oraz Claude 3.5 Sonnet, które wzmocniły programowanie i analizę dokumentów.
Serdeczna funkcja modelu jest jego zdolność Aby „ustawić ograniczenia dotyczące czasu odpowiedzi”, umożliwiając programistom dostosowanie wydajności sztucznej inteligencji w oparciu o określone potrzeby. Oprócz wydania, Antropic uruchamia kod Claude, narzędzie, które może wyszukiwać, Edytuj i wykonaj kod, oferując głębszą pomoc w tworzeniu oprogramowania zasilanego przez AI.
Nowa aktualizacja Claude wchodzi w wyścig AI zdominowany przez Openai i Google’s Gemini. Zapytania i złożone rozwiązywanie problemów bez przełączania Cloud’s Vertex AI. Firma utrzymywała wyceny niezmienioną pomimo tych rozszerzonych możliwości.
AI, która dostosowuje swoją szybkość myślenia
Jedną z największych zmian w Claude 3.7 Sonnet jest jego dynamiczna System rozumowania, który dostosowuje prędkość przetwarzania w oparciu o złożoność zadań. Firma stwierdza:
„Możesz wybrać, kiedy chcesz, aby model odpowiedział normalnie, a kiedy chcesz, aby pomyślał dłużej przed odpowiedzią. W trybie standardowym Claude 3.7 Sonet reprezentuje ulepszoną wersję Sonet Claude 3.5. W trybie rozszerzonego myślenia samodzielnie się przechodzi przed odpowiedzią, co poprawia wydajność matematyki, fizyki, instrukcji, kodowania i wielu innych zadań. Zasadniczo stwierdzamy, że podpowiedź o model działa podobnie w obu trybach.
Po drugie, podczas korzystania z Claude 3.7 Sonnet za pośrednictwem interfejsu API użytkownicy mogą również kontrolować budżet na myślenie: możesz powiedzieć Claude, aby pomyśleć o nie więcej niż n tokeny, dla dowolnej wartości n do limitu wyjściowego 128 tokenów. Pozwala to na kompetencję prędkości (i kosztów) jakości odpowiedzi.
Po trzecie, opracowując nasze modele rozumowania, zoptymalizowaliśmy nieco mniej pod kątem problemów z konkurencją matematyki i informatyki, a zamiast tego skupiliśmy się na skupienie się na Zadania w świecie rzeczywistym, które lepiej odzwierciedlają sposób, w jaki firmy faktycznie używają LLM. “
W przeciwieństwie do wcześniejszych modeli, które zoptymalizowane pod kątem szybkich odpowiedzi lub głębokiej analizy, ta wersja oferuje elastyczność i sprawia, że Claude 3.7 Sonnet jest bardziej przystosowalny do dostosowania Aplikacje w świecie rzeczywistym, od automatyzacji w czasie rzeczywistym do dogłębnych badań.
[zawartość osadzona]
W jaki sposób Claude 3.7 Sonet układa się przeciwko Openai, Google i XAI
Podejście Anthropica z Claude 3.7 Sonet umieszcza go w bezpośrednim konkurencji z gpt-4 Openai , Google’s Gemini i Xai Grok-3 . Każdy z tych modeli ma mocne strony w różnych obszarach, ale decyzja Anthropica o udoskonaleniu rozumowania hybrydowego zamiast skupienia się na wyszukiwaniu w czasie rzeczywistym oznacza odrębną strategię.
W przeciwieństwie do podejścia wielomodelowego Openai, w którym oddzielne systemy AI są optymalizowane W przypadku szybkiego czasu reakcji lub głębszego rozumowania Claude 3.7 integruje oba z jednym systemem. Eliminuje to potrzebę wyboru użytkowników między różnymi wersjami modelu w zależności od złożoności zadań. Jednak Openai zachowuje przewagę w pobieraniu stron internetowych na żywo, obszar, w którym Claude wciąż pozostaje w tyle.
Modele Google’s Gemini, które podkreślają głęboką integrację z możliwościami wyszukiwania i multimodalnymi, kontrastując z ustrukturyzowanym rozumowaniem Claude’a. Podczas gdy AI Google korzysta z aktualnego pobierania danych, Sonnet Claude 3.7 jest zoptymalizowany pod kątem aplikacji przedsiębiorstwa wymagających kontrolowanych czasów reakcji i tuningu specyficznego dla zadania.
Tymczasem GROK-3 XAI, umieszczonego jako Alternatywa dla modeli premium Openai, priorytetowo traktuje zaangażowanie w czasie rzeczywistym i integrację mediów społecznościowych. Chociaż sprawia, że jest to skuteczne w interaktywnych przypadkach użycia sztucznej inteligencji, brakuje jej optymalizacji zorientowanych na programistę, które antropic podkreśla z kodem Claude.
Zgodnie z własnymi punktami odniesienia antropika, Claude 3.7 Sonnet wykazuje wyraźne przywództwo w zadaniach związanych z kodowaniem , przewyższają modele Openai i DeepSeek R1 w kodowaniu agencyjnym (zweryfikowane SWE-Bench) i narzędzia agencyjne (Tau-Bench). Jego zdolność do wykonywania modyfikacji kodu, interakcji z narzędziami i przestrzegania ustrukturyzowanych instrukcji sprawia, że jest to silny wybór do tworzenia oprogramowania i automatyzacji przepływu pracy.
Dodatkowo prowadzi w instrukcji (IFEVAL), pokazując jego niezawodność wykonania zadań napędzanych AI. Podczas gdy Openai O1 pozostaje konkurencyjny w wielojęzycznych pytań i odpowiedzi, a Deepseek R1 prowadzi w niektórych matematycznych testach porównawczych, ulepszenia Claude 3.7 Sonnet sprawiają, że jest to jeden z najbardziej dobrze zaokrąglonych modeli dla ustrukturyzowanego rozumowania i automatyzacji zadań.
w rozumowaniu na poziomie absolwentów. (GQPA Diamond), Sonet Claude 3.7 z rozszerzonym myśleniem ściśle pasuje do modeli Grok 3 Beta i Openai, Ale bez długotrwałego myślenia jego wydajność znacznie spada. Osiąga także znaczną poprawę w rozwiązywaniu problemów matematycznych (MATH 500), zdobywając podobnie do Openai O1, ale nadal pozostaje w tyle za Deepseek R1 i Grok 3 Beta w odniesieniach konkursów matematycznych w szkole średniej (Aime 2024).
W rozumowaniu wizualnym (walidacja MMMU), Openai O1 i Grok 3 Beta utrzymują przewagę, sugerując, że Claude może nadal potrzebować udoskonaleń w zadaniach opartych na AI. Źród Strategiczne skupienie się na AI i ustrukturyzowane rozwiązywanie problemów, a nie wyszukiwanie stron internetowych w czasie rzeczywistym sprawia, że Claude 3.7 Sonnet jest odpowiedni dla profesjonalnych aplikacji. Jednak modele Google Gemini, Openai GPT-4 i XAI GROK-3 nadal pchają multimodalny dostęp do sztucznej inteligencji i dostępu do danych na żywo, obszarów, w których Claude pozostaje ograniczony.
Dzięki ulepszeniom w zakresie elastyczności rozumowania, narzędzi programistycznych i możliwościami automatyzacji Claude 3.7 Sonnet wzmacnia swoją rolę jako silna alternatywa dla użytkowników priorytetowych priorytetów przepływów pracy AI i pomocy kodowania w zakresie wyszukiwania informacji na żywo.
Claude Code: AI, który pisze, edytuje i testuje oprogramowanie
Claude Code Code Krok w kierunku uczynienia AI bardziej aktywnym uczestnikiem tworzenia oprogramowania. W przeciwieństwie do Github Copilot, który sugeruje przede wszystkim fragmenty kodu, kod Claude został zaprojektowany do wykonywania przepływów pracy programowania. Może odczytać pliki projektu, modyfikować istniejący kod, uruchamiać testy i przesuwać zmiany bezpośrednio do repozytoriów.
Anthropic opisuje kod Claude jako „aktywny współpracownik, który może wyszukiwać i czytać kod, edytować pliki, pisać i uruchamiać testy , zatwierdź i pchnij kod do GitHub i użyj narzędzi wiersza poleceń „Według TechCrunch. Narzędzie zostało wewnętrznie przetestowane pod kodowaniem sesji trwających do 45 minut, pomagając w budowaniu interaktywnych Projekty stron internetowych i rafinacja baz Rozumowanie i analiza
Sonnet Claude 3.7 nie jest tylko uaktualnieniem dla programistów-poprawia się również w takich obszarach, jak analiza prawna, Finanse i matematyka. Za pośrednictwem środowisk gier wideo. Poprzednie modele Claude zmagały się z długoterminowym planowaniem w interaktywnych warunkach, ale ta wersja z powodzeniem dostosowała się do wyzwań w grze i zoptymalizowanych strategii decyzyjnych.
Dodatkowo model zawiera teraz zaktualizowane granice wiedzy z października 2024 r. Jednak w przeciwieństwie do GPT-4O Openai i Google, brakuje mu możliwości przeglądania Informacje.
Anthropic’s AI Mapa i przyszły wpływ branży
Z każdą iteracją Anthropic udoskonalił zdolność sztucznej inteligencji do radzenia sobie z rozszerzonymi zadaniami rozumowania, zachowując bardziej konwersację Styl interakcji. Kluczową zmianą z Claude 3.7 jest integracja dynamicznej kontroli prędkości odpowiedzi, umożliwiając użytkownikom dyktowanie, czy AI powinna priorytetowo traktować prędkość, czy głębokość. Ta aktualizacja bezpośrednio dotyczy wspólnego ograniczenia w dużych modelach AI-równowaga wydajności z dokładnością.
Anthropic umieścił Claude jako model AI odpowiedni dla złożonych przypadków użycia przedsiębiorstwa, a nie masowe interakcje na temat AI. Jego dostępność za pośrednictwem Amazon Bedrock i Google Vertex AI sugeruje długoterminowe dążenie do integracji AI opartej na chmurze.
Patrząc w przyszłość, skupienie się Antropic na rozumowanie hybrydowe i aplikacje przedsiębiorcze może przygotować scenę dla dalszych udoskonaleń w zakresie AI. Modele obsługują zautomatyzowane procesy na dużą skalę. Jeśli odzyskiwanie w czasie rzeczywistym i możliwości multimodalne stają się niezbędnymi dodatkami, następna wersja Claude może zawierać funkcje, które zamykają lukę między jego konkurentami.
Na razie Claude Sonnet pozostaje modelem AI zbudowanym dla ustrukturyzowanego rozumowania i precyzja, rzeźbienie niszy, w której kontrola nad czasem przetwarzania jest równie ważna jak dokładność odpowiedzi.