Google znacznie rozszerza możliwości swojej sztucznej inteligencji Gemini, wprowadzając nową funkcję, która pozwala chatbotowi analizować zawartość filmów zwolnionych przez użytkownika. Aktualizacja multimodalna, która staje się dostępna zarówno dla bezpłatnych, jak i płatnych użytkowników, pozwala podać plik wideo i zadawać konkretne pytania dotyczące jego zawartości, od identyfikacji obiektów po opisywanie złożonych scen, oznaczanie znacznego etapu zdolności sztucznej inteligencji do zrozumienia świata poza obrazami tekstowymi i statycznymi.

Funkcja jest wdrażana przez Android, IOS i Internet, dając Gemini, które można było wymyślić w przypadku LIKA LIKA LIKA LIKA LIKAPT. Możliwość analizy przesłanych plików wideo. Wydaje się, że wdrożenie dzieje się szybko; Po tym, jak Zamknięte przez 9to5google , kolejne najnowsze raporty z policji z Android potwierdzają swoją dostępność w sieci. Wskazówki wizualne i dźwiękowe poprawnie określają lokalizację, w której nakręcono klip. Podczas gdy użytkownicy mogą przesyłać istniejące filmy z galerii urządzenia, wbudowana kamera aplikacji Gemini nie obsługuje jeszcze bezpośredniego przechwytywania wideo do analizy.

Ta nowa zdolność jest zasilana przez modelową rodzinę Google Gemini 2.5, która niedawno przeniosła się z okresu szybkiego eksperymentu do stabilności. Modele firmy Gemini 2.5 Pro i 2.5 Flash są teraz w „ogólnej dostępności”, status, który, zgodnie z Vertex ai Uwagi wydania , znaczące są stabilne i wspierane dla produkcji. Na początku 2025 r., Kiedy Google przesunęło swój eksperymentalny model Pro 2.5 do wszystkich wolnych użytkowników w tym, co jego zespół mediów społecznościowych nazwał „Sprint.”

, że agresywne pchanie przyciągnęło krytykę niektórych ekspertów ds. Zarządzania AI. Towarzyszący raport bezpieczeństwa pojawił się kilka tygodni później, które Kevin Bankston z Centrum Demokracji i Technologii nazwał część „niepokojącej historii wyścigu na dno w sprawie bezpieczeństwa AI.”

Nowy status „GA” sugeruje bardziej zmierzone podejście, oparte na A nowo zdefiniowana hierarchia szczegółowo na blogu Google for Developers . W publikuj na słowie kluczowym , senior Google reżyser Tulsee doshi doshi opracował strategię: „Aby utworzyć„ rodzinę hybrydowych modeli rozumowania “, które dostarczają najwyższe wydanie podczas remontu w„ Plates Frontier o cenie “. i szybkość. “„

Rodzina Gemini obejmuje teraz także nowy Flash-Lite Gemini 2.5, opłacalny model podglądu. Posiada również kontrolowane „rozumowanie hybrydowe”, system, który pozwala programistom na Ustaw „myślenie budżetowe„ Aby uzyskać bardziej złożone pytania, według wpisu na blogu Google. Strategia subskrypcji premium

Wdrażanie funkcji jest kluczową częścią szerszej strategii Google w zakresie wyjaśnienia składu produktów i przyjęcia nowych poziomów subskrypcji premium. Firma niedawno przeglądała zagmatwaną branding, konsolidując wszystko pod prostą nazwą „Gemini” i wprowadzając dwa odrębne płatne plany: Google AI Pro i Google AI Ultra. Ten ruch wyeliminował starszą markę, taką jak „Gemini Advanced” i „AI Premium.”

Plan Google AI Pro, za 19,99 USD miesięcznie, obejmuje dostęp do potężnego modelu Gemini 2.5 Pro, 2 TB przechowywania w chmurze i miesięczne kredyty dla innych kreatywnych narzędzi AI. Wysokiej klasy Plan Google AI Ultra, w cenie 249,99 USD miesięcznie, jest skierowany do profesjonalistów i małych studiów, łącząc 30 TB Storage, YouTube Premium i wyłączny dostęp do technologii eksperymentalnej, takich jak agent AI Project Mariner AI.

Jeden z dyrektorów wykonawczych opisał Ultra Tiier “. Nowa struktura, wyszczególniona w Google Plany oficjalne, również integruje i odblokowuje zaawansowane funkcje, takie jak asystent AI Research Assistant Notebooklm.

Jednak wartość propozycja jest rozpatrywana. opinie użytkownika na Reddit sugeruje, że kluczowy kompromis między Pro i konkurentami, takimi jak chatgpt plus, z gemini faworyzowanymi przez te głębinę w Google i sugeruje ecosys i sugeruje kluczowy kompromis i Chatgpt preferowany do kreatywnego pisania. Tymczasem niektórzy analitycy argumentują, że wysokiej klasy Plan Ultra ustawia nową linię odniesienia dla drogich subskrypcji AI, ponieważ subskrybenci zasadniczo płacą za funkcje testowe beta.

Rozszerzające się kreatywne narzędzia i konkurencyjne krajobrazy

jest najnowszym dodatkiem, łącząc rosnący Suite z narzędzi kreatywnych, aby wykorzystywać koszty subskrypcji. Plany AI Pro i Ultra zapewniają również dostęp do zaawansowanego modelu generowania tekstu do głosowania do filmu Veo 3. Ta technologia, którą dyrektor generalny Google DeepMind Demis Hassabis opisany jako pomaga branży „wyłonił się z cichej epoki generowania wideo”, jest dostępna dzięki specjalistycznej aplikacji filmowej przepływu, a także jest zintegrowana z Google Vids.

w głównej korzyściach Veo jest jej wiodąca, synchronizowana, synchronizowana, synchronizowana, audycja, synchronizowana przez Audio, synch. Sora przoduje w dłuższej symulacji wytwarzania klipów i fizyki. Aby zająć się obawami dotyczącymi autentyczności i niewłaściwego użycia, Google wykorzystuje swoją syntezową technologię do zastosowania niezauważalnego cyfrowego znaku wodnego do treści generowanej przez AI.

Te środki bezpieczeństwa są kluczowe, ponieważ Veo 3 może generować przekonujące oskarżenia o wrażliwych wydarzeniach, takich jak zamieszki i oszustwa wyborcze. Ten technologiczny wyścig zbrojeń jest głównym tematem epoki AI, rozwijającym się w ramach ogromnej strategii integracji całego ekosystemu na pełnym wyświetleniu na konferencji I/O 2025 Google.

Ponadto pytania dotyczące danych treningowych utrzymują się, z doniesieniami, że modele takie jak Veo mogą być wyszkolone w zakresie publicznej zawartości YouTube. Kontrastuje to z konkurentami takimi jak Adobe, który podkreśla, że ​​jego modele Firefly są szkolone w zakresie licencjonowanych treści w celu uniknięcia problemów własności intelektualnej. 

Categories: IT Info