Google đang mở rộng đáng kể các khả năng của Gemini AI của mình, tung ra một tính năng mới cho phép chatbot phân tích nội dung của các video do người dùng tải lên. Bản cập nhật đa phương thức, đang có sẵn cho cả người dùng miễn phí và trả phí, cho phép bạn cung cấp một tệp video và đặt câu hỏi cụ thể về nội dung của nó, từ việc xác định các đối tượng đến mô tả các cảnh phức tạp, đánh dấu một bước chính trong khả năng AI AI để hiểu trên mạng. Phân tích các tập tin video được tải lên. Việc triển khai dường như đang diễn ra nhanh chóng; Sau khi Được phát hiện bởi 9to5google và tín hiệu âm thanh, xác định chính xác vị trí mà clip được quay. Trong khi người dùng có thể tải lên các video hiện có từ bộ sưu tập thiết bị của họ, thì máy ảnh tích hợp của ứng dụng Song Tử chưa hỗ trợ quay video trực tiếp để phân tích. Gia đình mô hình theo tầng

Khả năng mới này được cung cấp bởi họ mô hình Google Google Gemini 2.5, gần đây đã chuyển từ thời kỳ thử nghiệm nhanh sang một sự ổn định. Các mô hình flash của công ty Song Gemini 2.5 Pro và 2.5 hiện đang có tính khả dụng chung, một trạng thái mà theo Phân cấp mới được xác định chi tiết trên blog của Google cho các nhà phát triển . Trong Chi phí và tốc độ.'”Nó cũng có tính năng lý luận lai có thể kiểm soát được,”Một hệ thống cho phép các nhà phát triển

Trục ra tính năng là một phần quan trọng trong chiến lược rộng lớn hơn của Google để làm rõ dòng sản phẩm của mình và thúc đẩy áp dụng các tầng đăng ký cao cấp mới. Công ty gần đây đã đại tu thương hiệu khó hiểu của mình, củng cố mọi thứ dưới tên đơn giản của Song Tử”và giới thiệu hai kế hoạch trả phí riêng biệt: Google AI Pro và Google AI Ultra. Động thái này đã loại bỏ thương hiệu kế thừa như là Gem Gemini Advanced”và AI AI Premium.”Kế hoạch Ultra AI Ultra cao cấp, có giá 249,99 đô la mỗi tháng, nhằm vào các chuyên gia và studio nhỏ, đóng gói 30 TB lưu trữ, đăng ký cao cấp trên YouTube và quyền truy cập độc quyền vào công nghệ thử nghiệm như tác nhân của Project Mariner AI. Cấu trúc mới, được chi tiết trên Google, Trang chính thức , cũng tích hợp và mở khóa các tính năng nâng cao trong các công cụ khác, chẳng hạn như Viết sáng tạo. Trong khi đó, một số nhà phân tích cho rằng Kế hoạch Ultra cao cấp đặt ra một cơ sở mới cho các đăng ký AI đắt tiền, vì các thuê bao về cơ bản đang trả tiền cho các tính năng kiểm tra beta. Các kế hoạch AI Pro và Ultra cũng cấp quyền truy cập vào mô hình thế hệ văn bản nâng cao của công ty, VEO 3. Công nghệ này, mà Giám đốc điều hành của Google DeepMind Demis Hassabis được mô tả một cách đáng nhớ khi giúp ngành công nghiệp xuất hiện. Thế hệ, trong khi Sora vượt trội ở việc tạo ra clip dài hơn và mô phỏng vật lý. Để giải quyết những lo ngại về tính xác thực và lạm dụng, Google đang sử dụng công nghệ tổng hợp của mình để áp dụng một hình mờ kỹ thuật số không thể nhận ra vào nội dung do AI tạo ra. Cuộc chạy đua vũ trang công nghệ này là một chủ đề trung tâm của thời kỳ AI, mở ra như một phần của chiến lược tích hợp toàn bộ hệ sinh thái trên toàn bộ hệ sinh thái trên toàn bộ hội nghị Google. Điều này trái ngược với các đối thủ cạnh tranh như Adobe, trong đó nhấn mạnh rằng các mô hình đom đóm của nó được đào tạo về nội dung được cấp phép để tránh các vấn đề sở hữu trí tuệ.