Alibaba zaprezentował Qwen VLO, potężną multimodalną sztuczną inteligencję, która generuje i edytuje wysokiej jakości wizualizacje, oznaczając znaczną eskalację w globalnej rasie AI. Nowy „AI Creative Engine”, uruchomiony w piątek 27 czerwca, bezpośrednio rzuca wyzwanie zachodnim konkurentom, takim jak Google i Openai, jednocząc zaawansowane zrozumienie wizualne z wyrafinowanym narzędziami do tworzenia w jednym systemie.

Model VLO QWEN pozwala użytkownikom tworzyć złożone sceny i wykonywać edycje na locie przy użyciu prostego języka. W Oficjalne ogłoszenie , alibaba sformułowała wydanie jako ruch do stworzenia modelu, który nie tylko „rozumie” świat, ale także generuje rekreację wysokiej jakości na podstawie tego zrozumienia, prawdziwą przemyślenie Percepcji i stworzenia. Uruchomienie, które nastąpi zaledwie kilka dni po wydaniu Google jego ImageN 4 Image Generator, podkreśla pęcherze innowacji na rynku generowania obrazu AI.

Nowy model jest obecnie dostępny jako publiczny zapowiedź za pośrednictwem platformy . Podczas gdy Alibaba przyznał, że wersja podglądu znała ograniczenia, stwierdzono zobowiązanie do poprawy stabilności i solidności modelu. Ta strategia szybkiej iteracji publicznej sygnalizuje zamiar firmy do przechwytywania rynku i umysłu, umieszczając swoje najnowsze narzędzia bezpośrednio w ręce użytkowników.

technik VLO

U podstaw QWEN VLO jest zaprojektowany jako zunifikowany model, który łączy multimodalne zrozumienie z możliwościami generatywnymi. Według szczegółów zespołu QWEN, model wykorzystuje innowacyjną metodę progresywnego generowania, konstruując obrazy stopniowo od lewej do prawej i od góry do dołu. Mechanizm ten został zaprojektowany nie tylko w celu zwiększenia ostatecznej jakości i spójności, ale także do zapewnienia użytkownikom bardziej elastycznego i kontrolowanego procesu twórczego.

Kluczową zaletą QWEN VLO jest wykorzystanie szkolenia dynamicznego rozdzielczości. Pozwala to modelowi wspierać generowanie obrazów w dowolnych rozdzielczościach i proporcjach, uwalniając twórców od ograniczeń stałych formatów. Ta elastyczność sprawia, że ​​nadaje się do szerokiej gamy aplikacji, od okładek mediów społecznościowych i banerów internetowych po ilustracje i plakaty o wysokiej rozdzielczości.

Model pokazuje również zaawansowane możliwości związane z instrukcją. Obsługuje otwarte polecenia języka naturalnego dla złożonych zadań edytowania, takich jak transfery stylu artystycznego, odbudowa scen i modyfikacja obiektów. Ponadto Qwen VLO może przetwarzać wiele operacji w ramach jednej, złożonej instrukcji, umożliwiając jej obsługę wieloetapowych zadań kreatywnych za jednym razem. Model rozszerza nawet swoje zdolności generacyjne na tradycyjne zadania percepcyjne, zdolne do wytwarzania map głębokości, masek segmentacji i informacji o wykrywaniu krawędzi poprzez proste podpowiedzi edycji, skutecznie wypełniając lukę między percepcją ai a tworzeniem.

szybka ewolucja AIBABA EcosysteM

premiera QWEN VLO jest najnowszą ewolucją MILESTONE. W nieustępliwym strumieniu postępów Alibaba, pokazując jasną strategię budowania kompleksowego i głęboko zintegrowanego ekosystemu AI. W tej podróży modele firmy ewoluowały od czystego zrozumienia do jednolitego stworzenia w ciągu kilku miesięcy.

W styczniu Alibaba uruchomiła model Qwen 2.5, który koncentrował się na zrozumieniu multimodalnym-analizującym tekst, obrazy i filmy. Następnie w kwietniu wydano rodzinę dużych modeli języków QWEN3 QWEN3, która wprowadziła nowe funkcje, takie jak tryb „myślenia hybrydowego” do równoważenia wydajności i kosztów.

Te podstawowe modele to nie tylko projekty badawcze; Są one aktywnie leżone w rozległym portfolio Alibaba produktów skierowanych do konsumentów. Firma wcześniej zaktualizowała swoją Asystent Quark AI, platformę z ponad 200 milionami użytkowników w Chinach, z zaawansowanymi modelami QWen.

Wu Jia, CEO Quark, stwierdzono w wywiadzie z analizy z Xinhua News. przekształcając go z prostej przeglądarki w centralne centrum dla usług napędzanych AI. Ten szybki cykl rozwoju i wdrażania pokazuje ambicje Alibaba do stworzenia pionowo zintegrowanego stosu AI, od podstawowych badań po aplikację masowego. Firma została zamknięta w walce z chińskim rywalem Deepseek, uwalniając swój model QWEN 2.5-Max na początku tego roku, aby rzucić wyzwanie systemom wysokiej wydajności Deepseek. Ta rywalizacja komplikuje znaczącą międzynarodową kontrolę otaczającą Deepseek, w tym dochodzenia w zakresie prywatności danych i zarzuty o niewłaściwy dostęp do danych, tworząc potencjalne otwarcie Alibaba do pozycjonowania się jako bardziej stabilnego i przejrzystego partnera. Presja konkurencyjna jest nie tylko krajowa, a wojna cenowa wśród chińskich gigantów technologicznych nasila się.

Uruchamianie całego push AI Ai Ai jest strategicznym zaangażowaniem w rozwój open source i agresywne ceny w celu zwiększenia rozpowszechniania adopcji. Ten wzorzec został ustalony pod koniec 2024 r., Kiedy firma obniżyła cenę swoich modeli QWEN-VL o 85% i została ugruntowana w lutym 2025 r., Kiedy to udostępniła swoje modele wideo WAN 2.1 AI jako oprogramowanie typu open source. Takie podejście bezpośrednio kontrastuje z wypłatami, zastrzeżonymi modelami oferowanymi przez zachodnich konkurentów, takich jak Sorai Sorai i Google Veo 2.

, tworząc potężne modele, takie jak QWEN3 i WAN 2.1 dostępne pod licencjami dopuszczalnymi na platformach takich jak przytulanie twarzy i github , Alibaba kultywuje globalną społeczność programistów, którzy opierają się na swojej technologii.

geopolityczne i etyczne wiatry złe

, podczas gdy alibaba buduje dynamikę techniczną i strategiczną, globalne ambicje stają się istotnymi wyzwaniami geopolitycznymi i etycznymi. Rywalizacja technologiczna między USA i Chinami rzuca długi cień w stosunku do każdej transgranicznej współpracy. Na przykład potencjalne partnerstwo między Apple i Alibaba w celu wprowadzenia funkcji AI do iPhone’ów w Chinach wywołało intensywną kontrolę rządu USA w sprawie problemów bezpieczeństwa narodowego.

jako Greg Allen z Centrum Studiów Strategicznych i Międzynarodowych Bluntly Powiedział New York Times : „Stany Zjednoczone są w wyścigu AI z Chinami, a my po prostu nie chcemy, aby amerykańskie firmy pomagają chińskim firmom zjeżdżając faster.” Te napięcia są eskalacyjne, wraz z amerykańskim biurem przemysłu i bezpieczeństwa dalej Jednocześnie cała branża generowania obrazu AI zmaga się z prawem prawnym i etycznym w zakresie praw autorskich. W przełomowym pozwie o naruszenie praw autorskich Disney i Universal oskarżyli firmę AI Midjourney o niezgodne z prawem szkolenie swoich modeli na swoich kultowych postaciach.

Przypadek jest punktem centralnym w szerszej wojnie między właścicielami treści a programistami AI nad skrobaniem danych. Jako ogólny doradca Disneya

To kontrowersyjne środowisko wywiera ogromną presję na wszystkich programistów AI, w tym Alibaba, aby zapewnić, że ich dane szkoleniowe są etycznie pozyskiwane, a poruszanie się po złożonym prawnym krajobrazie, ponieważ wprowadzają coraz bardziej potężne kreatywne narzędzia dla globalnej publiczności.

Alibaba uruchomienie QWen VLO jest więcej niż kolejne wydanie produktu; Jest to obliczony i agresywny ruch w globalnym meczu szachowym. Szybko ewoluując swoją technologię od zrozumienia do stworzenia, firma demonstruje swoją sprawność techniczną. Strategicznie przyjmując model typu open source, buduje globalny ekosystem zaprojektowany tak, aby wymanewrował swoich zastrzeżonych konkurentów.

Jednak ten ambitny pchnięcie odbywa się na zdradzieckim boisku. Zaciekła krajowa wojna cenowa wymaga bezwzględnej wydajności, podczas gdy eskaluje napięcia geopolityczne i nierozwiązane dylematy etyczne wokół danych AI, stanowią ogromne bariery dla jej ekspansji międzynarodowej. QWen VLO to nowy nowy utwór na planszy, ale ostateczny sukces Alibaba będzie zależeć zarówno od nawigacji na te zewnętrzne presje, jak i elegancji jego kodu.