Openai uruchomił SORA 2, jej potężny nowy model AI, który generuje wideo z zsynchronizowanym audio, wraz z nową aplikacją społecznościową na iOS. Aplikacja zwana także Sora została wydana we wtorek i ma kanał w stylu Tiktok do udostępniania klipów generowanych przez AI. Obecnie jest dostępny na zaproszenie w USA i Kanadzie.
Podpis „Cameo” aplikacji pozwala użytkownikom tworzyć filmy z udziałem siebie i swoich przyjaciół, podnosząc natychmiastowe pytania dotyczące zgody i technologii głębokiego Fake.
Dzięki tej podwójnej wersji OpenAi nie jest tylko rozwijającymi podstawowe możliwości AI, ale także wprowadzać do konkurencyjnego mediów społecznościowych.
sora 2: skok do przodu w ai wideo i audio generowaniu audio
wydanie SORA 2 Marks a
budynku na jego pretesorze, nowy model wprowadza Suite do upoważnienia dla mistrza. Realizm, zwiększona sterowalność użytkowników i rozszerzony zakres stylistyczny.
Najważniejsze, Sora 2 może teraz generować zsynchronizowane audio wraz z klipami wideo, pierwszy dla modeli Openai. Model Google Veo 3 był pierwszym, który dodał takie możliwości w maju tego roku. Dla twórców ten zintegrowany dźwięk jest zmieniający grę.
[zawartość osadzona]
Eliminuje złożony etap poznozowania pozyskiwania i wyrównania dźwięku, dramatycznie obniżając barierę w wytwarzaniu dopracowanej, wciągającej treści. Ten LEAP przesuwa wideo AI z nowości technicznej w kierunku praktycznego narzędzia produkcyjnego do końca do końca. Ogłoszenie
Openai podkreśla również major Firma wyjaśniła, że starsze systemy cierpiały z powodu kluczowej wady, zauważając, że „wcześniejsze modele wideo są nadmiernie optymistyczne-przekształcą obiekty i odkształcają rzeczywistość, aby skutecznie wykonać pod kątem podpowiedzi.”
To często powodowało klipy, w których prawa przyczyny i skutku wydawały się zepsute lub niespójne.
sora 2, w przeciwieństwie do tego, aby być bardziej uzasadnionym fizycznie dynamiką. Aby zilustrować ulepszenie, Openai twierdzi, że „w Sora 2, jeśli koszykarz przegapi strzał, odbije się od tablicy.”
To przestrzeganie fizyki jest prezentowane w publicznych klipach przedstawiających złożone działania, takie jak gry w siatkówce plażowej i sztuczki deszczowe, sygnalizując utrudnione kroki w kierunku modeli, które mogą bardziej dokładności fizycznej świata fizycznego.
Aplikacja Sora: rywal tiktok z AI Twist
Poza samym modelem, większa historia jest strategicznym przestawieniem Openai do .
Aplikacja, obecnie dostępna na iPhone’y na zaproszenie tylko w USA i Kanadzie, przedstawia użytkownikom znajomy, pionowo przewijający kanał krótkich filmów.
Ale ma zasadniczą różnicę: każda treść jest generowana w ramach aplikacji, z bieżącymi dziełami ograniczonymi do 10 sekund do 10 sekund.
przez uruchomienie dedanitowanej aplikacji i po prostu aplikacji. API, Openai gra strategiczną grę dla niewoli bazy użytkowników. Pracownicy podobno nazwali to potencjalnym „Chatgpt Moment dla generowania wideo”. Takie podejście pozwala firmie kontrolować wrażenia użytkownika, gromadzić bezpośrednie informacje zwrotne i budować efekt sieci za pośrednictwem systemu zaproszenia, w którym każdy nowy użytkownik może wprowadzić czterech dodatkowych znajomych .
W poście na blogu Openai przedstawił swoje podstawowe zasady dla kanału aplikacji, stwierdzając, że jego celem jest „pomóc ludziom uczyć się tego, co jest możliwe, i inspiruje ich tworzenie.
Firma twierdzi, że jej algorytm rankingowy ma na celu „faworyzowanie kreatywności i aktywnego uczestnictwa, a nie pasywnego przewijania”. Aby wspierać społeczność, system priorytetuje również „podłączone treści” od znajomych przez globalne, niepowiązane filmy.
Kanał jest spersonalizowany przy użyciu sygnałów, takich jak posty użytkownika, polubienia i obserwowanie konta, a także ich historia chatgpt, choć można to wyłączyć w ustawieniach aplikacji.
Podkreślanie skupienia użytkownika, platforma, platforma, aby dostosowywać zalecenia i dostosowywać komediowe ustawienia i dostosowuje kontrolę i dostosowuje kontrolę i dostosowuje się do kontroli. Wyłącz personalizację i ciągły przewijanie konta dla nastolatków.
To tworzy zamknięty ekosystem twórczy, w którym konsumpcja i tworzenie są ściśle powiązane. Aplikacja zachęca do uczestnictwa za pomocą funkcji „remiksu”, umożliwiając użytkownikom opieranie się na popularnych filmach i koncepcjach-mechanika okazała się bardzo udana na platformach takich jak Tiktok.
Prowadzenie dylematu DeepFake za pomocą „kamei” i zgody
w sercu App of Sora, jest to, że potężne i potencjalnie kontrowersyjne narzędzie narzędziowe, które pozwalają użytkownikom. ich własne podobieństwo do wygenerowanych filmów. Aby utworzyć kameę, użytkownik musi przesłać krótkie nagrywanie wideo i audio, aby zweryfikować swoją tożsamość i uchwycić ich wygląd.
Ta funkcja natychmiast powoduje problem głębokich szaf i zgody na czołówkę. Wygląda na to, że Openai przewiduje te obawy budowanie solidnej ramy zgody bezpośrednio do aplikacji .
Użytkownicy mają zboczkową kontrolę nad tym, kto może użyć swojego zwolnienia, od znajomych do publicznego dostępu. „współwłaściciel” filmu. Daje im to stałe prawo do usunięcia treści lub odwołania dostępu, zapewniając krytyczne zabezpieczenie przed niewłaściwym użyciem.
Openai stwierdził, że „liczb publicznych nie można wygenerować w Sora Arena
Wraz z tym premierą Openai po raz kolejny podgrzewa „wyścig zbrojeń AI” od bitwy o wyniki modelowe do walki o zaangażowanie konsumentów. Firma uważa, że „uważamy, że aplikacja społeczna zbudowana wokół tej funkcji„ kamei “jest najlepszym sposobem na doświadczenie magii SORA 2”, wskazując strategię koncentrującą się na doświadczeniu użytkowników nad surowymi demonstracjami technicznymi.
Ten ruch stawia Openai w bezpośrednich konkurencjach nie tylko z innymi programistami wideo AI, takimi jak Google i jego modelem Veo 3, ale także z ustalonymi gigantami mediów społecznościowych. Narzędzia AI dla twórców, sygnalizując szerszy trend branżowy.
Wydanie występuje również na tle intensywnej debaty prawnej i etycznej na temat danych wykorzystywanych do szkolenia tych potężnych modeli.
Podczas gdy Openai wyprzedza nowe produkty, nierozwiązane pytania otaczające dane dotyczące skrobania danych i prawa autorskie zbliżają się do całego przemysłu generacyjnego AI.