4 Minuty
OpenAI zaprezentowało Sora 2 — zaawansowaną wersję swojego modelu do generowania audio i wideo, która zyskuje na popularności wraz z premierą nowej aplikacji społecznościowej, oferującej strumień pionowych klipów tworzonych przez sztuczną inteligencję. Ta aktualizacja nie tylko zapewnia bardziej realistyczny ruch postaci i precyzyjniejszą kontrolę, ale również rodzi kolejne pytania dotyczące wizerunku, moderacji treści oraz możliwości zarabiania na wygenerowanych materiałach.
Co nowego w Sora 2: większy realizm i precyzyjna kontrola
Sora 2 koncentruje się na tym, co OpenAI określa jako „symulację rzeczywistości”, czyli jeszcze dokładniejsze odzwierciedlanie ruchów fizycznych oraz zachowań obiektów i środowiska niż wcześniejsze modele. Firma podkreśla, że usprawniono płynność ruchów ludzi, interakcje pomiędzy przedmiotami, a także zdolność modelu do realizowania szczegółowych instrukcji obejmujących wiele ujęć. Choć Sora 2 wciąż nie jest pozbawiona wad, to jednak lepiej odzwierciedla prawa fizyki i umożliwia tworzenie różnorodnych perspektyw kamery lub sekwencji na podstawie jednego zapytania.
Wraz z premierą, OpenAI udostępniło przykłady całkowicie wygenerowane przez model — w tym symulację z udziałem fikcyjnej postaci CEO Sama Altmana. Te materiały pokazują zarówno potencjał twórczy Sora 2, jak i wyraźnie wskazują na ryzyko powstawania realistycznych deepfake’ów wraz z coraz bardziej przekonującym generowaniem wideo.

Nowy feed społecznościowy z AI-wideo w roli głównej
Towarzysząca Sora 2 aplikacja Sora otwiera przed użytkownikami zamknięty, dostępny wyłącznie na zaproszenie portal społecznościowy, w którym treści tworzone są wyłącznie przez generator wideo Sora. Interfejs opiera się na pionowym przewijaniu oraz algorytmie rekomendacji, który dostosowuje treści do preferencji użytkownika. Twórcy mogą w swoich prośbach wskazywać określone style, motywy lub formaty, a nacisk w aplikacji kładziony jest na aktywne tworzenie, a nie bierne oglądanie.
Szczególnie interesującą funkcjonalnością jest "Cameo" — umożliwiającą użytkownikom nagranie krótkiego filmiku, dzięki któremu aplikacja może rozpoznać ich twarz oraz mimikę i wykorzystać ją w wygenerowanych wideo. OpenAI podkreśla, że użytkownik ma kontrolę nad wykorzystaniem swojego wizerunku: sam decyduje, kto ma dostęp do jego cameo, może cofnąć zgodę oraz usuwać nagrania z jego wizerunkiem. Jednak firma zaznacza również, że jeśli zostanie udzielona zgoda innym osobom, mogą one wykorzystywać wizerunek użytkownika — co stawia na pierwszym miejscu kwestie prywatności i świadomej zgody.

Bezpieczeństwo, ograniczenia i perspektywy zarabiania
OpenAI deklaruje odpowiedzialne wdrażanie Sora, wprowadzając szereg zabezpieczeń troszczących się zarówno o dobrostan użytkowników, jak i ochronę młodszych osób. Konto dla nastolatków będzie miało dzienny limit wyświetleń oraz bardziej rygorystyczne zasady wykorzystania wizerunku. Ponadto użytkownicy mogą wpływać na to, jakie treści pojawiają się w ich feedzie, instruując model, co chcą oglądać.
W temacie monetyzacji OpenAI na razie nie zamierza wyświetlać reklam, lecz przewiduje wprowadzenie płatnych opcji, jeśli zapotrzebowanie przekroczy aktualne moce obliczeniowe. Oferując możliwość płatnego generowania dodatkowych filmów w okresach większego obciążenia, firma zamierza każdą zmianę komunikować w sposób transparentny, dostosowując się do rozwoju aplikacji.
Podsumowanie
Sora 2 otwiera nową erę w tworzeniu wideo i audio przez AI: zapewnia realistyczne ruchy, rozbudowaną kontrolę oraz zintegrowane doświadczenie społecznościowe, które stawia na dzielenie się syntetycznymi treściami na szeroką skalę. Połączenie wydajnych narzędzi tworzenia oraz pionowego feedu społecznościowego katalizuje zarówno innowacje twórcze, jak i dylematy etyczne. To, jak OpenAI podchodzić będzie do kwestii zgody, moderacji, bezpieczeństwa i rozwoju, zadecyduje o tym, czy Sora stanie się przełomową platformą kreatywną, czy też zapoczątkuje nową falę dyskusji na temat deepfake’ów.
Źródło: openai
Zostaw komentarz