Google prezentuje Veo 3 i Imagen 4: Nowa era generowania treści za pomocą sztucznej inteligencji

3 Minuty

Podczas konferencji Google I/O 2025 technologiczny gigant zaprezentował najnowsze modele sztucznej inteligencji: Veo 3 oraz Imagen 4. Te zaawansowane narzędzia otwierają nowe możliwości dla twórców, umożliwiając generowanie realistycznych treści wideo i obrazów na podstawie opisów tekstowych.

Możliwości Veo 3

Veo 3 to innowacyjny model AI, który pozwala użytkownikom tworzyć filmy z dźwiękiem, bazując wyłącznie na tekstowych danych wejściowych. Na przykład, wpisując zapytanie o ptaki, model wygeneruje wideo przedstawiające ptaki wraz z ich śpiewem. Ta funkcjonalność znacząco zwiększa realizm i angażujący charakter tworzonych treści.

Precyzja fizyki i synchronizacji

Google podkreśla, że Veo 3 wyróżnia się wysoką dokładnością w odwzorowywaniu fizyki świata rzeczywistego oraz synchronizacji ruchu warg z dźwiękiem. Oznacza to, że ruchy ludzi, zwierząt i obiektów w wygenerowanych filmach wyglądają naturalnie i płynnie, a dialogi oraz dźwięki są precyzyjnie zsynchronizowane z elementami wizualnymi.

Dostępność i integracja

Obecnie Veo 3 jest dostępny wyłącznie dla subskrybentów Gemini Ultra w USA za pośrednictwem aplikacji Gemini oraz dla klientów biznesowych poprzez platformę Vertex AI. Ponadto, model zostanie zintegrowany z nowym narzędziem do tworzenia wideo o nazwie Flow.

Flow: Nowe narzędzie do tworzenia wideo

Flow łączy modele Veo, Imagen i Gemini, umożliwiając użytkownikom tworzenie klipów i scen filmowych na podstawie opisów w języku naturalnym. Użytkownicy mogą opisać pożądany rezultat, a narzędzie automatycznie wygeneruje odpowiednią treść. Aktualnie Flow jest dostępny wyłącznie dla subskrybentów Google AI Pro i Ultra w USA, jednak w najbliższym czasie planowane jest rozszerzenie dostępności na inne kraje.

Wsparcie dla Veo 2 i dodatkowe funkcje

Mimo wprowadzenia Veo 3, Google kontynuuje wsparcie dla Veo 2. Użytkownicy mogą korzystać z tego modelu na platformie Flow, dostarczając zdjęcia jako odniesienia do osób, scen, stylów czy obiektów. Dodatkowo oferowane są narzędzia, takie jak kontrola kamery, zmiana kąta widzenia, zbliżenie na konkretne obiekty, zmiana formatu z portretowego na pejzażowy oraz dodawanie lub usuwanie elementów z wideo.

Wprowadzenie Imagen 4

Równocześnie z Veo 3, Google zaprezentowało nowy model generowania obrazów – Imagen 4. Model ten wyróżnia się zdolnością do odtwarzania drobnych detali, takich jak tekstury tkanin czy sierść zwierząt, oraz może generować zarówno fotorealistyczne, jak i abstrakcyjne obrazy.

Udoskonalenia w typografii i rozdzielczości

Imagen 4 znacząco poprawił odwzorowanie typografii w porównaniu do wcześniejszych wersji i może generować obrazy w różnych proporcjach oraz w rozdzielczości do 2K. Model ten jest teraz dostępny poprzez aplikację Gemini, platformę Vertex AI oraz narzędzia Workspace, takie jak Docs i Slides. Ponadto, planowane jest wkrótce wydanie wersji Imagen 3, która będzie 10 razy szybsza od obecnej.

SynthID Detector: Narzędzie do walki z fałszywymi treściami

W odpowiedzi na rosnące zagrożenie związane z rozpowszechnianiem fałszywych treści generowanych przez AI, Google wprowadziło nowe narzędzie o nazwie SynthID Detector. Użytkownicy mogą przesyłać podejrzane pliki wideo lub audio, aby sprawdzić, czy zawierają one znak wodny SynthID, wskazujący na to, że treść została wygenerowana za pomocą sztucznej inteligencji. ([deepmind.google](https://deepmind.google/technologies/synthid/?utm_source=openai))

Podsumowanie

Wprowadzenie Veo 3 i Imagen 4 stanowi znaczący krok naprzód w dziedzinie generowania treści za pomocą sztucznej inteligencji. Te modele oferują twórcom nowe możliwości tworzenia wysokiej jakości wideo i obrazów, jednocześnie zapewniając autentyczność treści i przeciwdziałając rozpowszechnianiu fałszywych informacji. Google kontynuuje inwestycje w technologie AI, dążąc do dostarczania użytkownikom zaawansowanych i niezawodnych narzędzi do twórczości.

Komentarze

Zostaw komentarz

Google prezentuje Veo 3 i Imagen 4: Nowa era generowania treści za pomocą sztucznej inteligencji

Możliwości Veo 3

Precyzja fizyki i synchronizacji

Dostępność i integracja

Flow: Nowe narzędzie do tworzenia wideo

Wsparcie dla Veo 2 i dodatkowe funkcje

Wprowadzenie Imagen 4

Udoskonalenia w typografii i rozdzielczości

SynthID Detector: Narzędzie do walki z fałszywymi treściami

Podsumowanie

Komentarze

Powiązane posty

Wikidata: Niewidoczna Siła Napędzająca Nowoczesną Innowację Cyfrową

Amazon rozszerza ambicje w dziedzinie sztucznej inteligencji dzięki przejęciu Bee

Przełom sztucznej inteligencji na Międzynarodowej Olimpiadzie Matematycznej

FuriosaAI zawiera strategiczny sojusz z LG, omijając ofertę przejęcia od Meta

Latent Labs prezentuje LatentX – przełomową platformę AI do inżynierii białek

OpenAI i rząd Wielkiej Brytanii zawierają strategiczny sojusz na rzecz rozwoju sztucznej inteligencji

Narastające obawy: Wpływ sztucznej inteligencji na zdrowie psychiczne

Google prezentuje Gemini Drops: Nowe spojrzenie na aktualizacje chatbota AI

Wzrost AI-generowanych Pułapek Turystycznych: Co Musisz Wiedzieć

Google wprowadza Gemini Drops – ciągłe innowacje w sztucznej inteligencji