Google prezentuje Veo 3 i Imagen 4: Nowa era generowania treści za pomocą sztucznej inteligencji | Teksa.pl – Najnowsze wiadomości ze świata technologii i smartfonów
Google prezentuje Veo 3 i Imagen 4: Nowa era generowania treści za pomocą sztucznej inteligencji

Google prezentuje Veo 3 i Imagen 4: Nowa era generowania treści za pomocą sztucznej inteligencji

2025-05-21
0 Komentarze

3 Minuty

Podczas konferencji Google I/O 2025 technologiczny gigant zaprezentował najnowsze modele sztucznej inteligencji: Veo 3 oraz Imagen 4. Te zaawansowane narzędzia otwierają nowe możliwości dla twórców, umożliwiając generowanie realistycznych treści wideo i obrazów na podstawie opisów tekstowych.

Możliwości Veo 3

Veo 3 to innowacyjny model AI, który pozwala użytkownikom tworzyć filmy z dźwiękiem, bazując wyłącznie na tekstowych danych wejściowych. Na przykład, wpisując zapytanie o ptaki, model wygeneruje wideo przedstawiające ptaki wraz z ich śpiewem. Ta funkcjonalność znacząco zwiększa realizm i angażujący charakter tworzonych treści.

Precyzja fizyki i synchronizacji

Google podkreśla, że Veo 3 wyróżnia się wysoką dokładnością w odwzorowywaniu fizyki świata rzeczywistego oraz synchronizacji ruchu warg z dźwiękiem. Oznacza to, że ruchy ludzi, zwierząt i obiektów w wygenerowanych filmach wyglądają naturalnie i płynnie, a dialogi oraz dźwięki są precyzyjnie zsynchronizowane z elementami wizualnymi.

Dostępność i integracja

Obecnie Veo 3 jest dostępny wyłącznie dla subskrybentów Gemini Ultra w USA za pośrednictwem aplikacji Gemini oraz dla klientów biznesowych poprzez platformę Vertex AI. Ponadto, model zostanie zintegrowany z nowym narzędziem do tworzenia wideo o nazwie Flow.

Flow: Nowe narzędzie do tworzenia wideo

Flow łączy modele Veo, Imagen i Gemini, umożliwiając użytkownikom tworzenie klipów i scen filmowych na podstawie opisów w języku naturalnym. Użytkownicy mogą opisać pożądany rezultat, a narzędzie automatycznie wygeneruje odpowiednią treść. Aktualnie Flow jest dostępny wyłącznie dla subskrybentów Google AI Pro i Ultra w USA, jednak w najbliższym czasie planowane jest rozszerzenie dostępności na inne kraje.

Wsparcie dla Veo 2 i dodatkowe funkcje

Mimo wprowadzenia Veo 3, Google kontynuuje wsparcie dla Veo 2. Użytkownicy mogą korzystać z tego modelu na platformie Flow, dostarczając zdjęcia jako odniesienia do osób, scen, stylów czy obiektów. Dodatkowo oferowane są narzędzia, takie jak kontrola kamery, zmiana kąta widzenia, zbliżenie na konkretne obiekty, zmiana formatu z portretowego na pejzażowy oraz dodawanie lub usuwanie elementów z wideo.

Wprowadzenie Imagen 4

Równocześnie z Veo 3, Google zaprezentowało nowy model generowania obrazów – Imagen 4. Model ten wyróżnia się zdolnością do odtwarzania drobnych detali, takich jak tekstury tkanin czy sierść zwierząt, oraz może generować zarówno fotorealistyczne, jak i abstrakcyjne obrazy.

Udoskonalenia w typografii i rozdzielczości

Imagen 4 znacząco poprawił odwzorowanie typografii w porównaniu do wcześniejszych wersji i może generować obrazy w różnych proporcjach oraz w rozdzielczości do 2K. Model ten jest teraz dostępny poprzez aplikację Gemini, platformę Vertex AI oraz narzędzia Workspace, takie jak Docs i Slides. Ponadto, planowane jest wkrótce wydanie wersji Imagen 3, która będzie 10 razy szybsza od obecnej.

SynthID Detector: Narzędzie do walki z fałszywymi treściami

W odpowiedzi na rosnące zagrożenie związane z rozpowszechnianiem fałszywych treści generowanych przez AI, Google wprowadziło nowe narzędzie o nazwie SynthID Detector. Użytkownicy mogą przesyłać podejrzane pliki wideo lub audio, aby sprawdzić, czy zawierają one znak wodny SynthID, wskazujący na to, że treść została wygenerowana za pomocą sztucznej inteligencji. ([deepmind.google](https://deepmind.google/technologies/synthid/?utm_source=openai))

Podsumowanie

Wprowadzenie Veo 3 i Imagen 4 stanowi znaczący krok naprzód w dziedzinie generowania treści za pomocą sztucznej inteligencji. Te modele oferują twórcom nowe możliwości tworzenia wysokiej jakości wideo i obrazów, jednocześnie zapewniając autentyczność treści i przeciwdziałając rozpowszechnianiu fałszywych informacji. Google kontynuuje inwestycje w technologie AI, dążąc do dostarczania użytkownikom zaawansowanych i niezawodnych narzędzi do twórczości.

Komentarze

Zostaw komentarz