Google obniża koszty i wzmacnia możliwości wideo modeli Veo 3

Google obniża koszty i wzmacnia możliwości wideo modeli Veo 3

0 Komentarze Marek Wójcik

3 Minuty

Google obniża koszty i wzmacnia możliwości wideo modeli Veo 3

Google wprowadził istotną aktualizację rodziny modeli generujących wideo Veo 3, ogłaszając obniżki cen oraz nowe funkcje formatów wyjściowych w Gemini API. Zarówno Veo 3, jak i Veo 3 Fast są już traktowane jako stabilne rozwiązania do skalowanej produkcji, co oznacza ich przejście z fazy eksperymentalnej do szerokiego wdrożenia komercyjnego.

Zmiany w cenach: tańsza generacja wideo i dźwięku AI

Najważniejszą zmianą jest koszt. Obecnie generowanie wideo i dźwięku przez Veo 3 kosztuje 0,40 USD za sekundę zamiast dotychczasowych 0,75 USD. Cena Veo 3 Fast została obniżona z 0,40 USD na 0,15 USD za sekundę. Według Google, nowe stawki obowiązują natychmiastowo, co obniża próg wejścia dla twórców, studiów oraz firm testujących procesy produkcji wideo oparte o sztuczną inteligencję.

Nowe opcje formatu i jakości

Obsługa pionowych wideo (9:16)

W odpowiedzi na rosnące zapotrzebowanie mobilne, zarówno Veo 3, jak i Veo 3 Fast obsługują teraz proporcje obrazu 9:16. Programiści mogą generować pionowe treści zoptymalizowane pod media społecznościowe, ustawiając parametr "aspectRatio" na "9:16" — to umożliwia natywną publikację w Reels, Shorts i Stories.

Wyjście w wyższej rozdzielczości (1080p)

Architektura Veo 3 umożliwia generowanie wideo w jakości 4K, jednak w Gemini API początkowo była limitowana do 720p. Teraz modele mogą tworzyć materiały w 1080p, gdy parametr "resolution" jest ustawiony na "1080p". Warto zauważyć, że opcja 1080p jest obecnie dostępna tylko dla proporcji 16:9.

Funkcje, porównania i przewagi

Veo 3, zaprezentowany podczas Google I/O 2025, został szeroko przyjęty jako odpowiedź na postępy konkurencji, m.in. modeli Sora od OpenAI. W porównaniu do Veo 2, nowa generacja oferuje większą kontrolę twórczą, wyższy realizm, lepsze modelowanie fizyki oraz precyzyjniejsze odwzorowanie poleceń. Kluczowe funkcje to m.in. konwersja obrazu na wideo oraz natywne, zsynchronizowane generowanie dźwięku — przydatne np. przy szybkim prototypowaniu, automatycznej produkcji treści czy w interaktywnych aplikacjach medialnych.

Veo 3 Fast stawia na szybkość i niższe koszty, dzięki czemu jest idealnym wyborem dla dużych projektów lub zastosowań wymagających natychmiastowego generowania, gdzie kluczowa jest wydajność.

Przykłady zastosowania i znaczenie rynkowe

Wprowadzone zmiany są istotne dla programistów, reklamodawców, platform społecznościowych i firm medialnych eksperymentujących z generatywnym wideo AI. Niższe ceny oraz obsługa pionowych formatów sprawiają, że Veo 3 staje się atrakcyjną opcją m.in. do krótkich klipów społecznościowych, reklam, automatycznych podsumowań wideo czy funkcji w aplikacjach. Veo 3 już teraz wspiera funkcje takie jak ośmiosekundowe filmy w Gemini, Google Vids, Flow czy konwersję zdjęć na wideo w Google Photos, a jego dostępność wzrosła z początkowych 70 krajów do aż 140 regionów.

Wdrożenie i dostępność

Google uruchomił płatny publiczny preview Veo 3 dla Gemini API oraz Vertex AI w lipcu. Teraz, gdy modele uzyskały status stabilnych do skalowanej produkcji, firmy i twórcy mogą pewniej zintegrować generowanie wideo AI w swoich liniach produkcyjnych, silnikach treści i aplikacjach skierowanych do użytkowników.

Podsumowując, aktualizacja obniża koszty, otwiera nowe formaty pionowe i 1080p oraz wzmacnia pozycję Veo 3 jako gotowego do produkcji narzędzia na rozwijającym się rynku generatywnego wideo AI.

Źródło: developers.googleblog

Hej, tu Marek! Pasjonuję się AI i światem gier. Piszę o trendach, testuję nowe narzędzia i chętnie dzielę się swoją opinią o cyfrowej przyszłości.

Komentarze

Zostaw komentarz