Google resmi mengintegrasikan tiga model AI unggulannya—Gemini, Imagen 3, dan Veo 2—ke dalam platform Vertex AI. Langkah ini memungkinkan pengguna membuat video sinematik hanya dari ide teks, tanpa perlu peralatan mahal atau proses produksi rumit.
Pengumuman ini disampaikan Google dalam ajang Google I/O 2025. Dengan menggabungkan kemampuan teks dari Gemini, pencitraan dari Imagen 3, dan pembuatan video dari Veo 2, Vertex AI kini menawarkan alur kerja pembuatan konten yang lebih cepat dan efisien.
Veo 2, dikembangkan oleh DeepMind, mampu menghasilkan video berdurasi delapan detik dalam resolusi 720p hanya dari teks atau gambar. Model ini mendukung gaya visual beragam, kontrol kamera, dan gerakan realistis.
Sementara itu, Imagen 3 menghasilkan gambar fotorealistik dari perintah teks, dengan peningkatan signifikan dalam detail visual dan pengurangan artefak. Model ini juga mendukung perintah dalam berbagai bahasa.
Gemini, model multimodal Google, berperan sebagai pengatur alur kerja, memungkinkan transisi mulus dari teks ke gambar hingga video dalam satu platform terintegrasi. Menurut Google, hal ini bertujuan mempercepat produksi, menekan biaya, dan mempertahankan kualitas tinggi.
“Ini bukan hanya soal efisiensi, tapi juga demokratisasi kreativitas,” kata juru bicara Google Cloud dalam pernyataan resminya. “Kami ingin semua kreator, termasuk dari pasar negara berkembang, bisa bersaing secara global.”
Dengan hadirnya integrasi ini, Google berharap dapat memberdayakan komunitas kreatif global—termasuk storyteller lokal—untuk menghasilkan konten profesional dengan lebih mudah. Vertex AI kini menjadi pusat kekuatan AI Google dalam dunia produksi multimedia.