Berita
Google meluncurkan model video AI baru Veo 3.1 dalam Flow dan API: Artinya bagi perusahaan
Seperti yang diharapkan setelah berhari-hari bocoran dan rumor online, Google telah melakukan hal itu Saya Memata-matai 3.1 diluncurkanmodel terbaru untuk pembuatan video AI, yang menawarkan serangkaian peningkatan kreatif dan teknis yang bertujuan untuk meningkatkan kontrol narasi, integrasi audio, dan realisme dalam video yang dihasilkan AI.
Meskipun pembaruan ini memperluas kemungkinan bagi penghobi dan pembuat konten dengan aplikasi pembuatan AI online Google, mengalirRilis ini juga menandakan peluang yang semakin besar bagi perusahaan, pengembang, dan tim kreatif yang mencari alat video yang dapat diskalakan dan disesuaikan.
Kualitasnya lebih tinggi, fisika lebih baik, harga sama seperti sebelumnya, serta fitur kontrol dan pengeditan lebih bertenaga dan beragam.
untukku Tes awal Tunjukkan bahwa ini adalah model yang kuat dan efektif yang langsung menyenangkan setiap generasi. Namun, tampilannya lebih sinematik, halus, dan sedikit lebih istimewa "industri" Secara default dari pesaing seperti Sora 2 baru OpenAI, yang dirilis akhir bulan lalu, yang mungkin diinginkan atau tidak diinginkan oleh pengguna tertentu (Sora unggul dalam seluler "jujur" Video gaya).
Kontrol yang diperluas atas narasi dan suara
Veo 3.1 dibangun berdasarkan pendahulunya, Veo 3 (Dirilis kembali pada Mei 2025) dengan peningkatan dukungan untuk dialog, suara sekitar, dan efek suara lainnya.
Pembuatan audio asli kini tersedia di beberapa fitur utama di Flow, termasuk Frame-to-Video, Video Components, Scale-up," Yang memberi pengguna kemampuan untuk: mengonversi gambar diam menjadi video; Gunakan elemen, karakter, dan objek dari beberapa gambar dalam satu video; Dan buat klip yang berdurasi lebih lama dari 8 detik pertama, hingga lebih dari 30 detik atau hingga +1 saat melanjutkan dari frame terakhir klip sebelumnya.
Sebelumnya, Anda harus menambahkan audio secara manual setelah menggunakan fitur ini.
Penambahan ini memberi pengguna kontrol lebih besar atas nada, emosi, dan penceritaan, kemampuan yang sebelumnya memerlukan pekerjaan pascaproduksi.
Dalam konteks perusahaan, tingkat kontrol ini dapat mengurangi kebutuhan akan saluran audio terpisah, sehingga menyediakan cara terintegrasi untuk membuat konten pelatihan, video pemasaran, atau pengalaman digital dengan audio dan visual yang tersinkronisasi.
Google menunjukkannya Entri blog Pembaruan ini mencerminkan masukan pengguna yang menyerukan kontrol teknis yang lebih dalam dan dukungan audio yang lebih baik. Gallegos menekankan pentingnya melakukan penyesuaian dan peningkatan secara langsung di Flow, tanpa mengerjakan ulang adegan dari awal.
Kemampuan input dan pengeditan yang lebih kaya
Dengan Veo 3.1, Google memperkenalkan dukungan untuk berbagai jenis masukan dan kontrol yang lebih tepat atas keluaran yang dihasilkan. Formulir menerima perintah teks, gambar dan video sebagai masukan, dan juga mendukung:
-
Foto referensi (maksimal tiga) Untuk memandu tampilan dan nuansa hasil akhir
-
Interpolasi bingkai pertama dan terakhir Untuk membuat adegan mulus antara titik akhir tetap
-
Ekstensi adegan Yang meneruskan aksi atau pergerakan klip video melebihi durasinya saat ini
Alat-alat ini bertujuan untuk memberikan pengguna perusahaan cara untuk menyempurnakan tampilan dan nuansa konten mereka, yang berguna untuk mencapai konsistensi merek atau mengikuti ringkasan kreatif.
Kemampuan tambahan seperti “Sisipkan” (menambahkan objek ke adegan) dan “Menghapus” (menghapus objek atau karakter) juga ditawarkan, meskipun tidak semuanya langsung tersedia melalui API Gemini.
Penerbitan lintas platform
Veo 3.1 dapat diakses melalui beberapa layanan Google AI:
-
mengalirAntarmuka Google sendiri untuk membuat film dengan bantuan kecerdasan buatan
-
API Geminiditujukan untuk pengembang yang membangun kemampuan video ke dalam aplikasi
-
Kecerdasan Buatan Vertexdi mana integrasi perusahaan akan segera mendukung “Scene Extension” Veo dan fitur-fitur utama lainnya
Ketersediaan melalui platform ini memungkinkan pelanggan perusahaan untuk memilih lingkungan yang tepat – berbasis GUI atau otomatis – berdasarkan tim dan alur kerja mereka.
Harga dan akses
Model Veo 3.1 saat ini sudah ada Pratinjau Ini hanya tersedia di Kelas berbayar API Gemini. Struktur biayanya sama dengan Veo 3, model video AI generasi sebelumnya dari Google.
-
Bentuk standar: $0,40 per detik video
-
Model cepat: $0,15 per detik
Tidak ada tingkat gratis, dan pengguna hanya dikenakan biaya jika video berhasil dibuat. Model ini kompatibel dengan rilis Veo sebelumnya dan memberikan harga yang dapat diprediksi untuk tim perusahaan yang sadar anggaran.
Spesifikasi teknis dan kontrol keluaran
Veo 3.1 mengeluarkan video pada Resolusi 720p atau 1080pbersama Kecepatan bingkai 24 fps.
Opsi durasi disertakan 4, 6 atau 8 detik Dari pesan teks atau foto yang diunggah, bahkan hingga kemampuan memanjangkan klip video 148 detik (lebih dari dua setengah menit!) Saat menggunakan fitur “Perluas”.
Fungsionalitas baru juga mencakup kontrol yang lebih ketat terhadap tema dan lingkungan. Misalnya, organisasi dapat mengunggah gambar produk atau referensi visual, dan Veo 3.1 akan membuat adegan yang mempertahankan tampilan dan isyarat gaya di sepanjang video. Hal ini dapat menyederhanakan lini produksi kreatif untuk tim ritel, periklanan, dan produksi konten virtual.
Reaksi awal
Komunitas pembuat dan pengembang yang lebih luas menanggapi peluncuran Veo 3.1 dengan optimisme dan kritik ringan – terutama jika dibandingkan dengan model pesaing seperti Sora 2 dari OpenAI.
Matt Schumer Salah satu pendiri AI/Hyperwrite lainnya, dan pengguna awal, menggambarkan reaksi awalnya sebagai “kekecewaan”, dengan menyatakan bahwa Veo 3.1 “jauh lebih buruk daripada Sora 2” dan juga “sedikit lebih mahal.”
Namun, dia mengakui bahwa alat Google, seperti dukungan referensi dan ekstensi adegan, adalah titik terang dalam rilis ini.
Travis Davidsseorang seniman digital 3D dan pembuat konten bertenaga AI, menyampaikan pendapat serupa. Meskipun ia mencatat peningkatan dalam kualitas audio, terutama dalam efek suara dan dialog, ia menyampaikan kekhawatiran tentang keterbatasan yang masih ada dalam sistem.
Hal ini termasuk kurangnya dukungan audio khusus, ketidakmampuan untuk memilih suara yang dihasilkan secara langsung, dan persistensi maksimal pada generasi 8 detik – meskipun ada beberapa klaim umum tentang output yang lebih lama.
Davids juga mencatat bahwa konsistensi karakter dalam perubahan sudut kamera masih memerlukan stimulasi yang tepat, sedangkan model lain seperti Sora 2 menangani hal ini dengan lebih otomatis. Dia mempertanyakan kurangnya resolusi 1080p untuk pengguna tingkat berbayar seperti Flow Pro dan menyatakan keraguan tentang paritas fitur.
Di sisi yang lebih positif, @kemonismos, Penulis buletin AI menyatakan bahwa “Veo 3.1 sangat bagus”, meskipun ia tetap menyimpulkan bahwa model terbaru OpenAI tetap menjadi yang terbaik secara keseluruhan.
Secara kolektif, kesan awal ini menunjukkan bahwa meskipun Veo 3.1 menawarkan peningkatan alat yang berguna dan fitur kontrol kreatif baru, ekspektasi telah berubah seiring dengan peningkatan standar kualitas dan kemudahan penggunaan oleh pesaing.
Adopsi dan pengukuran
Sejak meluncurkan Flow lima bulan lalu, Google telah menyatakannya berakhir 275 juta video Dibuat di berbagai model Veo.
Kecepatan penerapannya menunjukkan minat yang signifikan tidak hanya dari individu tetapi juga dari pengembang dan perusahaan yang bereksperimen dengan pembuatan konten otomatis.
Thomas Iljic, direktur manajemen produk di Google Labs, menyoroti bahwa Veo 3.1 mendekatkan kemampuannya dengan cara pembuat film merencanakan dan mengambil gambar. Hal ini mencakup komposisi adegan, kontinuitas di seluruh pengambilan gambar, dan audio yang diatur – yang semuanya merupakan area yang semakin ingin diotomatisasi atau disederhanakan oleh organisasi.
Keamanan dan penggunaan kecerdasan buatan secara bertanggung jawab
Video yang dibuat dengan Veo 3.1 diberi tanda air dengan Google ID Sintida Teknologi, yang mencakup pengenal yang tidak terlihat untuk menunjukkan bahwa konten tersebut dihasilkan oleh kecerdasan buatan.
Google menerapkan filter keamanan dan moderasi di seluruh API-nya untuk membantu mengurangi risiko privasi dan hak cipta. Konten yang dibuat di-cache dan dihapus setelah dua hari kecuali diunduh.
Bagi pengembang dan perusahaan, fitur-fitur ini memberikan kepastian mengenai asal usul dan kepatuhan – yang sangat penting dalam industri yang teregulasi atau sensitif terhadap merek.
Dimana Veo 3.1 berdiri di antara model video AI yang paling ramai
Veo 3.1 bukan hanya pengulangan model sebelumnya — ini mewakili integrasi yang lebih dalam dari input multimedia, kontrol bercerita, dan alat tingkat perusahaan. Meskipun profesional kreatif mungkin merasakan manfaat langsung dalam pengeditan dan ketepatan alur kerja, perusahaan yang mengeksplorasi otomatisasi dalam pelatihan, periklanan, atau pengalaman virtual mungkin mendapatkan manfaat lebih besar dalam konfigurasi model dan dukungan API.
Masukan pengguna awal menyoroti bahwa meskipun Veo 3.1 menyediakan alat yang berharga, ekspektasi seputar realisme, kontrol suara, dan durasi generasi berkembang pesat. Saat Google memperluas jangkauannya dengan Vertex AI dan terus menyempurnakan Veo, posisi kompetitifnya dalam pembuatan video perusahaan akan bergantung pada seberapa cepat Google mengatasi permasalahan pengguna ini.