Google mengumumkannya pada hari Selasa di Google I/O 2024 Melihat, model sintesis video AI baru yang dapat membuat video resolusi tinggi dari teks, gambar, atau perintah video, mirip dengan Sora dari OpenAI. Ini dapat membuat video 1080p berdurasi lebih dari satu menit dan mengedit video berdasarkan instruksi tertulis, tetapi belum dirilis untuk digunakan secara luas.
Veo dilaporkan mencakup kemampuan untuk mengedit video yang ada menggunakan perintah teks, menjaga konsistensi visual di seluruh bingkai, membuat rangkaian video berdurasi hingga 60 detik dan lebih dari satu perintah atau serangkaian perintah yang membentuk sebuah narasi. Perusahaan mengatakan dapat membuat adegan mendetail dan menerapkan efek sinematik seperti selang waktu, bidikan udara, dan berbagai gaya visual
Sejak peluncuran DALL-E 2 pada bulan April 2022, kami telah melihat pameran montase foto dan montase video baru yang bertujuan untuk memungkinkan siapa saja yang dapat menulis deskripsi tertulis untuk membuat foto atau video mendetail. Meskipun tidak ada teknologi yang sepenuhnya dioptimalkan, generator gambar dan video AI terus berkembang menjadi lebih mumpuni.
Pada bulan Februari, kami meliput pratinjau generator video Sora OpenAI, yang pada saat itu diyakini banyak orang sebagai representasi video comcomiting bertenaga AI terbaik yang ditawarkan industri. Hal itu cukup mengesankan bagi Tyler Perry sehingga dia menghentikan perluasan studio filmnya. Namun, hingga saat ini, OpenAI belum memberikan akses publik terhadap alat tersebut, melainkan membatasi penggunaannya hanya pada kelompok penguji terpilih.
Kini, sekilas, Veo milik Google tampaknya mampu menghasilkan video serupa dengan apa yang dicapai Sora. Kami sendiri belum mencobanya, jadi kami hanya dapat melihat video demo pilihan yang disediakan oleh perusahaan Di situs webnya. Ini berarti bahwa siapa pun yang melihatnya harus menerima klaim Google dengan hati-hati, karena hasil pembuatannya mungkin tidak biasa.
Video-video khas dari Veo mencakup seorang koboi yang menunggang kuda, cuplikan cepat di jalan pinggiran kota, kebab yang dipanggang di atas panggangan, selang waktu pembukaan bunga matahari, dan banyak lagi. Jelas tidak ada penggambaran manusia secara mendetail, yang secara historis sulit dibuat oleh model gambar dan video bertenaga AI tanpa distorsi yang jelas.
Google mengatakan Veo dibangun berdasarkan model pembuatan video perusahaan sebelumnya, termasuk Generative Query Network (GQN), DVD-GAN, dan Imagen-Video. VinakiWalt, VideoPoet dan Lumiere. Untuk meningkatkan kualitas dan efisiensi, data pelatihan Veo menyertakan umpan balik video yang lebih detail, dan menggunakan representasi video “laten” terkompresi. Untuk meningkatkan kualitas pembuatan video Veo, Google telah menyertakan teks yang lebih detail untuk video yang digunakan untuk melatih Veo, sehingga memungkinkan AI untuk menafsirkan perintah dengan lebih akurat.
Veo juga tampak menonjol karena mendukung perintah pembuatan film: “Dengan perintah input video dan perintah pengeditan, seperti menambahkan kayak ke gambar udara garis pantai, Veo dapat menerapkan perintah tersebut ke video mentah dan membuat video baru yang diedit, kata perusahaan itu.
Meskipun demonya terlihat mengesankan pada pandangan pertama (terutama dibandingkan dengan Will Smith yang memakan spageti), Google mengakui kesulitan dalam membuat video AI. “Menjaga konsistensi visual dapat menjadi tantangan bagi model pembuatan video,” tulis perusahaan tersebut. “Karakter, objek, atau bahkan keseluruhan adegan dapat berkedip, melompat, atau berpindah secara tidak terduga antar bingkai, sehingga mengganggu pengalaman menonton Anda.”
Google telah mencoba untuk mengurangi kelemahan ini dengan “pengonversi propagasi laten yang canggih”, yang pada dasarnya hanyalah pembicaraan pemasaran yang tidak berarti dan tidak ada rinciannya. Namun perusahaan cukup percaya diri dengan modelnya Bekerja dengan aktor Donald Glover dan studionya, Gilga, untuk membuat film penjelasan buatan AI yang akan segera tayang perdana.
Awalnya, Veo akan tersedia untuk pembuat konten terpilih melaluinya Video FX, alat eksperimental baru yang tersedia di AI Test Kitchen Google, labs.google. Kreator dapat bergabung dalam daftar tunggu VideoFX untuk mendapatkan akses ke fitur Veo dalam beberapa minggu mendatang. Google berencana untuk mengintegrasikan beberapa kemampuan Veo ke dalam YouTube Shorts dan produk lainnya di masa depan.
Belum ada informasi dari mana Google memperoleh data pelatihan Veo (jika kami harus menebak, kemungkinan besar YouTube terlibat). Namun Google mengatakan pihaknya mengambil pendekatan “bertanggung jawab” terhadap Veo. Menurut perusahaan, “Video yang dibuat oleh Veo diberi tanda air ID Sintidaalat mutakhir kami untuk memberi tanda air dan mengidentifikasi konten yang dihasilkan AI, meneruskannya melalui filter keamanan dan pemeriksaan pelestarian yang membantu mengurangi risiko privasi, hak cipta, dan bias.”
“Penjelajah ramah hipster. Penggemar kopi pemenang penghargaan. Analis. Pemecah masalah. Pembuat masalah.”
More Stories
Microsoft mengatakan Call of Duty: Black Ops 6 mencetak rekor untuk jumlah “penambahan pelanggan Game Pass pada hari peluncuran.”
Unduhan Call of Duty: Black Ops 6 memaksimalkan penggunaan internet Anda
Apple diperkirakan akan meluncurkan MacBook Pro baru hari ini dengan fitur-fitur ini