Google memperkenalkan Veo, generator video HD bertenaga AI yang dapat menyaingi Sora

Perbesar / Gambar diam diambil dari video yang dibuat oleh Google Veo.

Google/Bing Edwards

Google mengumumkannya pada hari Selasa di Google I/O 2024 Melihat, model sintesis video AI baru yang dapat membuat video resolusi tinggi dari teks, gambar, atau perintah video, mirip dengan Sora dari OpenAI. Ini dapat membuat video 1080p berdurasi lebih dari satu menit dan mengedit video berdasarkan instruksi tertulis, tetapi belum dirilis untuk digunakan secara luas.

Veo dilaporkan mencakup kemampuan untuk mengedit video yang ada menggunakan perintah teks, menjaga konsistensi visual di seluruh bingkai, membuat rangkaian video berdurasi hingga 60 detik dan lebih dari satu perintah atau serangkaian perintah yang membentuk sebuah narasi. Perusahaan mengatakan dapat membuat adegan mendetail dan menerapkan efek sinematik seperti selang waktu, bidikan udara, dan berbagai gaya visual

Sejak peluncuran DALL-E 2 pada bulan April 2022, kami telah melihat pameran montase foto dan montase video baru yang bertujuan untuk memungkinkan siapa saja yang dapat menulis deskripsi tertulis untuk membuat foto atau video mendetail. Meskipun tidak ada teknologi yang sepenuhnya dioptimalkan, generator gambar dan video AI terus berkembang menjadi lebih mumpuni.

Pada bulan Februari, kami meliput pratinjau generator video Sora OpenAI, yang pada saat itu diyakini banyak orang sebagai representasi video comcomiting bertenaga AI terbaik yang ditawarkan industri. Hal itu cukup mengesankan bagi Tyler Perry sehingga dia menghentikan perluasan studio filmnya. Namun, hingga saat ini, OpenAI belum memberikan akses publik terhadap alat tersebut, melainkan membatasi penggunaannya hanya pada kelompok penguji terpilih.

Kini, sekilas, Veo milik Google tampaknya mampu menghasilkan video serupa dengan apa yang dicapai Sora. Kami sendiri belum mencobanya, jadi kami hanya dapat melihat video demo pilihan yang disediakan oleh perusahaan Di situs webnya. Ini berarti bahwa siapa pun yang melihatnya harus menerima klaim Google dengan hati-hati, karena hasil pembuatannya mungkin tidak biasa.

READ Bahan menyalurkan energi mekanik ke arah yang disukai

Video-video khas dari Veo mencakup seorang koboi yang menunggang kuda, cuplikan cepat di jalan pinggiran kota, kebab yang dipanggang di atas panggangan, selang waktu pembukaan bunga matahari, dan banyak lagi. Jelas tidak ada penggambaran manusia secara mendetail, yang secara historis sulit dibuat oleh model gambar dan video bertenaga AI tanpa distorsi yang jelas.

Google mengatakan Veo dibangun berdasarkan model pembuatan video perusahaan sebelumnya, termasuk Generative Query Network (GQN), DVD-GAN, dan Imagen-Video. VinakiWalt, VideoPoet dan Lumiere. Untuk meningkatkan kualitas dan efisiensi, data pelatihan Veo menyertakan umpan balik video yang lebih detail, dan menggunakan representasi video “laten” terkompresi. Untuk meningkatkan kualitas pembuatan video Veo, Google telah menyertakan teks yang lebih detail untuk video yang digunakan untuk melatih Veo, sehingga memungkinkan AI untuk menafsirkan perintah dengan lebih akurat.

Veo juga tampak menonjol karena mendukung perintah pembuatan film: “Dengan perintah input video dan perintah pengeditan, seperti menambahkan kayak ke gambar udara garis pantai, Veo dapat menerapkan perintah tersebut ke video mentah dan membuat video baru yang diedit, kata perusahaan itu.

Meskipun demonya terlihat mengesankan pada pandangan pertama (terutama dibandingkan dengan Will Smith yang memakan spageti), Google mengakui kesulitan dalam membuat video AI. “Menjaga konsistensi visual dapat menjadi tantangan bagi model pembuatan video,” tulis perusahaan tersebut. “Karakter, objek, atau bahkan keseluruhan adegan dapat berkedip, melompat, atau berpindah secara tidak terduga antar bingkai, sehingga mengganggu pengalaman menonton Anda.”

Google telah mencoba untuk mengurangi kelemahan ini dengan “pengonversi propagasi laten yang canggih”, yang pada dasarnya hanyalah pembicaraan pemasaran yang tidak berarti dan tidak ada rinciannya. Namun perusahaan cukup percaya diri dengan modelnya Bekerja dengan aktor Donald Glover dan studionya, Gilga, untuk membuat film penjelasan buatan AI yang akan segera tayang perdana.

READ Sony meluncurkan voucher kredit PS Store baru untuk PS Plus

Awalnya, Veo akan tersedia untuk pembuat konten terpilih melaluinya Video FX, alat eksperimental baru yang tersedia di AI Test Kitchen Google, labs.google. Kreator dapat bergabung dalam daftar tunggu VideoFX untuk mendapatkan akses ke fitur Veo dalam beberapa minggu mendatang. Google berencana untuk mengintegrasikan beberapa kemampuan Veo ke dalam YouTube Shorts dan produk lainnya di masa depan.

Belum ada informasi dari mana Google memperoleh data pelatihan Veo (jika kami harus menebak, kemungkinan besar YouTube terlibat). Namun Google mengatakan pihaknya mengambil pendekatan “bertanggung jawab” terhadap Veo. Menurut perusahaan, “Video yang dibuat oleh Veo diberi tanda air ID Sintidaalat mutakhir kami untuk memberi tanda air dan mengidentifikasi konten yang dihasilkan AI, meneruskannya melalui filter keamanan dan pemeriksaan pelestarian yang membantu mengurangi risiko privasi, hak cipta, dan bias.”

Petrina Cicero

“Hipster-friendly explorer. Award-winning coffee enthusiast. Analyst. Problem solver. Troublemaker.”

Google memperkenalkan Veo, generator video HD bertenaga AI yang dapat menyaingi Sora

YouTube mengumumkan fitur kecerdasan buatan dari Google DeepMind untuk pembuat video pendek

Foto pabrik dari prototipe Switch 2 bocor

Fitur unggulan iOS 18: Peningkatan layar beranda menambah tingkat penyesuaian yang luar biasa pada iPhone [Video]

Vision-Box meluncurkan teknologi biometrik di Indonesia

Fed mempertaruhkan kemarahan Trump dengan penurunan suku bunga bersejarah

Ariana Grande, John Mulaney, Michael Keaton

Makhluk yang menjadi fosil mungkin bisa menjelaskan gambar membingungkan di dinding batu

Tinggalkan Balasan Batalkan balasan

More Stories