Pada hari Jumat, Meta mengumumkan pratinjau Film umumserangkaian model AI baru yang dirancang untuk membuat dan memproses video, audio, dan gambar, termasuk membuat video fotorealistik dari satu gambar seseorang. Perusahaan mengklaim bahwa model tersebut mengungguli model hamparan video lainnya saat dievaluasi oleh manusia, sehingga membawa kita lebih dekat ke masa depan di mana siapa pun dapat menampilkan video lengkap tentang subjek apa pun sesuai permintaan.
Perusahaan ini belum memiliki rencana kapan atau bagaimana mereka akan merilis kemampuan ini ke publik, namun Meta mengatakan Movie Gen adalah alat yang memungkinkan orang untuk “meningkatkan kreativitas bawaan mereka” daripada menggantikan seniman dan animator manusia. Perusahaan membayangkan aplikasi masa depan seperti membuat dan mengedit video “sehari-hari” dengan mudah untuk platform media sosial atau membuat ucapan selamat ulang tahun animasi khusus.
Movie Gen dibangun berdasarkan karya Meta sebelumnya dalam pengomposisian video, mengikuti generator video Make-A-Scene tahun 2022 dan model pengomposisian foto Emu. Dengan menggunakan petunjuk teks untuk petunjuk, sistem terbaru ini dapat membuat video yang dipersonalisasi dengan suara pertama kali, mengedit dan menyisipkan perubahan ke dalam video yang sudah ada, dan mengubah foto orang menjadi video pribadi yang realistis.
Meta bukan satu-satunya permainan di kota ini dalam hal pembuatan komposisi video AI. Google memamerkan model baru yang disebut “Veo” pada bulan Mei, dan Meta mengatakan bahwa dalam pengujian preferensi manusia, keluaran Movie Gen mengungguli Sora OpenAI, Runway Gen-3, dan model video Tiongkok. Kling.
Model pembuatan video Movie Gen dapat membuat video HD 1080p hingga 16 detik pada 16 frame per detik dari deskripsi teks atau input gambar. Meta mengklaim bahwa model tersebut dapat menangani konsep kompleks seperti pergerakan objek, interaksi subjek-objek, dan pergerakan kamera.
Namun, seperti yang telah kita lihat pada generator video AI sebelumnya, kemampuan Movie Gen untuk membuat adegan kohesif seputar topik tertentu kemungkinan besar akan bergantung pada konsep dalam contoh video yang digunakan Meta untuk melatih model sintesis videonya. Perlu dicatat bahwa hasil dari generator video sering kali berbeda secara signifikan dari hasil biasanya, dan untuk mendapatkan hasil yang konsisten mungkin memerlukan banyak percobaan dan kesalahan.
“Penjelajah ramah hipster. Penggemar kopi pemenang penghargaan. Analis. Pemecah masalah. Pembuat masalah.”
More Stories
Microsoft mengatakan Call of Duty: Black Ops 6 mencetak rekor untuk jumlah “penambahan pelanggan Game Pass pada hari peluncuran.”
Unduhan Call of Duty: Black Ops 6 memaksimalkan penggunaan internet Anda
Apple diperkirakan akan meluncurkan MacBook Pro baru hari ini dengan fitur-fitur ini