ByteDance, perusahaan teknologi di balik platform media sosial TikTok, baru saja meluncurkan model kecerdasan buatan (AI) terbaru bernama OmniHuman-1, yang memiliki kemampuan untuk membuat video dinamis yang sangat mirip dengan aslinya.
ByteDance mengatakan bahwa OmniHuman-1 menggunakan teknologi deepfake, memungkinkan pembuatan video dengan gerakan yang sangat halus dan sulit untuk dikenali sebagai produk AI. Perusahaan ini dengan percaya diri menyatakan bahwa alat AI mereka dapat menciptakan hasil dengan kualitas yang jauh lebih unggul dibandingkan dengan alat AI pembuat video lainnya yang ada saat ini.
Menurut para peneliti ByteDance, OmniHuman-1 hanya memerlukan satu gambar dan suara unik sebagai contoh, seperti suara atau vokal seseorang. Berdasarkan data ini, alat AI dapat menciptakan video dengan durasi bebas, dengan suara atau vokal yang identik dengan contoh awal.
OmniHuman-1 juga dapat menyunting dan memodifikasi video yang sudah ada untuk mengubah isi video asli.
Selain itu, OmniHuman-1 memungkinkan pengguna untuk menciptakan video baru dengan berbagai gaya visual dan audio, seperti video animasi, gaya film, atau video yang terlihat seperti manusia nyata.
Pengguna cukup memberikan permintaan tentang rasio aspek, proporsi tubuh (potret, setengah tubuh, penuh tubuh, atau semua dalam satu), dan alat AI ini dapat menciptakan video dengan tingkat realisme tertinggi, termasuk gerakan, cahaya, dan detail lingkungan sekitar…
Sementara itu, ByteDance belum secara resmi merilis OmniHuman-1 kepada publik, perusahaan telah membagikan beberapa video contoh yang dibuat oleh alat ini.
Salah satu video berdurasi 23 detik dibuat dari gambar Albert Einstein, di mana ilmuwan terkenal ini tampaknya memberikan pidato dengan gerakan wajah dan bibir yang sangat nyata.
Banyak video pendek lainnya yang dibuat oleh OmniHuman-1 menunjukkan orang-orang berbicara dengan gerakan dan ekspresi wajah yang sangat mirip dengan manusia nyata.
Video contoh yang menggambarkan kemampuan OmniHuman-1 telah membuat komunitas online dan dunia teknologi terkejut. Banyak orang mengakui bahwa ini adalah video palsu yang paling mirip dengan aslinya yang pernah mereka lihat.
Para peneliti ByteDance mengatakan bahwa mereka telah membangun model AI dengan kemampuan untuk mencampur data dari gambar, video, dan suara untuk menciptakan video yang sangat nyata, dengan proporsi wajah, tubuh, serta ekspresi wajah dan gerakan yang mirip dengan manusia.
Grup penelitian mengatakan bahwa video yang dihasilkan oleh AI memiliki wajah, gerakan kepala, dan gerakan tubuh yang natural, cocok dengan suara dan lingkungan sekitarnya, meningkatkan tingkat “kesesuaian” dalam video.
ByteDance masih belum mengungkapkan waktu peluncuran resmi OmniHuman-1 kepada pengguna.
Kehadiran OmniHuman-1 menunjukkan kemampuan luar biasa dari alat AI yang berasal dari Tiongkok, tetapi banyak orang khawatir bahwa OmniHuman-1 dapat dimanfaatkan untuk tujuan buruk, seperti menciptakan video palsu dari selebriti untuk menyebarkan informasi salah, melakukan penipuan, atau bahkan menciptakan video porno palsu untuk pemerasan.
Persaingan dalam pengembangan AI semakin ketat antara Amerika Serikat dan Tiongkok, saat kedua negara besar ini terus meluncurkan alat AI dengan fitur superior untuk mengalahkan satu sama lain.
Baru-baru ini, OpenAI juga telah mengintegrasikan fitur baru ke ChatGPT, memungkinkan alat ini menyelesaikan laporan dalam beberapa menit dari jumlah data besar, yang biasanya membutuhkan banyak waktu bagi manusia untuk diselesaikan.
Deepfake adalah teknologi kecerdasan buatan yang menggunakan teknik penggabungan gambar dari seseorang untuk menggabungkan dan menempelkan wajah pada video atau gambar orang lain.
Deepfake akan melewati proses “pengajaran,” berdasarkan data input untuk membuat model dan memilih algoritma yang tepat untuk terus diproses dan dipelajari dari model-model tersebut. Setelah beberapa waktu “mengajar,” deepfake dapat menggabungkan wajah dengan akurasi tinggi sehingga sulit dikenali oleh mata telanjang.