Vidu, yang dapat diakses melalui web resminya, memungkinkan pengguna untuk menghasilkan klip video pendek hanya dengan memasukkan perintah teks dalam bahasa China atau Inggris.
Pengguna yang terdaftar pada layanan ini dapat membuat klip berdurasi empat atau delapan detik.
Shengshu mengklaim bahwa Vidu mampu menghasilkan klip berdurasi empat detik dalam waktu hanya 30 detik, jauh lebih cepat dibandingkan dengan alat sejenis lainnya.
Perusahaan yang berpusat di Beijing ini pertama kali meluncurkan Vidu pada bulan April, hanya dua bulan setelah OpenAI mengumumkan model video Sora, yang menampilkan beberapa klip pratinjau terpilih.
Di balik kecepatan dan kemampuan Vidu yang mengesankan, terdapat dukungan kuat dari Universitas Tsinghua, salah satu universitas paling bergengsi di Tiongkok.
Tim Shengshu AI dipimpin ilmuwan Zhu Jun, profesor ilmu komputer Universitas Tsinghua.
Penulis lainnya dari Tsinghua, Bao Fan yang saat ini menjabat kepala bagian teknologi Shengshu, dan Kepala eksekutif Shengshu, Tang Jiayu merupakan lulusan jurusan ilmu komputer dan teknologi Tsinghua.
Baca Juga: SMA Islam Al Ishlah Bukittinggi, Efektivitas Penggunaan Video Pembelajaran di Sekolah
Dalam April lalu, Tang mengatakan kepada media setempat bahwa akan lebih mudah bagi perusahaan-perusahaan Tiongkok untuk mengejar Sora daripada GPT-4, model bahasa besar canggih OpenAI yang merupakan teknologi di balik ChatGPT.
Arsitektur yang mendasari Vidu, U-ViT, dikembangkan oleh tim ini dan telah dipublikasikan dalam makalah penelitian pada September 2022.
Shengshu tidak hanya berfokus pada pengembangan teknologi yang canggih, tetapi juga pada komersialisasi.
Baca Juga: Video Promosi Objek Wisata bakal Diputar di Hotel dan Restoran
"Selain teks dan gambar ke video, Vidu telah menambahkan fungsi yang meletakkan dasar bagi komersialisasi teknologi karena potensi penggunaannya dalam industri animasi dan konten," kata Zhang Xudong, direktur produk di Shengshu AI, dalam sebuah wawancara dengan Post.
Perusahaan tersebut telah menambahkan fitur karakter ke video. Artinya, alat AI ini memungkinkan pengguna menghidupkan karakter animasi atau orang nyata dengan perintah teks sederhana. Fitur ini membuka potensi besar untuk aplikasi di industri animasi dan konten.
“Di masa mendatang, kami berharap (pengguna) dapat mengunggah beberapa karakter dan (mendeskripsikan) adegan, serta membuat mereka berakting dalam adegan tersebut. Mirip dengan cara produksi film,” kata Zhang. “Tujuan kami adalah mengintegrasikan perangkat AI dengan sektor tradisional,” tambahnya seperti dilansir SCMP.
Shengshu yang telah mengumpulkan puluhan juta dolar AS, mengandalkan Qiming Venture Partners, raksasa pencarian Baidu, afiliasi fintech Alibaba Group Holding, Ant Group, dan Beijing AI Industry Investment Fund sebagai pendukungnya.(*)