Startup AI Tiongkok Luncurkan Vidu yang Bisa Mengubah Teks jadi Video dalam Sekejap

Klip demo yang dirilis oleh Shengshu AI menunjukkan kemampuan alat pengubah teks ke video Vidu. (Foto: SC Youtube)

PADEK.JAWAPOS.COM-Perang AI semakin sengit! Perusahaan rintisan kecerdasan buatan (AI) asal Tiongkok, Shengshu meluncurkan alat konversi teks ke video terbarunya, Vidu. Alat ini bakal bersaing dengan model AI generatif Sora milik OpenAI.

Vidu, yang dapat diakses melalui web resminya, memungkinkan pengguna untuk menghasilkan klip video pendek hanya dengan memasukkan perintah teks dalam bahasa China atau Inggris.

Pengguna yang terdaftar pada layanan ini dapat membuat klip berdurasi empat atau delapan detik.

Shengshu mengklaim bahwa Vidu mampu menghasilkan klip berdurasi empat detik dalam waktu hanya 30 detik, jauh lebih cepat dibandingkan dengan alat sejenis lainnya.

Perusahaan yang berpusat di Beijing ini pertama kali meluncurkan Vidu pada bulan April, hanya dua bulan setelah OpenAI mengumumkan model video Sora, yang menampilkan beberapa klip pratinjau terpilih.

Di balik kecepatan dan kemampuan Vidu yang mengesankan, terdapat dukungan kuat dari Universitas Tsinghua, salah satu universitas paling bergengsi di Tiongkok.

Tim Shengshu AI dipimpin ilmuwan Zhu Jun, profesor ilmu komputer Universitas Tsinghua.

Penulis lainnya dari Tsinghua, Bao Fan yang saat ini menjabat kepala bagian teknologi Shengshu, dan Kepala eksekutif Shengshu, Tang Jiayu merupakan lulusan jurusan ilmu komputer dan teknologi Tsinghua.

Dalam April lalu, Tang mengatakan kepada media setempat bahwa akan lebih mudah bagi perusahaan-perusahaan Tiongkok untuk mengejar Sora daripada GPT-4, model bahasa besar canggih OpenAI yang merupakan teknologi di balik ChatGPT.

Arsitektur yang mendasari Vidu, U-ViT, dikembangkan oleh tim ini dan telah dipublikasikan dalam makalah penelitian pada September 2022.

Shengshu tidak hanya berfokus pada pengembangan teknologi yang canggih, tetapi juga pada komersialisasi.

"Selain teks dan gambar ke video, Vidu telah menambahkan fungsi yang meletakkan dasar bagi komersialisasi teknologi karena potensi penggunaannya dalam industri animasi dan konten," kata Zhang Xudong, direktur produk di Shengshu AI, dalam sebuah wawancara dengan Post.

Perusahaan tersebut telah menambahkan fitur karakter ke video. Artinya, alat AI ini memungkinkan pengguna menghidupkan karakter animasi atau orang nyata dengan perintah teks sederhana. Fitur ini membuka potensi besar untuk aplikasi di industri animasi dan konten.

“Di masa mendatang, kami berharap (pengguna) dapat mengunggah beberapa karakter dan (mendeskripsikan) adegan, serta membuat mereka berakting dalam adegan tersebut. Mirip dengan cara produksi film,” kata Zhang. “Tujuan kami adalah mengintegrasikan perangkat AI dengan sektor tradisional,” tambahnya seperti dilansir SCMP.

Shengshu yang telah mengumpulkan puluhan juta dolar AS, mengandalkan Qiming Venture Partners, raksasa pencarian Baidu, afiliasi fintech Alibaba Group Holding, Ant Group, dan Beijing AI Industry Investment Fund sebagai pendukungnya.(*)

Editor : Heri Sugiarto

Berita Terkait