Semakin Canggih, OpenAI Kembangkan Fitur Baru Sora yang Mampu Ubah Teks Menjadi Video Berdurasi 1 Menit. Foto: Open AI Sora/Gizchina

TEKNO

Semakin Canggih, OpenAI Kembangkan Fitur Baru Sora yang Mampu Ubah Teks Menjadi Video Berdurasi 1 Menit

Sabtu 17 Feb 2024, 20:16 WIB

JAKARTA, POSKOTA.CO.ID - OpenAI semakin inovatif dengan kemampuan mengkonversi teks ke video yang sangat realistis.

Fitur baru yang disebut Sora mampu meningkatkan standar manfaat AI generatif dalam domain kreatif. Dilansir dari CNet pada Sabtu (17/2/2024), mirip dengan pengubah teks ke video Google, Lumiere, ketersediaan Sora masih terbatas.

Namun, perbedaannya dengan Lumiere adalah Sora dapat menghasilkan video berdurasi hingga 1 menit. Fitur ini, mengubah teks ke video, kini menjadi daya tarik terbaru dalam pengembangan AI generatif yang dilakukan oleh OpenAI, Google, Microsoft, dan perusahaan teknologi lainnya.

Tren penghasilan teks dan gambar diyakini akan memperkuat posisi pendapatan ketiga penyedia teknologi tersebut, diperkirakan mencapai 1,3 triliun dolar AS atau sekitar Rp 16 triliun pada tahun 2032 mendatang. 

Sebuah pengumuman resmi dari OpenAI menjelaskan bahwa Sora akan memberikan manfaat kepada para kreator visual, desainer, dan pembuat film. Pengujian Sora dianggap sangat krusial dalam menangani potensi deepfake yang muncul dalam penggunaan AI untuk pembuatan gambar dan video.

Selain mendapatkan umpan balik dari pihak luar organisasi, startup AI tersebut juga berkeinginan untuk berbagi kemampuannya guna memperluas eksplorasi dalam bidang AI.

Salah satu fitur yang mungkin membedakan Sora adalah kemampuannya untuk menafsirkan prompt yang panjang, dengan panjang hingga 135 kata. Video contoh yang dibagikan oleh OpenAI minggu lalu menunjukkan bahwa Sora mampu menciptakan berbagai karakter dan adegan, mulai dari manusia, hewan, monster berbulu, hingga pemandangan kota, lanskap, taman zen, dan bahkan New York City yang tenggelam di bawah air.

Hal ini dimungkinkan sebagian karena hasil karya sebelumnya dari OpenAI dengan model-model Dall-E dan GPT. Generator teks-ke-gambar Dall-E 3 diperkenalkan pada bulan September 2023 sebagai pengembangan besar dari Dall-E 2 tahun 2022, bersama dengan model AI terbaru OpenAI, GPT-4 Turbo yang dirilis pada November sebelumnya. 

Secara spesifik, Sora menerapkan metode rekapsulasi dari Dall-E 3, yang menurut OpenAI menghasilkan deskripsi yang sangat rinci untuk data latihan visual.

"Sora mampu menghasilkan adegan kompleks dengan beberapa karakter, jenis gerakan tertentu, dan detail akurat dari subjek dan latar belakang," tulis pos tersebut. Model ini memahami tidak hanya apa yang diminta pengguna dalam prompt, tetapi juga bagaimana hal-hal tersebut ada dalam dunia fisik," tulis OpenAI.

Video contoh yang dibagikan oleh OpenAI tampak sangat nyata - kecuali pada saat wajah manusia muncul dari jarak dekat atau ketika makhluk-makhluk laut sedang berenang, yang mungkin menyulitkan untuk membedakan mana yang nyata dan mana yang bukan.

Model ini juga dapat menghasilkan video dari gambar diam dan memperpanjang video yang ada atau mengisi bingkai yang hilang, mirip dengan yang dapat dilakukan oleh Lumiere. "Sora berfungsi sebagai dasar untuk model yang dapat memahami dan mensimulasikan dunia nyata, sebuah kemampuan yang kami percaya akan menjadi tonggak penting untuk mencapai AGI," lanjut OpenAI. 

AGI, singkatan dari kecerdasan buatan umum, merupakan bentuk AI yang lebih lanjut yang mendekati tingkat kecerdasan manusia dan memiliki kemampuan untuk menyelesaikan beragam tugas. Perusahaan seperti Meta dan DeepMind juga telah menunjukkan ketertarikan mereka dalam mencapai pencapaian ini.

Kekurangan Sora 

OpenAI mengakui bahwa Sora memiliki kelemahan, seperti kesulitan dalam menggambarkan detail sebuah adegan yang kompleks dan memahami hubungan sebab akibat. Sebagai contoh, seseorang mungkin menggigit sepotong kue, tetapi setelahnya, kue tersebut mungkin tidak menunjukkan bekas gigitan.

OpenAI belum memberikan informasi kapan Sora akan tersedia secara luas karena ingin mengambil beberapa langkah penting dalam hal keamanan terlebih dahulu. Ini mencakup memastikan kepatuhan dengan standar keamanan OpenAI yang ada, yang melarang kekerasan ekstrem, konten seksual, citra yang merugikan, pemakaian citra selebriti, dan melanggar hak kekayaan intelektual orang lain.

Tags:
Open AISorachat gptartificial intelligenceVideo Realistis

Insan Sujadi

Reporter

Insan Sujadi

Editor