Beberapa hari yang lalu, Google sekali lagi menarik perhatian para penggemar AI dengan mengumumkan Gemini 1.5 hanya seminggu setelah merilis model Gemini 1.0 Ultra yang kuat dan mengganti nama chatbot Bard menjadi Gemini.
Namun, OpenAI tidak membiarkan Google menikmati posisi yang kuat di bidang AI bahkan selama sehari. Para pencipta ChatGPT mengungkapkan solusi yang bahkan lebih menarik: Sora, sebuah generator video yang mampu membuat video hampir sepanjang satu menit berdasarkan prompt tekstual. Sora dari OpenAI siap menjadi alat terobosan dengan potensi untuk merevolusi industri pembuatan konten video. Namun, yang membuat Sora istimewa bukan hanya kemampuan teknisnya tetapi juga berbagai aplikasi potensialnya—dari pemasaran dan pendidikan hingga industri hiburan dan komunikasi sehari-hari. Mari kita periksa bagaimana Sora bermaksud membawa perubahan ini dan prospek apa yang dibukanya untuk bisnis.
Kita telah menempuh jalan panjang sejak hari-hari percobaan canggung pertama untuk membuat video menggunakan komputer. Sudah jelas bahwa video yang dibuat oleh kecerdasan buatan generatif, bahkan yang baru berusia enam bulan, terlihat cukup canggung dibandingkan dengan generasi Sora. Meskipun Sora, yang dapat membuat adegan video realistis berdasarkan instruksi tekstual, masih dalam tahap percobaan dan belum tersedia untuk publik, kemampuannya sangat mengesankan.
Sora menawarkan berbagai aplikasi yang dapat mengubah cara kita membuat dan mengonsumsi konten video. Berikut adalah beberapa contohnya:
Contoh-contoh ini menunjukkan kemajuan luar biasa di bidang AI. Namun, di atas segalanya, ini membuka pintu untuk kemungkinan baru dalam menciptakan konten video. Cukup lihat presentasi video resolusi tinggi yang menggambarkan keindahan bunga yang sedang mekar:
Sumber: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 atau https://youtu.be/UNmqxZoTgsk)
Apakah Sora hanya mainan dan alat lain untuk membuat konten video? Tidak. Setidaknya menurut OpenAI. Seperti yang ditulis oleh para pencipta Sora:
Kami mengajarkan kecerdasan buatan untuk memahami dan mensimulasikan dunia fisik dalam gerakan, dan tujuannya adalah untuk melatih model yang membantu orang menyelesaikan masalah yang memerlukan interaksi dengan dunia nyata.
Untuk menghasilkan video dengan akurat, model harus memahami dunia pada tingkat yang jauh lebih dalam daripada yang diperlukan untuk pembuatan teks. Ini melibatkan pemahaman fisika, hubungan spasial antara objek di bidang yang sama, dan interaksi antara latar depan dan latar belakang.
Sora akan mampu menghasilkan:
Di masa depan, Sora dapat digunakan untuk membuat video promosi, konten media sosial, atau presentasi bisnis. Ini adalah alat yang dapat sepenuhnya mengubah cara kita membuat dan berbagi konten video:
Sumber: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 atau https://youtu.be/3l8wjxjNubE)
Meskipun langkah kolosal ini dalam pengembangan kecerdasan buatan generatif sangat menarik, ini juga menimbulkan kekhawatiran mengenai risiko yang terkait dengan deep fake, terutama terkait dengan pemilihan presiden AS. Ancaman yang terkait dengan penggunaan Sora termasuk terutama:
Oleh karena itu, meskipun kemampuan Sora mengesankan, kita harus berhati-hati terhadap dampaknya pada masyarakat, membuat regulasi, dan mengambil langkah tambahan untuk meminimalkan konsekuensi negatifnya.
Meskipun Sora saat ini dalam fase pengujian dan belum tersedia untuk audiens yang lebih luas, menggunakan Sora tampaknya merupakan proses yang sederhana dan intuitif. Pengguna mungkin akan dapat menggunakannya seperti mereka menggunakan DALL-E 3 di ChatGPT Plus saat ini. Artinya, mengetik perintah teks, yang akan diubah Sora menjadi klip video pendek. Ini menawarkan peluang baru bagi pembuat konten, pemasar, dan pendidik, memungkinkan mereka membuat video yang menarik dan berkualitas tinggi dengan cepat.
Tapi bagaimana Sora dibandingkan dengan generator video lainnya? Untuk saat ini, kita hanya bisa berspekulasi bagaimana Sora akan berkinerja, tetapi berdasarkan deskripsi alat yang tersedia di situs web OpenAI, kita dapat membuat beberapa pengamatan umum:
Sora berbeda dari alat pembuatan video lainnya karena ia menciptakan video yang sangat realistis yang sangat mirip dengan rekaman asli. Resolusi sangat penting di sini. Sora dapat membuat video dengan resolusi hingga 1920x1080px.
Dengan pemahaman bahasa yang mendalam, model ini secara akurat menginterpretasikan perintah. Di sini, Open AI menggunakan metode yang terbukti di DALL-E 3. Model pertama-tama menginterpretasikan prompt sederhana yang dimasukkan oleh pengguna dan kemudian menghasilkan konten visual berdasarkan versi yang rumit dan terperinci. Ini memungkinkannya untuk menciptakan adegan kompleks dan menghasilkan karakter yang mengekspresikan emosi yang autentik:
Sumber: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 atau https://youtu.be/pxkfUDoQg5I)
Potensi Sora untuk mengubah industri kreatif sangat besar. Akses ke alat ini bagi pembuat film dan desainer membawa kualitas baru dalam pembuatan konten video. Sora berfungsi sebagai dasar untuk model yang mampu mensimulasikan dunia nyata, yang bisa menjadi terobosan dalam mencapai AGI (Kecerdasan Umum Buatan). Setidaknya itulah yang diklaim oleh penciptanya, OpenAI.
Karena Sora menciptakan gambar bergerak realistis yang mirip dengan yang difilmkan oleh tangan manusia, ia memiliki potensi untuk secara signifikan mengubah bidang pembuatan video, dari materi pelatihan hingga produksi Hollywood. Sora pasti akan berdampak pada:
Sumber: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Penggunaan AI dalam produksi video menawarkan perusahaan berbagai manfaat, seperti penghematan waktu dan biaya, kualitas hasil yang konsisten, dan peningkatan nilai produk akhir. OpenAI mengambil langkah-langkah untuk memastikan keamanan Sora, termasuk bekerja sama dengan tim pengujian anti-adversarial dan mengembangkan pengklasifikasi untuk mendeteksi video yang dihasilkan AI.
Sora dari OpenAI membuka kemungkinan baru untuk menciptakan dan mengonsumsi konten video. Dari merevolusi industri kreatif hingga mempengaruhi pemasaran dan pendidikan, hingga memengaruhi komunikasi sehari-hari – potensinya sangat besar. Sebagai alat yang dapat sepenuhnya mengubah aturan permainan, Sora layak mendapatkan perhatian khusus. Kami menantikan informasi lebih lanjut dari OpenAI, terutama mengenai kapan Sora akan tersedia untuk publik yang lebih luas. Ini menandai awal era baru dalam pembuatan konten video. Langkah selanjutnya adalah integrasinya dengan suara, suara, dan model 3D, yang akan membuka pintu ke metaverse.
Jika Anda menyukai konten kami, bergabunglah dengan komunitas lebah sibuk kami di Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Ahli JavaScript dan instruktur yang melatih departemen TI. Tujuan utamanya adalah untuk meningkatkan produktivitas tim dengan mengajarkan orang lain bagaimana berkolaborasi secara efektif saat melakukan pengkodean.
Perusahaan menghadapi tantangan dalam mengelola sejumlah besar konten yang dipublikasikan secara online, mulai dari pos…
Di era transformasi digital, perusahaan memiliki akses ke jumlah data yang belum pernah terjadi sebelumnya…
Apakah Anda tahu bahwa Anda dapat mendapatkan inti dari rekaman multi-jam dari pertemuan atau percakapan…
Bayangkan sebuah dunia di mana perusahaan Anda dapat membuat video yang menarik dan dipersonalisasi untuk…
Untuk sepenuhnya memanfaatkan potensi Model Bahasa Besar (LLM), perusahaan perlu menerapkan pendekatan yang efektif dalam…
Pada tahun 2018, Unilever telah memulai perjalanan sadar untuk menyeimbangkan kemampuan otomatisasi dan augmentasi. Dalam…