Apa itu Google Genie?

Google Genie (https://sites.google.com/view/genie-2024/) adalah model dunia dasar yang dikembangkan oleh DeepMind. Ini adalah model AI generatif yang dilatih dengan lebih dari 30.000 jam rekaman video game platformer 2D yang tersedia untuk umum. Fitur kuncinya adalah kemampuan untuk menghasilkan lingkungan yang sepenuhnya interaktif dan dapat dimainkan langsung dari gambar tunggal, foto, dan bahkan sketsa yang digambar tangan.

Google Genie

Sumber: Genie: Generative Interactive Environments (https://arxiv.org/abs/2402.15391)

Bagaimana ini mungkin? Genie menggunakan teknik pembelajaran tanpa pengawasan dalam proses memperoleh kemampuan untuk mengontrol lingkungan dengan tepat hanya berdasarkan rekaman video. Tidak diperlukan penandaan tindakan manusia. Menggunakan modul pengkodean tindakan khusus, ia menangkap perubahan halus antara bingkai video yang berurutan dan memetakan mereka ke representasi internal gerakan, seperti melompat atau berbelok ke kiri. Model dinamika kemudian menghasilkan bingkai berikutnya dalam urutan berdasarkan tindakan yang dikodekan.

Akibatnya, Genie dapat menciptakan lingkungan permainan yang sepenuhnya dapat dikendalikan dan interaktif dari data visual mana pun. Setiap gerakan pemain menghasilkan bingkai baru yang unik secara real-time, menciptakan sesi yang halus dan dapat dimainkan. Ini adalah inovasi yang sangat besar yang memungkinkan kita untuk menciptakan seluruh dunia interaktif dari gambar atau teks.

Mengapa Genie inovatif?

Inovasi Genie terletak pada penggabungan beberapa elemen kunci dalam satu model:

  • model video generatif, seperti Phenaki (https://phenaki.video/), TECO (https://wilson1yan.github.io/teco/) atau maskvit (https://arxiv.org/abs/2206.11894), yang dapat memprediksi bingkai masa depan dari suatu urutan berdasarkan bingkai dan teks input, tetapi tidak menawarkan kemampuan kontrol aktif,
  • model dunia yang fokus pada memprediksi keadaan lingkungan masa depan berdasarkan tindakan agen, tetapi memerlukan data yang disediakan oleh manusia,
  • pembelajaran tanpa pengawasan, yang memungkinkan Genie untuk belajar baik dinamika lingkungan maupun ruang tindakan hanya dari data video mentah, tanpa label tindakan manusia.

Meski masing-masing area ini telah dieksplorasi sebelumnya, Genie adalah model pertama yang menggabungkannya untuk belajar lingkungan yang dapat dikendalikan langsung dari rekaman video. Pendekatan yang belum pernah terjadi sebelumnya ini untuk mengajarkan model tanpa pengawasan manusia adalah inovasi kunci dari Genie. Ini membuka pintu untuk menggunakan sejumlah besar video yang tersedia di Internet sebagai sumber pelatihan untuk model AI, dan mengatasi hambatan yang terkait dengan ketersediaan data berlabel yang terbatas.

Penggabungan model video generatif, model dunia, dan pembelajaran tanpa pengawasan dalam satu solusi mewakili kemajuan fundamental dalam pengembangan kecerdasan buatan. Genie menunjukkan bahwa sistem AI yang canggih dapat belajar perilaku dan lingkungan yang kompleks langsung dari data tidak terstruktur, tanpa penandaan manual. Ini adalah langkah kunci menuju pencapaian Kecerdasan Umum Buatan (AGI) yang sebenarnya.

Google Genie

Sumber: Google Genie (https://sites.google.com/view/genie-2024/)

Potensi aplikasi Google Genie

Kemampuan Google Genie jauh melampaui menghasilkan video game. Model AI perintis ini dapat menemukan aplikasi di banyak bidang:

  • alat untuk animator – cukup unggah gambar, sketsa, atau deskripsi teks pendek dan Genie akan menghasilkan animasi yang konsisten,
  • sumber pelatihan tak terbatas untuk agen AI – dengan kemampuannya untuk menggeneralisasi ke domain yang sepenuhnya baru, Genie menawarkan kumpulan tantangan yang tak terbatas di mana sistem AI masa depan dapat belajar. Kurangnya lingkungan pelatihan yang beragam sejauh ini telah menjadi salah satu hambatan utama dalam pengembangan agen AI generik,
  • simulasi fisik untuk robotika – penelitian telah menunjukkan bahwa Genie mampu tidak hanya mengontrol robot virtual, tetapi juga mewujudkan sifat fisik objek yang dapat berubah bentuk. Ini bisa memiliki implikasi besar untuk pengembangan robotika dan simulasi fisik,
  • aplikasi di industri kreatif – Genie dapat memfasilitasi penciptaan instalasi seni interaktif, pameran virtual, atau film. Cukup unggah sketsa dan model akan menghasilkan dunia 3D yang sepenuhnya dapat dikendalikan, siap untuk dijelajahi.

Namun, tantangan dan batasan potensial dari teknologi ini tidak boleh diabaikan. Pada tahap pengembangan saat ini, Genie bekerja paling baik di domain sempit seperti permainan platform 2D. Meningkatkan ke lingkungan 3D yang lebih kompleks akan memerlukan penelitian dan optimasi tambahan. Selain itu, ada risiko bahwa teknologi ini dapat disalahgunakan untuk membuat konten yang berbahaya atau berbahaya. Oleh karena itu, sangat penting untuk mengembangkan kerangka etika dan hukum yang kuat untuk mengatur pengembangan dan penggunaan model AI semacam itu.

Google Genie

Sumber: Google Genie (https://sites.google.com/view/genie-2024/)

Ringkasan

Dengan memungkinkan penciptaan lingkungan yang sepenuhnya interaktif langsung dari data visual, tanpa perlu menandai tindakan secara manual, Google Genie mewakili terobosan sejati dalam kecerdasan buatan generatif. Model dunia dasar ini memberikan kekuatan untuk mengekspresikan citra dalam bentuk realitas virtual yang dapat dimainkan yang dapat dijelajahi dan dikendalikan oleh manusia atau agen AI.

Potensi Genie sangat besar – dari alat untuk pengembang game, hingga sumber data pelatihan tak terbatas untuk AI, hingga simulasi fisik untuk robotika. Ini juga merupakan langkah penting menuju AGI. Seiring model seperti Genie terus berkembang, batas antara dunia nyata dan virtual menjadi semakin cair.

Google Genie

Jika Anda menyukai konten kami, bergabunglah dengan komunitas lebah sibuk kami di Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Ahli JavaScript dan instruktur yang melatih departemen TI. Tujuan utamanya adalah untuk meningkatkan produktivitas tim dengan mengajarkan orang lain bagaimana berkolaborasi secara efektif saat melakukan pengkodean.

View all posts →

AI in business:

  1. 6 plugin ChatGTP yang luar biasa yang akan memudahkan hidup Anda
  2. Menavigasi peluang bisnis baru dengan ChatGPT-4
  3. 3 penulis AI luar biasa yang harus Anda coba hari ini
  4. Aktor sintetis. 3 besar generator video AI
  5. Apa saja kelemahan dari ide bisnis saya? Sesi brainstorming dengan ChatGPT
  6. Menggunakan ChatGPT dalam bisnis
  7. Layanan dan produk baru yang beroperasi dengan AI
  8. Postingan media sosial otomatis
  9. Jadwal posting media sosial. Bagaimana AI dapat membantu?
  10. Peran AI dalam pengambilan keputusan bisnis
  11. NLP bisnis hari ini dan besok
  12. Chatbot teks yang dibantu AI
  13. Aplikasi AI dalam bisnis - gambaran umum
  14. Ancaman dan peluang AI dalam bisnis (bagian 2)
  15. Ancaman dan peluang AI dalam bisnis (bagian 1)
  16. Apa masa depan AI menurut McKinsey Global Institute?
  17. Kecerdasan buatan dalam bisnis - Pendahuluan
  18. Apa itu NLP, atau pemrosesan bahasa alami dalam bisnis
  19. Google Translate vs DeepL. 5 aplikasi penerjemahan mesin untuk bisnis
  20. Pemrosesan dokumen otomatis
  21. Operasi dan aplikasi bisnis dari voicebot
  22. Teknologi asisten virtual, atau bagaimana cara berbicara dengan AI?
  23. Apa itu Intelijen Bisnis?
  24. Bagaimana kecerdasan buatan dapat membantu dengan BPM?
  25. Kecerdasan Buatan Kreatif hari ini dan besok
  26. Kecerdasan buatan dalam manajemen konten
  27. Menjelajahi kekuatan AI dalam penciptaan musik
  28. 3 alat desain grafis AI yang berguna. AI generatif dalam bisnis
  29. AI dan media sosial – apa yang mereka katakan tentang kita?
  30. Apakah kecerdasan buatan akan menggantikan analis bisnis?
  31. Alat AI untuk manajer
  32. Pasar kerja di masa depan dan profesi yang akan datang
  33. RPA dan API di perusahaan digital
  34. Interaksi baru. Bagaimana AI mengubah cara kita mengoperasikan perangkat?
  35. AI multimodal dan aplikasinya dalam bisnis
  36. Kecerdasan buatan dan lingkungan. 3 solusi AI untuk membantu Anda membangun bisnis yang berkelanjutan
  37. Detektor konten AI. Apakah mereka sepadan?
  38. ChatGPT vs Bard vs Bing. Chatbot AI mana yang memimpin perlombaan?
  39. Apakah chatbot AI merupakan pesaing pencarian Google?
  40. Prompt Efektif ChatGPT untuk HR dan Rekrutmen
  41. Rekayasa prompt. Apa yang dilakukan seorang insinyur prompt?
  42. AI dan apa lagi? Tren teknologi teratas untuk bisnis di 2024
  43. AI dan etika bisnis. Mengapa Anda harus berinvestasi dalam solusi etis
  44. Meta AI. Apa yang perlu Anda ketahui tentang fitur-fitur yang didukung AI di Facebook dan Instagram?
  45. Regulasi AI. Apa yang perlu Anda ketahui sebagai seorang pengusaha?
  46. 5 penggunaan baru AI dalam bisnis
  47. Produk dan proyek AI - bagaimana mereka berbeda dari yang lain?
  48. AI sebagai ahli di tim Anda
  49. Tim AI vs. pembagian peran
  50. Bagaimana cara memilih bidang karir di AI?
  51. AI dalam HR: Bagaimana otomatisasi rekrutmen mempengaruhi HR dan pengembangan tim
  52. Automatisasi proses yang dibantu AI. Dari mana harus mulai?
  53. 6 alat AI paling menarik di 2023
  54. Apa analisis kematangan AI perusahaan?
  55. AI untuk personalisasi B2B
  56. Kasus penggunaan ChatGPT. 18 contoh bagaimana meningkatkan bisnis Anda dengan ChatGPT di 2024
  57. Generator mockup AI. 4 alat terbaik
  58. Mikrolearning. Cara cepat untuk mendapatkan keterampilan baru
  59. Implementasi AI yang paling menarik di perusahaan pada tahun 2024
  60. Apa tantangan yang dihadirkan oleh proyek AI?
  61. 8 Alat AI Terbaik untuk Bisnis di 2024
  62. AI dalam CRM. Apa yang diubah AI dalam alat CRM?
  63. Undang-Undang AI UE. Bagaimana Eropa mengatur penggunaan kecerdasan buatan
  64. 7 Pembuat Situs Web AI Teratas
  65. Alat tanpa kode dan inovasi AI
  66. Seberapa banyak penggunaan AI meningkatkan produktivitas tim Anda?
  67. Bagaimana cara menggunakan ChatGTP untuk riset pasar?
  68. Bagaimana cara memperluas jangkauan kampanye pemasaran AI Anda?
  69. AI dalam transportasi dan logistik
  70. Masalah bisnis apa yang dapat diperbaiki oleh AI?
  71. Bagaimana Anda mencocokkan solusi AI dengan masalah bisnis?
  72. Kecerdasan buatan di media
  73. AI dalam perbankan dan keuangan. Stripe, Monzo, dan Grab
  74. AI dalam industri perjalanan
  75. Bagaimana AI mendorong lahirnya teknologi baru
  76. AI dalam e-commerce. Tinjauan pemimpin global
  77. 4 Alat Pembuatan Gambar AI Teratas
  78. 5 Alat AI Terbaik untuk Analisis Data
  79. Revolusi AI di media sosial
  80. Apakah selalu layak untuk menambahkan kecerdasan buatan ke dalam proses pengembangan produk?
  81. 6 kesalahan bisnis terbesar yang disebabkan oleh AI
  82. Strategi AI di perusahaan Anda - bagaimana cara membangunnya?
  83. Kursus AI terbaik – 6 rekomendasi luar biasa
  84. Mengoptimalkan pendengaran media sosial dengan alat AI
  85. IoT + AI, atau bagaimana mengurangi biaya energi di sebuah perusahaan
  86. AI dalam logistik. 5 alat terbaik
  87. GPT Store – gambaran umum tentang GPT yang paling menarik untuk bisnis
  88. LLM, GPT, RAG... Apa arti akronim AI?
  89. Robot AI – masa depan atau saat ini dalam bisnis?
  90. Apa biaya untuk menerapkan AI di sebuah perusahaan?
  91. Apa yang dilakukan spesialis kecerdasan buatan?
  92. Bagaimana AI dapat membantu dalam karir seorang freelancer?
  93. Mengotomatiskan pekerjaan dan meningkatkan produktivitas. Panduan AI untuk pekerja lepas
  94. AI untuk startup – alat terbaik
  95. Membangun situs web dengan AI
  96. Sebelas Labs dan apa lagi? Startup AI yang paling menjanjikan
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Siapa yang siapa di dunia AI?
  98. Data sintetis dan pentingnya untuk pengembangan bisnis Anda
  99. Mesin pencari AI teratas. Di mana mencari alat AI?
  100. Video AI. Generator video AI terbaru
  101. AI untuk manajer. Bagaimana AI dapat mempermudah pekerjaan Anda
  102. Apa yang baru di Google Gemini? Semua yang perlu Anda ketahui
  103. AI di Polandia. Perusahaan, pertemuan, dan konferensi
  104. Kalender AI. Bagaimana cara mengoptimalkan waktu Anda di sebuah perusahaan?
  105. AI dan masa depan kerja. Bagaimana mempersiapkan bisnis Anda untuk perubahan?
  106. Kloning suara AI untuk bisnis. Bagaimana cara membuat pesan suara yang dipersonalisasi dengan AI?
  107. "Kita semua adalah pengembang." Bagaimana pengembang warga dapat membantu perusahaan Anda?
  108. Fakta pemeriksaan dan halusinasi AI
  109. AI dalam perekrutan – mengembangkan materi perekrutan langkah demi langkah
  110. Sora. Bagaimana video realistis dari OpenAI akan mengubah bisnis?
  111. Midjourney v6. Inovasi dalam generasi gambar AI
  112. AI di UKM. Bagaimana UKM dapat bersaing dengan raksasa menggunakan AI?
  113. Bagaimana AI mengubah pemasaran influencer?
  114. Apakah AI benar-benar menjadi ancaman bagi pengembang? Devin dan Microsoft AutoDev
  115. Chatbot AI terbaik untuk ecommerce. Platform
  116. Chatbot AI untuk e-commerce. Studi kasus
  117. Bagaimana cara tetap mengikuti perkembangan yang terjadi di dunia AI?
  118. Menjinakkan AI. Bagaimana cara mengambil langkah pertama untuk menerapkan AI dalam bisnis Anda?
  119. Perplexity, Bing Copilot, atau You.com? Membandingkan mesin pencari AI
  120. Ahli AI di Polandia
  121. ReALM. Model bahasa yang inovatif dari Apple?
  122. Google Genie — model AI generatif yang menciptakan dunia interaktif sepenuhnya dari gambar
  123. Otomatisasi atau augmentasi? Dua pendekatan terhadap AI di sebuah perusahaan
  124. LLMOps, atau bagaimana mengelola model bahasa secara efektif dalam sebuah organisasi
  125. Generasi video AI. Cakrawala baru dalam produksi konten video untuk bisnis.
  126. Alat transkripsi AI terbaik. Bagaimana cara mengubah rekaman panjang menjadi ringkasan yang singkat?
  127. Analisis sentimen dengan AI. Bagaimana hal itu membantu mendorong perubahan dalam bisnis?
  128. Peran AI dalam moderasi konten