Apa itu ReALM?

ReALM adalah singkatan dari “Reference Resolution As Language Modeling,” sebuah solusi inovatif yang dikembangkan oleh peneliti Apple. Ini adalah model bahasa baru (Large Language Model, LLM) yang memperlakukan masalah pengenalan referensi sebagai tugas di bidang pemodelan bahasa.

ReALM secara efektif mengubah berbagai jenis konteks menjadi representasi tekstual, yang kemudian diproses sebagai bagian dari tugas bahasa. Ini dapat mencakup:

  • percakapan – seperti pesan teks, perintah suara kepada asisten, atau email,
  • elemen di layar – misalnya, foto, kalender, widget cuaca, atau aplikasi dan proses yang berjalan di latar belakang.

Apa yang membuat ReALM berbeda dari model pengenalan referensi lainnya? Pertama, pendekatannya – alih-alih bergantung pada pemrosesan gambar, ReALM berjalan di domain teks. Ini membuatnya jauh lebih ringan dan lebih efisien, yang seharusnya memungkinkan untuk berjalan langsung di perangkat seluler sambil menjaga privasi pengguna.

Dalam hal apa ReALM lebih baik daripada GPT-4?

Tim penelitian Apple membandingkan ReALM dengan model bahasa paling kuat di pasar saat ini – GPT-3.5 dan GPT-4 dari OpenAI. Hasilnya sangat mengesankan. Dalam tugas pengenalan referensi, varian ReALM terkecil mencapai akurasi yang sebanding dengan GPT-4! Model ReALM yang lebih besar bahkan mengungguli GPT-4 dalam mengenali referensi terhadap item yang ditampilkan di layar (http://arxiv.org/abs/2403.20329).

Apa yang menjelaskan keunggulan ini? Pertama, ReALM sangat baik dengan kueri spesifik domain, seperti yang berkaitan dengan perangkat rumah pintar. Ini karena ReALM menunjukkan pemahaman yang lebih dalam tentang konteks dengan menyempurnakan model untuk data spesifik domain.

Lebih dari itu, tidak seperti GPT-4, yang dilatih terutama pada gambar objek nyata, ReALM unggul dalam mengenali elemen tekstual dan komponen antarmuka pengguna aplikasi. Dan pemahaman antarmuka adalah kunci untuk interaksi yang lancar antara asisten suara dengan aplikasi yang kita gunakan saat ini.

ReALM

Sumber: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Apakah ini awal dari era asisten yang benar-benar cerdas?

Memang, integrasi ReALM dengan Siri dapat membuka babak baru dalam interaksi manusia-komputer. Dengan ReALM, Siri akan mampu memahami perintah yang mencakup referensi terhadap item yang ditampilkan di layar smartphone, serta proses dan aplikasi yang berjalan di latar belakang. Tapi kapan opsi ini akan tersedia untuk pengguna? Itu masih belum diketahui.

Kita hanya bisa berspekulasi berdasarkan kemampuan teknis model tersebut. Jadi, bagaimana Siri yang didukung ReALM mungkin bekerja? Misalnya, jika Anda sedang menjelajahi situs daftar bisnis dan melihat perusahaan yang Anda minati, Anda bisa langsung berkata kepada Siri, “Hubungi perusahaan ini,” dan asisten – menggunakan ReALM untuk menganalisis konteks – akan menemukan nomor telepon perusahaan yang Anda sebutkan dan memulai panggilan. Anda bahkan tidak perlu menjelaskan perusahaan mana yang Anda maksud.

A dan ini baru permulaan dari kemampuan ReALM. Perintah seperti “Putar daftar putar terakhir” akan memungkinkan kontrol intuitif terhadap aplikasi multimedia dan perangkat rumah pintar. ReALM juga dapat memungkinkan Siri memahami konteks percakapan dan riwayat perintah, sehingga asisten merespons dengan tepat terhadap permintaan sebelumnya dari pengguna. Ini adalah langkah menuju agen cerdas yang mendekatkan kita bukan hanya pada kecerdasan buatan yang memahami permintaan kita, tetapi juga yang tahu bagaimana melaksanakan perintah.

Dan ini baru permulaan dari apa yang bisa dilakukan ReALM. Perintah seperti “putar daftar putar terakhir” akan memungkinkan kontrol intuitif terhadap aplikasi media dan perangkat rumah pintar. ReALM juga dapat memungkinkan Siri untuk memahami konteks percakapan dan riwayat perintah, sehingga asisten merespons dengan tepat terhadap permintaan sebelumnya dari pengguna. Ini adalah langkah menuju agen cerdas, yang membawa kita lebih dekat kepada bukan kecerdasan buatan yang memahami permintaan kita, tetapi satu yang tahu bagaimana mengeksekusi perintah.

Sayangnya, pengguna perangkat Android harus menunggu. Saat ini, tidak ada informasi tentang rencana Google untuk menambahkan kemampuan Gemini ke Google Assistant. Aplikasi Google Gemini untuk perangkat Android telah dikembangkan (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), tetapi belum tersedia di luar Amerika Serikat.

ReALM

Sumber: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Ringkasan

ReALM adalah pendekatan inovatif Apple untuk menyelesaikan masalah pengenalan konteks oleh asisten suara. Alih-alih bergantung pada pemrosesan gambar, model bahasa ini mengubah berbagai jenis konteks menjadi representasi tekstual, yang kemudian diproses dalam tugas bahasa. Pendekatan ini memastikan tidak hanya akurasi pengenalan yang tinggi, tetapi juga kemampuan untuk beroperasi di perangkat seluler sambil menjaga privasi pengguna.

Memberikan akses kepada Siri ke ReALM dapat memberikan interaksi suara yang lebih alami dan kontekstual, langkah penting menuju asisten yang benar-benar cerdas. Dengan ReALM, Siri akan mampu merespons perintah yang terkait dengan item di layar, aplikasi, dan proses latar belakang secara instan. Satu hal yang pasti – meningkatkan kesadaran kontekstual asisten adalah kunci untuk menciptakan interaksi suara yang benar-benar cerdas dan alami, dan ReALM jelas merupakan langkah penting ke arah itu.

ReALM

Jika Anda menyukai konten kami, bergabunglah dengan komunitas sibuk kami di Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Ahli JavaScript dan instruktur yang melatih departemen TI. Tujuan utamanya adalah untuk meningkatkan produktivitas tim dengan mengajarkan orang lain bagaimana berkolaborasi secara efektif saat melakukan pengkodean.

View all posts →

AI in business:

  1. 6 plugin ChatGTP yang luar biasa yang akan memudahkan hidup Anda
  2. Menavigasi peluang bisnis baru dengan ChatGPT-4
  3. 3 penulis AI luar biasa yang harus Anda coba hari ini
  4. Aktor sintetis. 3 besar generator video AI
  5. Apa saja kelemahan dari ide bisnis saya? Sesi brainstorming dengan ChatGPT
  6. Menggunakan ChatGPT dalam bisnis
  7. Layanan dan produk baru yang beroperasi dengan AI
  8. Postingan media sosial otomatis
  9. Jadwal posting media sosial. Bagaimana AI dapat membantu?
  10. Peran AI dalam pengambilan keputusan bisnis
  11. NLP bisnis hari ini dan besok
  12. Chatbot teks yang dibantu AI
  13. Aplikasi AI dalam bisnis - gambaran umum
  14. Ancaman dan peluang AI dalam bisnis (bagian 2)
  15. Ancaman dan peluang AI dalam bisnis (bagian 1)
  16. Apa masa depan AI menurut McKinsey Global Institute?
  17. Kecerdasan buatan dalam bisnis - Pendahuluan
  18. Apa itu NLP, atau pemrosesan bahasa alami dalam bisnis
  19. Google Translate vs DeepL. 5 aplikasi penerjemahan mesin untuk bisnis
  20. Pemrosesan dokumen otomatis
  21. Operasi dan aplikasi bisnis dari voicebot
  22. Teknologi asisten virtual, atau bagaimana cara berbicara dengan AI?
  23. Apa itu Intelijen Bisnis?
  24. Bagaimana kecerdasan buatan dapat membantu dengan BPM?
  25. Kecerdasan Buatan Kreatif hari ini dan besok
  26. Kecerdasan buatan dalam manajemen konten
  27. Menjelajahi kekuatan AI dalam penciptaan musik
  28. 3 alat desain grafis AI yang berguna. AI generatif dalam bisnis
  29. AI dan media sosial – apa yang mereka katakan tentang kita?
  30. Apakah kecerdasan buatan akan menggantikan analis bisnis?
  31. Alat AI untuk manajer
  32. Pasar kerja di masa depan dan profesi yang akan datang
  33. RPA dan API di perusahaan digital
  34. Interaksi baru. Bagaimana AI mengubah cara kita mengoperasikan perangkat?
  35. AI multimodal dan aplikasinya dalam bisnis
  36. Kecerdasan buatan dan lingkungan. 3 solusi AI untuk membantu Anda membangun bisnis yang berkelanjutan
  37. Detektor konten AI. Apakah mereka sepadan?
  38. ChatGPT vs Bard vs Bing. Chatbot AI mana yang memimpin perlombaan?
  39. Apakah chatbot AI merupakan pesaing pencarian Google?
  40. Prompt Efektif ChatGPT untuk HR dan Rekrutmen
  41. Rekayasa prompt. Apa yang dilakukan seorang insinyur prompt?
  42. AI dan apa lagi? Tren teknologi teratas untuk bisnis di 2024
  43. AI dan etika bisnis. Mengapa Anda harus berinvestasi dalam solusi etis
  44. Meta AI. Apa yang perlu Anda ketahui tentang fitur-fitur yang didukung AI di Facebook dan Instagram?
  45. Regulasi AI. Apa yang perlu Anda ketahui sebagai seorang pengusaha?
  46. 5 penggunaan baru AI dalam bisnis
  47. Produk dan proyek AI - bagaimana mereka berbeda dari yang lain?
  48. AI sebagai ahli di tim Anda
  49. Tim AI vs. pembagian peran
  50. Bagaimana cara memilih bidang karir di AI?
  51. AI dalam HR: Bagaimana otomatisasi rekrutmen mempengaruhi HR dan pengembangan tim
  52. Automatisasi proses yang dibantu AI. Dari mana harus mulai?
  53. 6 alat AI paling menarik di 2023
  54. Apa analisis kematangan AI perusahaan?
  55. AI untuk personalisasi B2B
  56. Kasus penggunaan ChatGPT. 18 contoh bagaimana meningkatkan bisnis Anda dengan ChatGPT di 2024
  57. Generator mockup AI. 4 alat terbaik
  58. Mikrolearning. Cara cepat untuk mendapatkan keterampilan baru
  59. Implementasi AI yang paling menarik di perusahaan pada tahun 2024
  60. Apa tantangan yang dihadirkan oleh proyek AI?
  61. 8 Alat AI Terbaik untuk Bisnis di 2024
  62. AI dalam CRM. Apa yang diubah AI dalam alat CRM?
  63. Undang-Undang AI UE. Bagaimana Eropa mengatur penggunaan kecerdasan buatan
  64. 7 Pembuat Situs Web AI Teratas
  65. Alat tanpa kode dan inovasi AI
  66. Seberapa banyak penggunaan AI meningkatkan produktivitas tim Anda?
  67. Bagaimana cara menggunakan ChatGTP untuk riset pasar?
  68. Bagaimana cara memperluas jangkauan kampanye pemasaran AI Anda?
  69. AI dalam transportasi dan logistik
  70. Masalah bisnis apa yang dapat diperbaiki oleh AI?
  71. Bagaimana Anda mencocokkan solusi AI dengan masalah bisnis?
  72. Kecerdasan buatan di media
  73. AI dalam perbankan dan keuangan. Stripe, Monzo, dan Grab
  74. AI dalam industri perjalanan
  75. Bagaimana AI mendorong lahirnya teknologi baru
  76. AI dalam e-commerce. Tinjauan pemimpin global
  77. 4 Alat Pembuatan Gambar AI Teratas
  78. 5 Alat AI Terbaik untuk Analisis Data
  79. Revolusi AI di media sosial
  80. Apakah selalu layak untuk menambahkan kecerdasan buatan ke dalam proses pengembangan produk?
  81. 6 kesalahan bisnis terbesar yang disebabkan oleh AI
  82. Strategi AI di perusahaan Anda - bagaimana cara membangunnya?
  83. Kursus AI terbaik – 6 rekomendasi luar biasa
  84. Mengoptimalkan pendengaran media sosial dengan alat AI
  85. IoT + AI, atau bagaimana mengurangi biaya energi di sebuah perusahaan
  86. AI dalam logistik. 5 alat terbaik
  87. GPT Store – gambaran umum tentang GPT yang paling menarik untuk bisnis
  88. LLM, GPT, RAG... Apa arti akronim AI?
  89. Robot AI – masa depan atau saat ini dalam bisnis?
  90. Apa biaya untuk menerapkan AI di sebuah perusahaan?
  91. Apa yang dilakukan spesialis kecerdasan buatan?
  92. Bagaimana AI dapat membantu dalam karir seorang freelancer?
  93. Mengotomatiskan pekerjaan dan meningkatkan produktivitas. Panduan AI untuk pekerja lepas
  94. AI untuk startup – alat terbaik
  95. Membangun situs web dengan AI
  96. Sebelas Labs dan apa lagi? Startup AI yang paling menjanjikan
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Siapa yang siapa di dunia AI?
  98. Data sintetis dan pentingnya untuk pengembangan bisnis Anda
  99. Mesin pencari AI teratas. Di mana mencari alat AI?
  100. Video AI. Generator video AI terbaru
  101. AI untuk manajer. Bagaimana AI dapat mempermudah pekerjaan Anda
  102. Apa yang baru di Google Gemini? Semua yang perlu Anda ketahui
  103. AI di Polandia. Perusahaan, pertemuan, dan konferensi
  104. Kalender AI. Bagaimana cara mengoptimalkan waktu Anda di sebuah perusahaan?
  105. AI dan masa depan kerja. Bagaimana mempersiapkan bisnis Anda untuk perubahan?
  106. Kloning suara AI untuk bisnis. Bagaimana cara membuat pesan suara yang dipersonalisasi dengan AI?
  107. "Kita semua adalah pengembang." Bagaimana pengembang warga dapat membantu perusahaan Anda?
  108. Fakta pemeriksaan dan halusinasi AI
  109. AI dalam perekrutan – mengembangkan materi perekrutan langkah demi langkah
  110. Sora. Bagaimana video realistis dari OpenAI akan mengubah bisnis?
  111. Midjourney v6. Inovasi dalam generasi gambar AI
  112. AI di UKM. Bagaimana UKM dapat bersaing dengan raksasa menggunakan AI?
  113. Bagaimana AI mengubah pemasaran influencer?
  114. Apakah AI benar-benar menjadi ancaman bagi pengembang? Devin dan Microsoft AutoDev
  115. Chatbot AI terbaik untuk ecommerce. Platform
  116. Chatbot AI untuk e-commerce. Studi kasus
  117. Bagaimana cara tetap mengikuti perkembangan yang terjadi di dunia AI?
  118. Menjinakkan AI. Bagaimana cara mengambil langkah pertama untuk menerapkan AI dalam bisnis Anda?
  119. Perplexity, Bing Copilot, atau You.com? Membandingkan mesin pencari AI
  120. Ahli AI di Polandia
  121. ReALM. Model bahasa yang inovatif dari Apple?
  122. Google Genie — model AI generatif yang menciptakan dunia interaktif sepenuhnya dari gambar
  123. Otomatisasi atau augmentasi? Dua pendekatan terhadap AI di sebuah perusahaan
  124. LLMOps, atau bagaimana mengelola model bahasa secara efektif dalam sebuah organisasi
  125. Generasi video AI. Cakrawala baru dalam produksi konten video untuk bisnis.
  126. Alat transkripsi AI terbaik. Bagaimana cara mengubah rekaman panjang menjadi ringkasan yang singkat?
  127. Analisis sentimen dengan AI. Bagaimana hal itu membantu mendorong perubahan dalam bisnis?
  128. Peran AI dalam moderasi konten