Ini adalah kutipan dari Sumber oleh Alex Heathbuletin tentang AI dan industri teknologi, hanya didistribusikan kepada pelanggan The Verge seminggu sekali.
Pendapat
Mengapa model dunia menjadi hal besar berikutnya dalam AI
Pertengahan tahun lalu, Pim de Witte mulai menghubungi beberapa laboratorium AI terkemuka untuk mengetahui apakah mereka tertarik menggunakan data AI. Medaliplatform kliping video game populernya, untuk melatih agennya.
Dalam beberapa minggu, menjadi jelas bahwa data Medal lebih berharga bagi laboratorium daripada yang dia duga. “Kami menerima beberapa tawaran akuisisi dengan sangat cepat,” katanya kepada saya. (Dia menolak menyebutkan nama, tapi dilaporkan (yang ditawarkan oleh OpenAI sebesar $500 juta.) “Awalnya, kami cukup tertarik dengan penawaran tersebut,” ujarnya mengenai tawaran tersebut, namun hal tersebut “sebagian besar disebabkan karena kami tidak memahami apa yang kami lakukan.”
Dia membaca Google DeepMind artikel penelitian menunjukkan bahwa data game dapat digunakan untuk mengajari AI cara menavigasi lingkungan 3D. Namun, minat dari laboratorium AI membuatnya menyadari bahwa datanya dari Medal, yang menerima sekitar 2 miliar unggahan video per tahun dari puluhan ribu video game, dapat digunakan untuk mengembangkan model dasar yang unik untuk memperluas AI ke dunia nyata.
“Ini pertaruhan yang sangat besar.”
Hari ini, Pim de Witte mengumumkan bahwa Medal meluncurkan laboratorium AI baru yang disebut General Intuition, yang telah mengumpulkan dana awal sebesar $133,7 juta. Pendanaan putaran ini terutama berasal dari Vinod Khosla, pendiri Khosla Ventures dan investor awal di OpenAI. Investor lainnya termasuk General Catalyst dan Raine Group. Moritz Baier-Lentz, yang mengawasi investasi game Lightspeed, juga bergabung dengan startup ini secara paruh waktu sebagai anggota tim pendiri.
Khosla percaya bahwa Intuisi Umum dapat memberikan dampak yang sama besarnya pada bidang agen AI seperti halnya OpenAI terhadap cara orang menggunakan model bahasa besar. Ini adalah pemeriksaan awal terbesar yang dilakukan perusahaannya sejak mendukung OpenAI pada tahun 2018. “Ini pertaruhan yang cukup besar,” katanya kepada saya. “Mereka memiliki kumpulan data unik dan tim unik.”
Kecuali Anda mendalami dunia AI, Anda mungkin belum banyak mendengar tentang model dunia. Merupakan cabang penelitian yang melatih AI untuk memiliki pemahaman spasial seperti manusia. Idenya adalah robot dapat, misalnya, memprediksi kapan segelas air akan tumpah ketika terjatuh dari meja dan menangkapnya sebelum jatuh. Secara praktis, para peneliti AI semakin mencari model dunia sebagai cara untuk melatih agen yang dapat menghasilkan dan berinteraksi dengan ruang 3D secara andal.
Di antara para pemimpin AI terkemuka, CEO Google DeepMind Demis Hassabis adalah pendukung paling vokal terhadap model dunia dan pentingnya model dunia dalam mencapai AGI. Google baru-baru ini mendemonstrasikan Genie 3, model yang menghasilkan lingkungan seperti video game dari awal saat Anda menavigasinya. Ada juga beberapa startup yang mengerjakan model serupa, termasuk Fei-Fei Li’s World Labs, yang minggu ini meluncurkan demonya sendiri model yang menghasilkan video interaktif secara real time.
Untuk Intuisi Umum, tujuannya adalah untuk mengontrol semua jenis perangkat yang dapat dipetakan ke keyboard dan mouse atau yang memiliki skema input serupa dengan pengontrol game, menurut de Witte. Dia berharap model pertama startup ini akan digunakan oleh drone pencari dan penyelamat, namun melihat potensi penerapan di bidang lain, termasuk robot humanoid dan mobil self-driving.
Sama seperti LLM yang awalnya dilatih menggunakan data teks internet, de Witte yakin lingkungan game akan membuka kemampuan AI untuk memprediksi dengan andal tindakan yang tepat untuk diambil di dunia fisik. “Game pada dasarnya adalah satu-satunya domain yang dapat diverifikasi untuk penalaran spatiotemporal,” jelasnya. “Anda dapat memisahkan perbuatan baik dari perbuatan buruk, dan itulah mengapa perbuatan itu sangat berharga.”
Namun, ini adalah taruhan yang berisiko. Jalur teknis yang tepat ke depan untuk model negara berkembang sedang hangat diperdebatkan di industri AI, dan seperti yang dikatakan Khosla kepada saya, tidak jelas data mana yang pada akhirnya terbukti paling berharga. Anggota tim peneliti pertama de Witte diterbitkan penelitian penting di lapangan, namun startup ini masih bersaing dengan raksasa yang mempunyai dana lebih besar seperti Google. “Seseorang akan menghasilkan banyak uang di pasar ini,” kata Khosla, yang mengatakan kepada saya bahwa menurutnya ini adalah area di mana “perusahaan bernilai ratusan miliar dolar dan bahkan berpotensi miliaran dolar akan dibangun.”
De Witte memperkirakan bahwa perusahaan game akan menjadi target akuisisi utama laboratorium AI seiring dengan meningkatnya minat terhadap model global. Keputusannya untuk memulai General Intuition didorong oleh kesadaran bahwa, berkat data Medal, dia berada dalam posisi unik untuk menjadi lebih dari sekadar penyedia data. Namun, dia memperingatkan saya bahwa orang lain mungkin akan kesulitan menolak pemeriksaan lisensi dan tawaran akuisisi dari laboratorium AI besar.
“Anda berada pada posisi yang kurang beruntung dalam hal informasi,” katanya ketika saya bertanya apakah dia punya saran untuk industri game. “Semakin baik model ini, semakin sedikit data yang dibutuhkan.”