Berita

Bagaimana memori prosedural dapat mengurangi biaya dan kompleksitas agen kecerdasan buatan

Published

on

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Teknologi baru dari Universitas Zhejiang Dan Ali Baba Group Faktor LLM memberikan memori yang dinamis, membuatnya lebih efisien dan efektif dalam tugas -tugas kompleks. Teknologi ini disebut sakitIni memberikan agen “memori prosedural” yang terus diperbarui ketika mereka mendapatkan pengalaman, seperti bagaimana orang belajar dari latihan.

MEMP menciptakan kerangka pendidikan seumur hidup di mana agen tidak harus memulai dari titik nol di setiap tugas baru. Sebaliknya, itu menjadi secara bertahap lebih baik dan lebih efisien karena menghadapi posisi baru di lingkungan dunia nyata, dan itu adalah persyaratan utama untuk mengotomatisasi lembaga yang dapat diandalkan.

Keadaan memori prosedural dalam agen kecerdasan buatan

Agen LLM membawa janji untuk mengotomatiskan beberapa bisnis multi -langkah. Namun, dalam praktiknya, tugas horizon panjang bisa rapuh. Para peneliti mencatat bahwa peristiwa yang tidak dapat diprediksi seperti cacat jaringan, perubahan antarmuka pengguna, atau konversi basis data dapat menghambat seluruh proses. Untuk agen saat ini, ini berarti sering dimulai setiap saat, yang bisa memakan waktu lama dan mahal.

Sementara itu, banyak tugas kompleks, terlepas dari perbedaan dangkal, memiliki denominasi struktural yang mendalam. Alih -alih mempelajari kembali pola -pola ini setiap saat, agen harus dapat mengekstrak dan menggunakan kembali pengalamannya dari keberhasilan dan kegagalan sebelumnya, seperti yang dicatat oleh para peneliti. Ini membutuhkan “memori prosedural” spesifik, yang pada manusia adalah memori jangka panjang yang bertanggung jawab untuk keterampilan seperti menulis atau bersepeda, yang menjadi otomatis dengan praktik.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Mulai dari awal (lebih tinggi) berlawanan menggunakan memori prosedural (bawah) (sumber: arxiv)

Sistem agen saat ini sering tidak memiliki kemampuan ini. Pengetahuan prosedural mereka biasanya secara manual diproduksi secara manual oleh pengembang, atau disimpan dalam cetakan padat atau dipandu dalam parameter model, yang mahal dan lambat dalam memperbarui. Bahkan kerangka kerja saat ini yang bersaing dengan memori hanya memberikan abstrak kasar dan tidak cukup berurusan dengan cara membangun, mengindeks, memperbaiki, dan mendistribusikan keterampilan di akhir siklus hidup agen.

Dengan demikian, para peneliti memperhatikan Tentukan mereka“Tidak ada cara awal untuk menentukan efisiensi pekerja di mana amunisi proseduralnya berkembang atau untuk memastikan bahwa pengalaman baru meningkat alih -alih erosi kinerja.”

Bagaimana MEMP bekerja

MEMP adalah kerangka kerja yang tidak dapat diproses yang memperlakukan memori prosedural sebagai bahan dasar yang harus ditingkatkan. Ini terdiri dari tiga tahap utama yang bekerja dalam episode yang sedang berlangsung: membangun, memulihkan, dan memodernisasi memori.

Kenangan dirancang dari pengalaman agen sebelumnya, atau “trek”. Para peneliti mengeksplorasi penyimpanan ingatan ini dalam dua format: langkah -dengan tindakan literal; Atau distilasi langkah -langkah ini dalam abstrak teks tingkat tinggi. Untuk mengambil, agen dalam ingatannya sedang mencari pengalaman sebelumnya yang paling relevan saat memberikan tugas baru. Cobalah tim yang berbeda, pencarian vektor seperti itu, untuk mencocokkan deskripsi tugas baru dengan kueri sebelumnya atau mengekstrak kata kunci untuk menemukan kesesuaian terbaik.

Komponen terpenting adalah mekanisme pembaruan. MEMP menawarkan banyak strategi untuk memastikan pengembangan memori agen. Karena agen menyelesaikan lebih banyak tugas, ingatannya dapat dengan mudah diperbarui dengan menambahkan pengalaman baru, hanya melikuidasi hasil yang berhasil, atau lebih efektif, memikirkan kegagalan dalam mengoreksi dan meninjau memori asli.

Kerangka MEMP (Sumber: ARXIV)

Ini berfokus pada memori dinamis canggih yang menempatkan MEMP dalam bidang penelitian yang meningkat yang bertujuan membuat agen kecerdasan buatan lebih dapat diandalkan untuk tugas -tugas jangka panjang. Upaya lain, seperti MEM0, setara dengan mengintegrasikan informasi utama dari percakapan panjang ke fakta yang terorganisir dan biaya grafis untuk pengetahuan untuk memastikan konsistensi. Demikian juga, agen A-MEM memungkinkan pembuatan dan penghubung “catatan memori” secara independen dari interaksinya, yang merupakan struktur pengetahuan yang kompleks dari waktu ke waktu.

Namun, rekan Runnan Fang menyoroti perbedaan yang menentukan antara MEP dan kerangka kerja lainnya.

“Mem0 dan A-MEM bisnis yang sangat baik … tetapi mereka fokus pada mengingat konten yang menonjol di dalam Fang mengomentari satu jalan atau percakapan, pada dasarnya, membantu agen untuk mengingat “apa” yang terjadi. “Sebaliknya, itu menargetkan memori prosedural melintasi.” Ini berfokus pada pengetahuan “membimbing” yang dapat diedarkan melalui tugas -tugas serupa, mencegah pekerja dari mengeksplorasi kembali dari titik nol setiap kali.

“Dengan distilasi pekerjaan yang berhasil di masa lalu ke perangkat yang dapat digunakan secara prosedural, MEMP meningkatkan tingkat keberhasilan dan memperpendek langkah,” tambah Fang. “Secara tegas, kami juga menawarkan mekanisme pembaruan sehingga memori prosedural ini terus membaik – setelah semua, praktik ini membuatnya sempurna untuk faktor -faktor juga.”

Mengatasi masalah “Cold Start”

Meskipun konsep pembelajaran dari jalur sebelumnya kuat, itu menimbulkan pertanyaan praktis: bagaimana pekerja membangun ingatan awalnya ketika tidak ada contoh ideal untuk belajar darinya? Para peneliti berurusan dengan masalah “mulai dingin” dengan pendekatan praktis.

Fang menjelaskan bahwa Devs dapat memilih skala evaluasi yang kuat alih -alih memesan jalur “emas” yang sempurna. Skala ini, yang dapat bergantung pada aturan atau bahkan LLM lain, mencatat kualitas kinerja agen. “Setelah skala ini ada di tempatnya, kami membiarkan model modern mengeksplorasi dalam fungsi agen dan menjaga jalan yang mencapai level tertinggi,” kata Fang. Proses ini dengan cepat membuka serangkaian kenangan yang bermanfaat, memungkinkan agen baru untuk mencapai kecepatan tanpa pemrograman manual skala besar.

MEMP di tempat kerja

Untuk tes bingkai, tim melakukan MEMP pada kepala LLMS yang kuat seperti GPT-4O, Claude 3.5 Sonnet, Qwen2.5, dan mengevaluasi mereka pada tugas-tugas kompleks seperti pekerjaan rumah dalam indeks Alfworld dan perjalanan di bidang perjalanan. Hasil penelitian menunjukkan bahwa membangun dan mengambil memori prosedural memungkinkan agen untuk menyamakan dan menggunakan kembali pengalaman sebelumnya secara efektif.

Selama pengujian, tidak hanya agen MEMP mencapai tingkat keberhasilan yang lebih tinggi, tetapi juga lebih efisien. Mereka membatalkan eksplorasi, pengalaman, dan kesalahan yang tidak berpendidikan, yang menyebabkan penurunan signifikan dalam jumlah langkah dan konsumsi simbolik yang diperlukan untuk menyelesaikan tugas.

Menggunakan memori prosedural (kanan) agen membantu menyelesaikan tugas dalam langkah yang lebih sedikit dan menggunakan simbol yang lebih sedikit (Sumber: ARXIV)

Salah satu hasil terpenting untuk aplikasi lembaga adalah memori prosedural dapat dikonversi. Dalam satu percobaan, memori prosedural yang dibuat oleh GPT-4O yang kuat diberi model yang jauh lebih kecil, Qwen2.5-14b. Model yang lebih kecil telah menyaksikan pembayaran kinerja yang besar, meningkatkan tingkat keberhasilannya dan mengurangi langkah -langkah yang diperlukan untuk menyelesaikan tugas.

Menurut Fang, ini berfungsi karena model yang lebih kecil sering berurusan dengan prosedur sederhana, satu langkah tetapi tersandung ketika datang ke perencanaan dan pemikiran yang panjang dan pemikiran. Memori prosedural diisi dengan model yang paling efektif dengan kesenjangan daya ini. Ini menunjukkan bahwa pengetahuan dapat diperoleh dengan menggunakan model yang lebih baru, maka diterbitkan pada model yang lebih kecil dan lebih efektif tanpa kehilangan manfaat dari pengalaman itu.

Menuju faktor yang sangat independen

Dengan menyiapkan faktor dengan mekanisme pembaruan memori, kerangka kerja MEMP memungkinkan mereka untuk membangun dan memperbaiki pengetahuan prosedural mereka terus -menerus saat bekerja di lingkungan yang hidup. Para peneliti menemukan bahwa ini memberikan agen “kontinu dan hampir dengan tugas.”

Namun, cara untuk menyelesaikan sendiri -rule membutuhkan mengatasi hambatan lain: banyak tugas di dunia nyata, seperti menghasilkan laporan penelitian, tidak memiliki sinyal keberhasilan yang sederhana. Untuk meningkatkan terus menerus, agen perlu tahu apakah dia telah melakukan pekerjaan dengan baik. Fang mengatakan bahwa masa depan terletak pada menggunakan LLMS sendiri sebagai hakim.

“Hari ini kita sering berkumpul di antara model -model kuat dengan pangkalan tangan untuk menghitung level akhir,” katanya. “Ini berhasil, tetapi aturan yang ditulis secara manual rapuh dan sulit digeneralisasi.”

LLM-ES-LGAL dapat memberikan reaksi pengawasan yang akurat yang diperlukan untuk agen untuk koreksi diri dalam tugas yang kompleks dan diri sendiri. Ini akan membuat seluruh cincin pembelajaran lebih perkembangan dan kuat, yang merupakan langkah penting menuju membangun pekerja intelijen yang fleksibel, adaptif, dan independen yang benar -benar diperlukan untuk mengotomatiskan lembaga -lembaga tingkat lanjut.


Tautan sumber

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Trending

Exit mobile version