Berita

Agen proliferasi baru Google mensimulasikan penulisan manusia untuk meningkatkan penelitian kelembagaan

Published

on

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Peneliti Google Saya mengembangkan a Kerangka kerja baru untuk agen kecerdasan buatan mengungguli sistem mengemudi dari para pesaingnya Openai, Confusion, dan lainnya Pada standar utama.

Agen baru, dipanggil Tes berteriak waktu yang mendalam (TTD-DR), terinspirasi oleh cara orang menulis dengan melewati proses formulasi, mencari informasi dan membuat ulasan berulang.

Sistem ini menggunakan mekanisme proliferasi dan algoritma evolusi untuk menghasilkan penelitian yang lebih komprehensif dan akurat tentang topik yang kompleks.

Untuk institusi, kerangka kerja ini Apakah mungkin untuk menjalankan generasi baru asisten peneliti untuk tugas -tugas bernilai tinggi Ini adalah sistem generasi pemulihan biasa (RAG), seperti menghasilkan analisis kompetitif atau laporan masuk pasar.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Menurut penulis makalah, kasus penggunaan bisnis di dunia nyata adalah tujuan utama sistem.

Perbatasan agen penelitian mendalam saat ini

Faktor pencarian yang dalam (DR) dirancang untuk memproses pertanyaan kompleks yang melampaui penelitian sederhana. Mereka menggunakan model linguistik besar (LLM) untuk merencanakan, menggunakan alat-alat seperti pencarian web untuk mengumpulkan informasi, kemudian mengumpulkan hasil dalam laporan terperinci dengan bantuan teknik penskalaan pada saat pengujian seperti seri ide (COT), sampel terbaik N, dan pencarian pohon Monte-Carlo.

Namun, banyak dari sistem ini memiliki batasan desain dasar. Sebagian besar agen DR yang tersedia untuk umum menerapkan algoritma dan alat pengujian waktu pengujian tanpa struktur yang mencerminkan perilaku kognitif manusia. Faktor sumber terbuka sering mengikuti proses linier atau paralel untuk perencanaan, penelitian dan pembuatan konten, Ini membuat sulit dalam berbagai tahap untuk mencari berinteraksi satu sama lain dan mengoreksi mereka.

Contoh Agen Penelitian Linier (Sumber: ARXIV)

Hal ini dapat menyebabkan agen konteks universal kehilangan penelitian dan tidak memiliki komunikasi kritis antara berbagai bagian informasi.

Para penulis makalah ini juga memperhatikan, “Ini menunjukkan adanya pembatasan dasar dalam pekerjaan agen DR saat ini dan menyoroti perlunya kerangka yang lebih koheren dan dirancang untuk tujuan ini untuk agen DR yang meniru atau melampaui kemampuan penelitian manusia.”

Pendekatan baru yang terinspirasi oleh penulisan manusia dan penyebaran

Berbeda dengan proses linier dari sebagian besar agen kecerdasan buatan, para peneliti manusia sering bekerja. Mereka biasanya mulai dengan Rencana tingkat tinggi, membuat draft awal, kemudian terlibat dalam beberapa kursus ulasan. Selama ulasan ini, mereka mencari informasi baru untuk meningkatkan argumen mereka dan mengisi kekosongan.

Peneliti Google mencatat bahwa ini Proses manusia dapat disimulasikan dengan mekanisme model proliferasi Dihargai dengan komponen pengambilan. (Model proliferasi sering digunakan dalam pembuatan gambar. Mereka mulai dan secara bertahap memperbaikinya sampai menjadi gambar yang terperinci.)

Para peneliti juga menjelaskan, “Dalam pengukuran ini, model spread yang terlatih pada awalnya menciptakan rancangan yang bising dan menyatukan unit untuk mengurangi, dengan bantuan alat pemulihan, rancangan ini untuk output berkualitas tinggi (atau dengan akurasi yang lebih tinggi).”

TTD-DR dibangun di atas skema ini. Kerangka kerja ini diperlakukan untuk laporan penelitian sebagai penyebaran, sebagai draf “primer” “guhus” yang keras ditingkatkan menjadi laporan akhir yang dipoles.

TTD-DR menggunakan pendekatan berulang untuk meningkatkan rencana penelitian awal (sumber: arxiv)

Ini dicapai melalui dua mekanisme dasar. Yang pertama, yang oleh para peneliti disebut “pengurangan pengambilan”, dimulai dengan proyek pendahuluan dan sering memperbaikinya. Dalam setiap langkah, agen menggunakan draft saat ini untuk merumuskan kutipan pencarian baru, memulihkan informasi eksternal, dan mengintegrasikannya.

Mekanisme kedua menjamin, “pengembangan diri”, bahwa setiap komponen agen (rencana, generator pertanyaan, dan jawaban lengkapnya) bekerja secara mandiri untuk meningkatkan kinerjanya. Dalam komentar tentang VentureBeat, Rujun Han, ilmuwan riset Google dan rekan kerja makalah ini, menjelaskan bahwa perkembangan ini di tingkat komponen ini sangat penting karena membuat “laporan lebih efektif”. Ini mirip dengan proses evolusi karena setiap bagian dari sistem meningkat secara bertahap dalam misi spesifiknya, memberikan konteks berkualitas tinggi dari proses peninjauan utama.

Kedua bahan dalam TTD-DR menggunakan algoritma perkembangan untuk mengalami dan memperbaiki banyak respons secara paralel dan akhirnya menggabungkannya untuk membuat jawaban akhir (sumber: arxiv)

“Interaksi yang kompleks dan campuran sintetis dari algoritma ini sangat menentukan untuk mencapai hasil pencarian berkualitas tinggi,” kata penulis. Proses berulang ini secara langsung mengarah pada laporan yang tidak hanya lebih akurat, tetapi juga kohesi yang lebih logis. Han juga dicatat, karena model ini dievaluasi pada bantuan, yang meliputi kelancaran dan kohesi, keuntungan kinerja adalah ukuran langsung dari kemampuannya untuk menghasilkan dokumen bisnis yang terorganisir dengan baik.

Menurut koran, Teman penelitian yang dihasilkan “mampu menghasilkan laporan yang berguna dan komprehensif dari pertanyaan penelitian yang kompleks melalui berbagai bidang industri, Termasuk pembiayaan, biomedis, hiburan dan teknologi, “masukkan dalam kategori yang sama dengan produk pencarian yang mendalam dari Openai, Kebingungan, dan Grok.

TTD-DR di tempat kerja

Untuk membangun dan menguji kerangka kerja mereka, para peneliti menggunakan Grup Pengembangan Agen Google (ADK), yang merupakan platform ekstensi untuk mengatur tugas alur kerja AI yang kompleks, dengan Gemini 2.5 Pro sebagai LLM dasar (meskipun Anda dapat menggantinya pada model lain).

Mereka mengevaluasi TTD-DR terhadap sistem sumber terbuka dan open source, termasuk Openai Deep Research, Research Deep yang kebingungan, Grok DeepSearch dan Open Source GPT-Researcher.

Evaluasi berfokus pada dua bidang utama. Untuk menghasilkan laporan yang komprehensif bentuk panjang, gunakan DeepConsult StandarSeperangkat tuntutan dan konsultasi yang terkait dengan bisnis, bersama dengan set data pencarian panjang mereka. Untuk menjawab pertanyaan multi -grave yang membutuhkan penelitian dan pemikiran yang luas, menguji agen tentang menantang standar akademik dan realistis seperti Ujian kemanusiaan terakhir (Hill) dan Jaya.

Hasil TTD-DR terus mengungguli para pesaingnya. Sebagai perbandingan bersama dengan penelitian mendalam Openai pada laporan panjang, TTD-DR mencapai tingkat kemenangan 69,1 % dan 74,5 % dari dua kelompok yang berbeda. Sistem OpenAI juga telah melampaui tiga kriteria terpisah yang membutuhkan pemikiran multi -hukum untuk menemukan jawaban singkat, dengan 4,8 %, 7,7 %dan 1,7 %.

TTD-DD mengungguli agen penelitian mendalam lainnya atas standar utama (Sumber: ARXIV)

Masa depan waktu tes menyebar

Sementara penelitian saat ini berfokus pada laporan berbasis teks menggunakan pencarian web, Framework dirancang agar sangat mudah beradaptasi. Han menekankan bahwa tim berencana untuk memperluas pekerjaan untuk mengintegrasikan lebih banyak alat untuk tugas -tugas lembaga yang kompleks.

A Proses “waktu tes waktu” dapat digunakan mirip dengan membuat kode perangkat lunak yang kompleksDan Buat model keuangan yang terperinciAtau Desain Kampanye Pemasaran Multi -TahapDi mana “draft” pendahuluan untuk proyek tersebut Ulangi pengulangan informasi baru Komentar tersebut berasal dari berbagai alat khusus.

“Semua alat ini dapat digabungkan secara alami dalam kerangka kerja kami,” kata Han, menunjukkan bahwa pendekatan memberontak ini dapat menjadi struktur dasar dari berbagai faktor kompleks kecerdasan buatan.


Tautan sumber

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Trending

Exit mobile version