Connect with us

Berita

Lupakan Deskripsi Data: R-Zero Tence menjelaskan bagaimana LLMS dapat melatih dirinya sendiri

Published

on

Apakah Anda ingin lebih banyak visi yang lebih cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Kerangka Pelatihan Baru Para peneliti berkembang di Tencent AI Lab Dan Universitas Washington di Saint Lewis Model LLMS memungkinkan diri mereka untuk meningkatkan diri mereka sendiri tanpa perlu Data tanda manusia apa pun. Teknologi ini disebut R-ZeroPembelajaran penguatan digunakan untuk membuat data pelatihan mereka dari awal, dan memproses salah satu hambatan utama dalam menciptakan sistem kecerdasan buatan. R-Zero bekerja dengan memiliki dua model independen yang berkembang dengan berinteraksi satu sama lain dan menantangnya.

Eksperimen menunjukkan bahwa R-Zero sangat meningkatkan kemampuan berpikir di berbagai LLM, yang dapat mengurangi kompleksitas dan biaya pelatihan lanjutan. Untuk institusi, pendekatan ini dapat mempercepat pengembangan model khusus untuk tugas berpikir kompleks tanpa akun yang luar biasa dari pengaturan data formal.

Tantangan Pengembangan Diri LLMS

Gagasan di balik LLMS adalah untuk meningkatkan diri sendiri penciptaan sistem internasional amnesti yang dapat dibuat secara mandiri, memoles, dan belajar dari pengalaman mereka sendiri. Ini memberikan jalur pengembangan yang lebih cerdas dan mampu menuju kecerdasan buatan. Namun, tantangan utamanya adalah bahwa melatih model -model ini membutuhkan tugas dan tanda -tanda berkualitas tinggi dalam jumlah besar, yang bertindak sebagai tanda -tanda kecerdasan buatan untuk belajar dari mereka.

Ketergantungan pada kondisi manusia untuk membuat data ini tidak hanya mahal dan lambat, tetapi juga menciptakan hambatan dasar. Ini secara efektif membatasi potensi kemampuan kecerdasan buatan pada apa yang dapat diajarkan manusia. Untuk mengatasi hal ini, para peneliti telah mengembangkan metode stiker -bebas yang memperoleh sinyal bonus langsung dari output model khusus, misalnya, dengan mengukur kepercayaan mereka pada jawaban. Sementara metode ini menghilangkan kebutuhan untuk stiker eksplisit, mereka masih mengandalkan kelompok tugas yang sudah ada sebelumnya, yang membatasi kemampuan untuk menerapkannya dalam skenario pengembangan diri yang benar -benar.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Metode lain termasuk keberadaan model menghasilkan tugas mereka sendiri untuk belajar dari mereka. Namun, di bidang -bidang seperti pemikiran terbuka, di mana tidak ada cara sederhana untuk memeriksa hak (seperti simbol), jaminan kualitas data yang dihasilkan sendiri ini merupakan hambatan besar.

Bagaimana R-Zero bekerja

R-Zero adalah kerangka kerja yang dirancang untuk pelatihan LLMS yang dapat berkembang dari nol data eksternal. Proses dimulai dengan model dasar tunggal, dibagi menjadi rotasi: “Challenger” dan “Halal”. Kedua model ini ditingkatkan secara mandiri, tetapi mereka berkembang bersama melalui siklus reaksi yang berkelanjutan.

Tujuan lawan adalah membuat tugas baru hanya pada ambang kemampuan solusi saat ini, dan tidak mudah atau tidak mungkin. Analis, pada gilirannya, semakin menyelesaikan tugas -tugas kompleks ini. Dalam komentar tertulis kepada VentureBeat, Chengsong Huang, rekan penulis makalah dan mahasiswa PhD di Washington University di Saint Lewis, menjelaskan bahwa dinamika ini sangat penting karena menghasilkan pertanyaan berkualitas tinggi seringkali lebih rumit daripada menemukan jawaban.

“Apa yang kami temukan di lingkungan yang praktis adalah bahwa tantangan terbesar adalah tidak menghasilkan jawaban … melainkan, menghasilkan pertanyaan berkualitas tinggi, novel, dan secara bertahap lebih sulit,” kata Huang. “Kami percaya bahwa guru yang baik jarang terjadi dari siswa yang baik. Dinamika evolusi bersama diotomatisasi oleh penciptaan” guru “ini, memastikan kurikulum tetap dan dinamis yang mendorong Solver sebagian besar dapat dicapai dengan apa yang dapat dicapai oleh set data yang tetap dan pra -sekarang.

Setelah Challenger membuat pertanyaan yang cukup, mereka dinominasikan untuk keragaman dan dikumpulkan dalam kumpulan data pelatihan. Dalam tahap pelatihan di Solver, disita pada pertanyaan -pertanyaan sulit ini. Jawaban “benar” ditentukan untuk setiap pertanyaan dengan suara mayoritas dari upaya sebelumnya ke Jalfar.

Seluruh proses ini diulangi, yang mengarah pada penciptaan loop peningkatan diri yang bekerja tanpa intervensi manusia, memungkinkan kedua model untuk saling mendorong untuk menjadi lebih mampu untuk setiap pengulangan.

R-Zero di tempat kerja

Para peneliti R-Zero telah menguji beberapa LLM open source, termasuk model keluarga Qwen3 dan Octothhinker. Mereka pertama kali melatih model tentang masalah matematika dan kemudian menguji apakah keterampilan berpikir yang dipelajari dapat diedarkan ke standar kompleks lainnya seperti bidang publik Mmlu-for (Berbagai tugas pemahaman dan pemahaman) dan Supergpqa (Tugas Sains dan Logika).

Hasil penelitian menunjukkan bahwa R-Zero adalah kerangka kerja yang sangat efektif, model. Misalnya, QWEN3-4B telah memperkuat basis dengan rata-rata +6,49 melalui standar pemikiran matematika. Proses pelatihan terus -menerus dan sangat kinerja, dengan keuntungan terakumulasi pada banyak pengulangan. Model QWEN3-8B-base terbesar melihat poin matematika rata-rata sebesar +5,51 poin setelah tiga pengulangan.

Hasil utama adalah lompatan kinerja langsung setelah pengulangan pertama, yang telah valid dalam efektivitas peran lawan dalam menciptakan kurikulum pendidikan berkualitas tinggi. “Ini menegaskan bahwa kurikulum pintar yang dibuat oleh saingannya RL secara signifikan lebih efektif daripada yang bukan trainer,” tulis para peneliti dalam makalah mereka.

Perlu dicatat bahwa keterampilan yang dipelajari dari masalah matematika telah secara efektif ditransfer ke tugas pemikiran umum, sehingga meningkatkan kemampuan model dasar. Sebagai contoh, model base QWEN3-4B menunjukkan dirinya peningkatan +7,54 pada kriteria untuk berpikir dalam domain publik. Penemuan lain yang menarik adalah bahwa R-Zero dapat berfungsi sebagai langkah yang menentukan sebelum pelatihan. Model-model yang pertama kali ditingkatkan oleh R-Zero telah membuat kinerja yang lebih tinggi ketika mereka kemudian mengaturnya pada data tradisional, menunjukkan bahwa bingkai berfungsi sebagai penguat kinerja.

Untuk lembaga, pendekatan “nol data” dapat menjadi perubahan untuk permainan, terutama di bidang khusus di mana data berkualitas tinggi jarang atau tidak ada. Huang menyoroti bahwa fitur utama R-Zero adalah kemampuannya untuk menghindari bagian yang paling mahal dan membutuhkan waktu lama untuk mengembangkan kecerdasan buatan: aktivasi data.

Dia mengatakan: “Pendekatan kami melebihi leher botol dasar karena harus menemukan kelompok data berkualitas tinggi, memberi nama dan mengklasifikasikannya.” “Ini tidak hanya terkait dengan skala untuk menghemat biaya; ini adalah jalan menuju menciptakan kecerdasan buatan yang dapat melampaui kemampuan manusia, karena tidak lagi terbatas dalam ruang lingkup pengetahuan atau data manusia.”

Namun, proses evolusi bersama juga mengungkapkan tantangan yang menentukan. Karena Challenger menghasilkan masalah yang lebih sulit, kemampuan Solver untuk menghasilkan jawaban “benar” yang andal melalui suara mayoritas mulai berkurang. Para peneliti menemukan bahwa keakuratan sebenarnya dari stiker yang dibuat sendiri ini menurun dari 79 % dalam pengulangan pertama menjadi 63 % di ketigaDibandingkan dengan Oracle LLM yang kuat seperti GPT -4. Penurunan kualitas data ini merupakan perbandingan utama dan sebotol kinerja jangka panjang yang mungkin.

Huang mengakui bahwa ini adalah masalah penting untuk model pengembangan diri. Dia mengatakan: “Pekerjaan kami adalah bukti konsep yang mengklarifikasi potensi pendekatan ini, tetapi kami mengakui bahwa mempertahankan peningkatan yang stabil dalam jangka panjang tanpa dataran tinggi adalah hambatan yang hebat.” “Memecahkan masalah ini akan menjadi langkah berikutnya yang menentukan bagi seluruh komunitas riset.”

Para peneliti juga menyoroti pembatasan utama bingkai: mekanisme saat ini adalah yang paling tepat untuk bidang seperti matematika di mana kesehatan dapat ditentukan secara objektif. Jadi, bagaimana model yang kuat ini dapat meluas ke lebih banyak tugas institusional seperti membuat versi pemasaran atau meringkas laporan?

Huang menyarankan bahwa rute potensial mencakup penambahan agen Amnesty International tingkat lanjut ke campuran: “expier” atau “kritikus”.

“Alih -alih evaluasi untuk jawaban” benar “yang sederhana, verifikasi ini akan dilatih untuk mengevaluasi kualitas solusi solusi berdasarkan kriteria yang lebih akurat,” jelasnya. “Dinamika evolusi bersama kemudian akan memasukkan penciptaan Callinger, solusi yang menghasilkan respons, dan verifikasi yang memberikan sinyal kualitas, dengan ketiga model meningkat bersama.”

Meskipun ini tetap menjadi arah untuk penelitian di masa depan, ini menunjukkan masa depan di mana sistem kecerdasan buatan sepenuhnya dikuasai dapat menguasai logika objektif, tetapi juga berpikir sendiri.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Diskusi mengenai patung kontroversial Portland berakhir dengan keputusan untuk mengembalikannya

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Patung Abraham Lincoln dan Theodore Roosevelt akan dikembalikan ke tempatnya di Blok South Park Portland setelah proses keterlibatan publik menentukan bahwa patung tersebut harus dikembalikan.

Monumen-monumen tersebut, yang dirobohkan lima tahun yang lalu saat protes Hari Kemarahan Masyarakat Adat, akan dikembalikan setelah serangkaian sesi publik di mana para peserta mengungkapkan berbagai alasan kepulangan mereka.

Kota mawar saya sebutkan Banyak warga yang sangat prihatin dengan pemasangan kembali Lincoln Memorial. Salah satu peserta mengatakan mereka ingin mengembalikan patung-patung itu “karena kaum anarkis memindahkannya secara ilegal.”

Penangkapan dilakukan ketika agitator anti-Ice tertangkap kamera sedang bentrok dengan pejabat federal di luar fasilitas Portland

Pemandangan udara Sungai Willamette yang mengalir melalui pusat kota Portland. (Joe Sohm/America Visions/Koleksi Gambar Global melalui Getty Images)

Warga lainnya menentang “penghapusan monumen” dan mendesak adanya “perbincangan tingkat tinggi” tentang bagaimana “menempatkan monumen dalam konteks yang sesuai untuk audiens saat ini dan masa depan.”

Mengontekstualisasikan kembali sejarah yang tertulis pada patung tetap menjadi tema umum, sementara yang lain memiliki gagasan yang sama bahwa penghormatan “mungkin akan lebih berhasil di masyarakat lain.”

Laporan tersebut juga mencatat adanya “vandalisme tidak sah” terhadap patung-patung, dimana salah satu warga Portland menyatakan bahwa “gerombolan anarkis kulit putih muda tidak boleh mendikte kebijakan kota,” sambil menyerukan agar kota tersebut memberikan suara secara terbuka pada setiap patung yang dipindahkan.

Para pengungkap fakta (whistleblower) memperingatkan bahwa imigran ilegal mengirimkan ‘gelombang kejutan’ melalui industri-industri penting

Seseorang menginjakkan kakinya di atas patung presiden yang hancur

Patung Theodore Roosevelt dihancurkan selama protes “Hari Kemarahan Pribumi” tahun 2020 di Portland, Oregon. (Nathan Howard/Getty Images)

Peserta lain setuju, dengan mengatakan bahwa massa yang menghancurkan monumen tersebut “tidak mewakili Portland.”

Peserta lain mengatakan, “Portland adalah kota muda, kita harus melestarikan masa lalu kita yang terbatas… Monumen yang rusak harus diperbaiki dan dipasang kembali secepat mungkin… Penghancuran monumen publik (dan) karya seni secara kriminal tidak boleh menjadi insentif untuk bersatu kembali.”

Gubernur Louisiana Landry menyerukan Universitas Negeri Louisiana untuk mendirikan patung Charlie Kirk di kampus

Seseorang merusak patung

Seseorang merusak patung Theodore Roosevelt di Portland selama “Hari Kemarahan Masyarakat Adat” pada tahun 2020.

Pemilih Dalam hal ini Mereka dilaporkan terpecah menjadi dua kelompok berbeda: kelompok pertama menyerukan pembaruan konteks setiap patung, sementara kelompok lainnya berfokus pada penciptaan kembali monumen bersejarah.

kata Deb Elliott, seorang profesor di Regional Research Institute di Portland State University Oregon bahwa sekelompok orang ingin memperbarui monumen tersebut “dengan narasi lengkap tentang pengaruh tokoh sejarah,” sementara yang lain ingin “hanya mengembalikan monumen tersebut.”

Patung Lincoln diperkirakan akan dipasang kembali pada awal tahun 2026, dan patung Roosevelt akan menyusul sekitar setahun kemudian.

KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS

Tautan sumber

Continue Reading

Berita

Jutaan orang bisa kehilangan kupon makanan pada tanggal 1 November di tengah lockdown, Brooke Rollins memperingatkan

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Menteri Pertanian Brooke Rollins memperingatkan bahwa jutaan orang Amerika bisa kehilangan manfaat kupon makanan mulai 1 November karena penutupan pemerintah yang sedang berlangsung.

Dia menyalahkan Partai Demokrat karena menolak memberikan suara mengenai langkah-langkah untuk membuka kembali pemerintahan dan memulihkan pendanaan SNAP, dengan mengatakan USDA kehabisan uang untuk memberi makan jutaan orang Amerika.

“Kita berada di ambang kehancuran,” kata Rollins kepada America Reports pada hari Selasa. “Saya sudah memperingatkan hal ini selama hampir sebulan, bahwa kita punya cukup uang untuk melewati akhir Oktober. Namun setelah itu, pemerintahan harus dibuka kembali.”

Jaminan Sosial, bandara, kupon makanan: Bagaimana dampaknya selama penutupan pemerintah?

Penutupan pemerintahan telah memasuki minggu keempat di tengah krisis layanan kesehatan. Partai Demokrat mengatakan mereka tidak akan setuju untuk membuka kembali pemerintahan kecuali RUU tersebut mencakup perpanjangan manfaat Undang-Undang Perawatan Terjangkau, yang akan berakhir pada tahun 2025.

Menteri Pertanian AS Brooke Rollins berbicara dengan Gubernur Texas Greg Abbott dalam konferensi pers di Texas State Capitol di Austin, Texas, pada 15 Agustus. (Gambar Brandon Bell/Getty)

Mereka berpendapat bahwa kegagalan untuk bertindak sebelum pendaftaran dibuka pada bulan November dapat mengakibatkan premi asuransi yang lebih tinggi bagi jutaan orang Amerika, sementara Partai Republik mengatakan mereka tidak akan bernegosiasi sampai pemerintahan dibuka kembali.

“Kelaparan tidak memiliki partai politik. Kemiskinan tidak membeda-bedakan antara negara bagian yang merupakan Partai Republik, Demokrat, negara bagian biru atau merah. Itu nyata,” kata Rollins.

Partai Demokrat telah meminta pemerintahan Trump untuk menggunakan dana darurat SNAP pemerintah federal, namun USDA mengatakan mereka tidak diizinkan secara hukum untuk menggunakan dana tersebut dalam kasus ini.

Ketua DPR Mike Johnson

Ketua DPR Mike Johnson berbicara dalam konferensi pers di US Capitol pada hari ke-10 penutupan pemerintah federal pada 10 Oktober 2025, di Washington, D.C. (Alex Wroblowski/AFP melalui Getty Images)

Pemerintahan Trump memperingatkan bahwa 42 juta orang Amerika bisa kehilangan kupon makanan jika penutupan pemerintahan terus berlanjut

Ketua DPR Mike Johnson setuju, dan mengatakan bahwa analisis hukum yang dia lihat menunjukkan bahwa uang tersebut seharusnya sudah dialokasikan sebelumnya untuk penggunaan tersebut. Itu berarti dana SNAP bisa habis pada hari Sabtu.

Memo USDA yang diperoleh Fox News Digital memperkirakan bahwa 42 juta orang bisa kehilangan manfaat SNAP mulai bulan November.

Rollins menuduh Partai Demokrat memanfaatkan “masyarakat miskin dan rentan terhadap tekanan” dalam pertarungan mereka mengenai layanan kesehatan.

Klik di sini untuk mengunduh aplikasi FOX NEWS

“Demokrat terus memberikan suara berulang kali untuk menjaga pemerintahan ini tetap tertutup,” kata Rollins.

“Ini luar biasa bagi saya. Saya tidak mengerti apa yang mereka pikirkan.”

Tautan sumber

Continue Reading

Berita

Kantor Pusat Agen GitHub bertujuan untuk memecahkan masalah terbesar dalam pengkodean AI perusahaan: terlalu banyak agen, dan tidak ada kendali pusat

Published

on

github Ini merupakan taruhan yang berani bahwa perusahaan tidak memerlukan agen pengkodean berpemilik lainnya. Mereka membutuhkan cara untuk mengelola semuanya.

Pada konferensi Universe 2025, platform pengembang milik Microsoft mengumumkan Agent HQ. Arsitektur baru ini mengubah GitHub menjadi bidang kendali terpadu untuk mengelola beberapa codec AI dari pesaing termasuk Anthropic, OpenAI, Google, Cognition, dan xAI. Daripada memaksa pengembang untuk mencoba satu agen, perusahaan memposisikan dirinya sebagai lapisan orkestrasi utama di bawah semuanya.

Kantor Pusat Agen mewakili upaya GitHub untuk menerapkan pendekatan platform kolaborasinya pada agen AI. Sama seperti perusahaan yang mengubah Git, pull request, dan CI/CD menjadi alur kerja kolaboratif, kini mereka mencoba melakukan hal yang sama dengan lanskap pengkodean AI yang terfragmentasi.

Pengumuman ini mewakili apa yang disebut GitHub sebagai transisi "Satu gelombang" ke "Gelombang kedua" Untuk pengembangan dengan bantuan kecerdasan buatan. Menurut laporan GitHub Octoverse, 80% pengembang baru menggunakan Copilot pada minggu pertama mereka dan AI telah membantu mendorong peningkatan signifikan dalam penggunaan platform GitHub secara keseluruhan.

"tahun laluPengumuman besar bagi kami, dan apa yang kami katakan sebagai sebuah perusahaan adalah bahwa gelombang pertama telah berakhir, dan itu adalah semacam penyelesaian kode," Mario Rodriguez, chief operating officer GitHub, mengatakan kepada VentureBeat. "Kita berada di era gelombang kedua, dan gelombang kedua adalah multimedia, akan berfungsi dan akan memberikan pengalaman baru yang akan terasa seperti AI asli."

Apa kantor pusat agennya?

GitHub telah memperbarui alat pengkodean GitHub Copilot untuk era proxy dengan debutnya Agen pembantu Github pada bulan Mei.

Agen HQ mengubah GitHub menjadi ekosistem terbuka yang menyatukan beberapa agen pengkodean AI dalam satu platform. Dalam beberapa bulan mendatang, agen pemrograman dari Anthropic, OpenAI, Google, Cognition, xAI, dan lainnya akan tersedia langsung di GitHub sebagai bagian dari langganan GitHub Copilot berbayar yang sudah ada.

Arsitekturnya mempertahankan dasar-dasar inti GitHub. Pengembang masih bekerja dengan Git, menarik permintaan dan masalah. Mereka masih menggunakan komputasi favoritnya, baik itu GitHub Actions atau driver yang dihosting sendiri. Perubahan apa yang terjadi pada lapisan di atas: agen dari beberapa vendor kini dapat bekerja dalam perimeter keamanan GitHub, menggunakan kontrol identitas, izin cabang, dan log audit yang sama yang sudah dipercaya oleh organisasi kepada pengembang manusia.

Pendekatan ini pada dasarnya berbeda dari alat yang berdiri sendiri. Saat pengembang menggunakan Cursor atau memberikan akses repositori ke Claude, agen ini biasanya mendapatkan izin luas di seluruh repositori. Kantor pusat agen mempartisi akses di tingkat cabang dan merangkum semua aktivitas agen dalam kontrol tata kelola tingkat perusahaan.

Kontrol Misi: Antarmuka tunggal untuk semua agen

Pusat Kontrol Misi terletak di jantung kantor pusat pelanggan. Ini adalah pusat komando terpadu yang selalu terlihat di seluruh antarmuka web GitHub, VS Code, aplikasi seluler, dan baris perintah. Dengan kontrol misi, pengembang dapat menugaskan pekerjaan ke beberapa agen secara bersamaan. Mereka dapat melacak kemajuan dan mengelola izin, semuanya dari satu panel kaca.

Arsitektur teknologi mengatasi masalah penting perusahaan: keamanan. Tidak seperti aplikasi proksi mandiri yang mengharuskan pengguna memberikan akses luas ke repositori, kantor pusat proksi GitHub menerapkan kontrol yang sangat ketat di tingkat platform.

"Agen pemrograman kami memiliki serangkaian kontrol dan kemampuan keamanan yang dibangun ke dalam platform secara asli, dan itulah yang kami berikan kepada semua agen lainnya juga," Rodriguez menjelaskan. "Ini berjalan menggunakan token GitHub yang sangat terbatas dalam apa yang sebenarnya dapat dilakukannya."

Agen yang bekerja melalui kantor pusat agen hanya dapat berkomitmen pada cabang yang ditunjuk. Ini berjalan dalam lingkungan GitHub Actions sandbox dengan perlindungan firewall. Mereka beroperasi di bawah kontrol identitas yang ketat. Bahkan jika pelanggan menjadi nakal, firewall mencegah mereka mengakses jaringan eksternal atau mencuri data kecuali perlindungan tersebut secara eksplisit dinonaktifkan, jelas Rodriguez.

Diferensiasi teknis: integrasi MCP dan agen khusus

Selain mengelola agen pihak ketiga, GitHub menawarkan dua kemampuan teknis yang membedakan Kantor Pusat Agen dari pendekatan alternatif seperti editor Cursor mandiri atau integrasi Claude Anthropic.

Agen khusus melalui file AGENTS.md: Organisasi sekarang dapat membuat file konfigurasi yang dikontrol sumber yang menentukan aturan, alat, dan batasan khusus tentang bagaimana perangkat lunak Copilot berperilaku. Misalnya, sebuah perusahaan dapat menentukan… "Lebih suka perekam ini" atau "Gunakan tes berbasis tabel untuk semua prosesor." Hal ini mengakibatkan standar peraturan dienkripsi secara permanen tanpa mengharuskan pengembang untuk melakukan klaim ulang setiap saat.

"Agen yang berdedikasi memiliki sejumlah besar ceruk pasar dalam organisasi, karena mereka hanya dapat mengkodifikasikan serangkaian keterampilan yang dapat dilakukan orkestrasi, dan kemudian menstandarkannya dan mendapatkan hasil berkualitas tinggi juga," kata Rodriguez.

Spesifikasi AGENTS.md memungkinkan tim untuk mengontrol versi perilaku agen mereka bersama dengan kode mereka. Saat pengembang mengkloning repositori, ia secara otomatis mewarisi aturan proksi khusus. Hal ini memecahkan masalah yang terus-menerus terjadi pada alat pengkodean AI: kualitas keluaran yang tidak konsisten ketika anggota tim yang berbeda menggunakan strategi motivasi yang berbeda.

Dukungan untuk Protokol Konteks Model Asli (MCP).: VS Code sekarang menyertakan registri GitHub MCP. Pengembang dapat menemukan, menginstal, dan mengaktifkan server MCP dengan satu klik. Mereka kemudian dapat membuat agen kustom yang menggabungkan alat-alat ini dengan perintah sistem tertentu.

Hal ini menempatkan GitHub sebagai titik integrasi antara ekosistem MCP yang baru muncul dan alur kerja pengembang sebenarnya. MCP, yang diperkenalkan oleh Anthropic namun dengan cepat mendapatkan dukungan industri, telah menjadi standar de facto untuk komunikasi agen-ke-instrumen. Dengan mendukung spesifikasi lengkap, GitHub dapat mengatur agen yang perlu mengakses layanan eksternal tanpa setiap agen menerapkan logika integrasinya sendiri.

Kembangkan rencana dan tinjau kode agen

GitHub juga mengirimkan kemampuan baru dalam VS Code itu sendiri. Mode Rencana memungkinkan pengembang berkolaborasi dengan Copilot dalam membangun pendekatan proyek langkah demi langkah. AI mengajukan pertanyaan klarifikasi sebelum menulis kode apa pun. Setelah disetujui, rencana tersebut dapat dijalankan secara lokal di VS Code atau oleh agen berbasis cloud.

Fitur ini mengatasi mode kegagalan umum dalam pengkodean AI: memulai implementasi sebelum persyaratan dipahami sepenuhnya. Dengan menerapkan fase perencanaan yang jelas, GitHub bertujuan untuk mengurangi upaya yang sia-sia dan meningkatkan kualitas hasil.

Yang terpenting, fitur peninjauan kode GitHub menjadi efektif. Aplikasi baru ini akan memanfaatkan mesin CodeQL GitHub, yang sebelumnya berfokus pada kerentanan keamanan, untuk mengidentifikasi bug dan masalah pemeliharaan. Agen peninjau kode akan secara otomatis memeriksa permintaan penarikan yang dihasilkan oleh agen sebelum peninjauan manusia. Hal ini menciptakan gerbang kualitas dua tahap.

"Agen peninjau kode kami akan dapat melakukan panggilan ke mesin CodeQL untuk kemudian menemukan banyak kesalahan," Rodriguez menjelaskan. "Kami sedang berupaya mengembangkan mesin tersebut dan kami akan dapat memanfaatkan mesin tersebut juga untuk menemukan bug."

Pertimbangan Perusahaan: Apa yang Harus Dilakukan Sekarang

Untuk organisasi yang telah menerapkan beberapa alat pengkodean AI, Kantor Pusat Agen menyediakan jalur menuju integrasi tanpa memaksa penghapusan alat tersebut.

Pendekatan multi-agen GitHub memberikan fleksibilitas vendor dan mengurangi risiko lock-in. Organisasi dapat menguji beberapa agen dalam perimeter keamanan terpadu dan beralih penyedia tanpa melatih ulang pengembang. Dampaknya mungkin berupa pengalaman yang kurang optimal dibandingkan dengan alat khusus yang mengintegrasikan UI dan perilaku agen secara erat.

Rekomendasi Rodriguez jelas: mulailah dengan agen yang berdedikasi. Agen yang berdedikasi memungkinkan organisasi untuk secara konsisten menyusun standar peraturan yang diikuti oleh agen. Setelah terbentuk, organisasi dapat menambahkan agen eksternal tambahan untuk memperluas kemampuan.

"Buka dan terapkan pengkodean proxy dan proxy khusus dan mulailah bermain dengannya;" Dia berkata. "Ini adalah kemampuan masa depan, dan ini memungkinkan Anda untuk benar-benar mulai membentuk SDLC Anda sehingga disesuaikan dengan Anda, organisasi Anda, dan karyawan Anda."

Tautan sumber

Continue Reading

Trending