Berita

Untuk pertama kalinya di Patronus AI Percival untuk membantu lembaga memantau agen kecerdasan buatan dalam skala besar

Published

5 bulan ago

Mei 14, 2025

Wadi Wibowo

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut

Patronus AI Platform pemantauan baru hari ini secara otomatis menentukan kegagalan dalam sistem agen kecerdasan buatan, yang menargetkan kekhawatiran yayasan tentang keandalan karena aplikasi ini tumbuh lebih rumit.

Produk Keselamatan AI baru di San Francisco, produk baru, KetekunanDia menempatkan dirinya sebagai solusi pertama yang mampu mengidentifikasi pola kegagalan yang berbeda secara otomatis dalam sistem agen kecerdasan buatan dan menyarankan peningkatan perawatannya.

“Percival adalah solusi pertama untuk industri, yang secara otomatis menemukan berbagai pola kegagalan agen, kemudian secara sistematis menyarankan reformasi dan perbaikan untuk mengatasinya,” kata Anand Canapan, CEO dan co -founder Patronus AI, dalam wawancara eksklusif dengan VentureBeat.

Krisis Agen Kecerdasan Buatan yang Dapat Ditegakan: Mengapa Perusahaan Kehilangan Kontrol Sistem Independen

Lembaga yang mengadopsi program-program kapasitas agen kecerdasan buatan yang dapat merencanakan dan melakukan beberapa langkah multi-langkah secara independen-percepatan Dalam beberapa bulan terakhir, menciptakan tantangan administratif baru karena perusahaan berusaha memastikan pekerjaan sistem ini dengan andal.

Tidak seperti model pembelajaran otomatis tradisional, sistem berbasis sistem ini sering mencakup urutan proses yang panjang di mana kesalahan pada tahap awal dapat memiliki konsekuensi yang parah.

“Beberapa minggu yang lalu, kami menerbitkan model yang menentukan kemungkinan kegagalan agen, jenis efek yang mungkin terjadi pada merek, pada agen pelanggan dan hal -hal seperti itu,” kata Canaaban. “Ada risiko kesalahan yang konstan dengan agen yang kita lihat.”

Masalah ini menjadi sangat akut di lingkungan multi -agen di mana berbagai sistem kecerdasan buatan saling berinteraksi, membuat kurikulum uji tradisional semakin tidak cukup.

Menciptakan Inovasi Memori: Cara Membuat Struktur Revolusi Agen Percival AI dalam Menemukan Kesalahan

Ketekunan Ini membedakan dirinya dari alat evaluasi lain melalui strukturnya berdasarkan agen dan apa yang disebut perusahaan “silang memori”-kemampuan untuk belajar dari kesalahan sebelumnya dan beradaptasi dengan alur kerja tertentu.

Program ini dapat menemukan lebih dari 20 kegagalan berbeda di empat kategori: kesalahan pemikiran, kesalahan implementasi sistem, kesalahan perencanaan dan koordinasi, dan kesalahan lapangan.

“Tidak seperti LLM sebagai hakim, Percival sendiri adalah seorang agen, dan karena itu ia dapat melacak semua peristiwa yang terjadi di seluruh jalan,” jelas oleh Displan Disbandy, peneliti di Patronus AI. “Mereka dapat menghubungkan mereka dan menemukan kesalahan ini melalui konteks.”

Untuk institusi, manfaat paling mendesak tampaknya telah dikurangi hingga waktu koreksi. Menurut Patronus, pelanggan pertama mengurangi waktu alur kerja agen yang menganalisis dari sekitar satu jam menjadi satu dan 1,5 menit.

Benchmark jejak mengungkapkan kesenjangan kritis dalam kemampuan kecerdasan buatan

Selain meluncurkan produk, Patronus meluncurkan standar yang disebut Jejak (pelacakan pemikiran dan lokalisasi agen) Untuk menilai kualitas sistem, masalah dapat menemukan masalah dalam fungsi agen kecerdasan buatan.

Cari menggunakan Standar ini Ini mengungkapkan bahwa bahkan model kecerdasan buatan canggih sedang berjuang dengan analisis pelacakan yang efektif, dengan kinerja kinerja terbaik hanya 11 % pada standar.

Hasilnya menekankan sifat sulit dari pemantauan sistem kecerdasan buatan yang kompleks dan dapat membantu mengklarifikasi alasan untuk menginvestasikan lembaga besar dalam alat khusus untuk mengawasi kecerdasan buatan.

Pemimpin AI diadopsi oleh Percival Foundation untuk aplikasi opini

Ini termasuk adopsi lebih awal Munculnya kecerdasan buatanItu hampir memicu $ 100 juta dalam pembiayaan Ini mengembangkan sistem di mana ilmuwan kecerdasan buatan dapat membuat dan mengelola agen lain.

“Penetrasi baru-baru ini dari penampilan-faktor yang menciptakan faktor-tidak hanya mengendalikan pengembangan sistem adaptif dan generasi diri, tetapi juga bagaimana sistem ini mengendalikan dan memperluas ruang lingkup mereka dengan tanggung jawab,” kata Satia Nita, co-founder dan CEO AI, dalam sebuah pernyataan yang dikirim ke Tanfurchry.

Nova, klien awal lainnya, menggunakan teknologi untuk platform yang membantu perusahaan besar mendeportasi kode lama melalui integrasi SAP di mana kecerdasan buatan bekerja.

Klien -klien ini menggambarkan tantangan yang bertujuan untuk menyelesaikannya. Menurut Kannappan, beberapa perusahaan sekarang mengelola sistem agen dengan “lebih dari 100 langkah dalam satu panduan agen”, menciptakan kompleksitas yang melebihi apa yang mungkin bagi operator manusia secara efisien memantau.

Pasar pengawasan kecerdasan buatan sedang mempersiapkan pertumbuhan eksplosif dengan penyebaran sistem independen

Peluncuran ini terjadi di tengah kekhawatiran tentang peningkatan lembaga mengenai keandalan dan aturan kecerdasan buatan. Dengan perusahaan yang menyebar sistem yang semakin independen, kebutuhan akan alat pemantauan telah tumbuh proporsional.

Canaaban menunjukkan bahwa “hal yang sulit adalah bahwa sistem telah menjadi semakin mandiri,” menambahkan bahwa “miliaran baris kode dihasilkan setiap hari menggunakan kecerdasan buatan,” yang menciptakan lingkungan di mana pengawasan manual menjadi tidak mungkin.

Pasar pemantauan dan keandalan kecerdasan buatan diharapkan berkembang secara signifikan ketika lembaga beralih dari operasi penerbitan eksperimental ke aplikasi AI penting.

Percival terintegrasi dengan beberapa kerangka kecerdasan buatan, termasuk pelukan SmolagentsDan Pydantic AndaDan Agen Openai SDKDan LINJSHENYang membuatnya kompatibel dengan lingkungan pengembangan yang berbeda.

ketika Patronus AI Bukan penetapan harga atau pendapatan yang belum terungkap, fokus perusahaan untuk mengawasi tingkat lembaga menunjukkan bahwa ia mendefinisikan dirinya untuk pasar keselamatan AI perusahaan AI dengan margin tinggi yang diprediksi analis akan tumbuh secara dramatis dengan adopsi kecerdasan buatan.

Visi harian tentang kasus penggunaan bisnis dengan VB setiap hari

Jika Anda ingin membujuk bos Anda di tempat kerja, Anda telah membahas VB setiap hari. Kami memberi Anda prioritas jurnalistik internal atas apa yang dilakukan perusahaan dengan kecerdasan buatan kebidanan, dari transformasi organisasi hingga operasi penerbitan praktis, sehingga Anda dapat berbagi visi pengembalian investasi maksimum.

Baca Kebijakan Privasi Kami

Terima kasih telah berlangganan. Periksa lebih banyak buletin VB di sini.

Terjadi kesalahan.

Tautan sumber

ridlwan.com

Berita

Untuk pertama kalinya di Patronus AI Percival untuk membantu lembaga memantau agen kecerdasan buatan dalam skala besar

Krisis Agen Kecerdasan Buatan yang Dapat Ditegakan: Mengapa Perusahaan Kehilangan Kontrol Sistem Independen

Menciptakan Inovasi Memori: Cara Membuat Struktur Revolusi Agen Percival AI dalam Menemukan Kesalahan

Benchmark jejak mengungkapkan kesenjangan kritis dalam kemampuan kecerdasan buatan

Pemimpin AI diadopsi oleh Percival Foundation untuk aplikasi opini

Pasar pengawasan kecerdasan buatan sedang mempersiapkan pertumbuhan eksplosif dengan penyebaran sistem independen

Leave a Reply

Leave a Reply

Trending

Krisis Agen Kecerdasan Buatan yang Dapat Ditegakan: Mengapa Perusahaan Kehilangan Kontrol Sistem Independen

Menciptakan Inovasi Memori: Cara Membuat Struktur Revolusi Agen Percival AI dalam Menemukan Kesalahan

Benchmark jejak mengungkapkan kesenjangan kritis dalam kemampuan kecerdasan buatan

Pemimpin AI diadopsi oleh Percival Foundation untuk aplikasi opini

Pasar pengawasan kecerdasan buatan sedang mempersiapkan pertumbuhan eksplosif dengan penyebaran sistem independen

Leave a Reply Batalkan balasan

Leave a Reply

Trending

Leave a Reply