Connect with us

Berita

Apakah memperbarui agen AI Anda akan membantu atau menghambat kinerja mereka? Alat eksperimen Raindrop yang baru memberi tahu Anda

Published

on

Tampaknya hampir setiap minggu dalam dua tahun terakhir sejak peluncuran ChatGPT, model bahasa besar (LLM) baru telah dirilis dari laboratorium pesaing atau dari OpenAI itu sendiri. Dunia usaha berada di bawah tekanan yang kuat untuk mengikuti laju perubahan yang eksponensial, apalagi memahami cara beradaptasi – model baru mana, jika ada, yang harus mereka adopsi untuk mendukung alur kerja mereka dan agen AI khusus yang mereka bangun untuk mengimplementasikannya?

Bantuan tiba: Luncurkan kemampuan observasi aplikasi AI rintik hujan Eksperimen diluncurkansebuah fitur analitik baru yang digambarkan oleh perusahaan sebagai rangkaian pengujian A/B pertama yang dirancang khusus untuk agen AI perusahaan — memungkinkan perusahaan melihat dan membandingkan bagaimana memperbarui agen ke model dasar baru, atau mengubah instruksi dan akses ke alat, berdampak pada kinerja mereka dengan pengguna akhir yang sebenarnya.

Rilis ini memperluas alat pemantauan Raindrop yang ada, memberikan pengembang dan tim cara untuk melihat bagaimana agen mereka berperilaku dan berkembang dalam kondisi dunia nyata.

Dengan menggunakan eksperimen, tim dapat melacak bagaimana perubahan—seperti alat atau perintah baru, memperbarui formulir, atau membangun kembali seluruh alur—memengaruhi kinerja AI di jutaan interaksi pengguna. Fitur baru ini sekarang tersedia untuk pengguna paket berlangganan Pro Raindrop ($350 per bulan) di Tetesan hujan.ai.

Lensa berbasis data tentang pengembangan agen

Salah satu Pendiri dan CTO Raindrop Bin Hallaq Tercatat dalam video pengumuman produk (di atas) bahwa eksperimen membantu tim mengetahui “cara mengubah apa pun secara harfiah”, termasuk penggunaan alat, niat pengguna, tingkat rilis, dan mengeksplorasi perbedaan berdasarkan demografi seperti bahasa. Tujuannya adalah membuat iterasi model lebih transparan dan terukur.

Antarmuka Eksperimen menampilkan hasil secara visual, menunjukkan kapan eksperimen berperforma lebih baik atau lebih buruk daripada garis dasar. Peningkatan sinyal negatif mungkin mengindikasikan kegagalan tugas yang lebih besar atau keluaran kode parsial, sedangkan peningkatan sinyal positif dapat mencerminkan respons yang lebih lengkap atau pengalaman pengguna yang lebih baik.

Dengan membuat data ini lebih mudah diinterpretasikan, Raindrop mendorong tim AI untuk melakukan pendekatan terhadap iterasi agen dengan ketelitian yang sama seperti penerapan perangkat lunak modern – melacak hasil, berbagi wawasan, dan mengatasi regresi sebelum menjadi lebih buruk.

Latar Belakang: Dari observasi kecerdasan buatan hingga eksperimen

Peluncuran uji coba Raindrop dibangun di atas fondasi perusahaan sebagai salah satu yang pertama Platform observasi AI aslidirancang untuk membantu organisasi memantau dan memahami perilaku sistem AI generatif mereka dalam produksi.

Seperti yang dilaporkan VentureBeat awal tahun ini, perusahaan – yang awalnya dikenal sebagai Dawn AI – telah muncul untuk mengatasi masalah tersebut, Mantan perancang antarmuka manusia di Apple, ia menyebut “masalah kotak hitam” kinerja AI, membantu tim menemukan kegagalan “saat terjadi” dan menjelaskan kepada organisasi apa yang salah dan alasannya."

Pada saat itu, Hylac menggambarkan bagaimana “produk AI terus-menerus gagal, dengan cara yang lucu sekaligus menakutkan,” dan menyatakan bahwa tidak seperti perangkat lunak tradisional, yang membuat pengecualian secara eksplisit, “produk AI gagal secara diam-diam.” Platform Raindrop asli berfokus pada pendeteksian kegagalan diam-diam ini dengan menganalisis sinyal seperti komentar pengguna, kegagalan tugas, penolakan, dan anomali percakapan lainnya di jutaan peristiwa harian.

Salah satu pendiri perusahaan — Hilak, Alexis JubaDan Zubin Singh Kotecha Raindrop dibuat setelah menghadapi kesulitan dalam men-debug sistem AI dalam produksi.

“Kami memulai dengan membangun produk AI, bukan infrastruktur,” kata Hilak. venturebeat. “Namun dengan cepat, kami menyadari bahwa untuk mengembangkan sesuatu yang serius, kami memerlukan alat untuk memahami perilaku AI — dan alat tersebut tidak ada.”

Menggunakan eksperimen, Raindrop memperluas tugas yang sama Deteksi kegagalan ke Ukur perbaikan. Alat baru ini mengubah data observasi menjadi perbandingan yang dapat ditindaklanjuti, memungkinkan organisasi menguji apakah perubahan dalam model, klaim, atau saluran membuat agen AI mereka lebih baik atau hanya berbeda.

Selesaikan masalah “Rating lolos, agen gagal”.

Meskipun kerangka evaluasi tradisional berguna untuk mengukur kinerja, kerangka kerja tersebut jarang menangkap perilaku agen AI yang tidak dapat diprediksi yang beroperasi di lingkungan dinamis.

Sebagai salah satu pendiri Raindrop Alexis Juba Dia menjelaskannya Iklan LinkedIn“Evaluasi tradisional tidak benar-benar menjawab pertanyaan ini. Ini merupakan pengujian unit yang hebat, namun Anda tidak dapat memprediksi tindakan pengguna dan agen Anda bekerja berjam-jam, memanggil ratusan alat.”

Juba mengatakan perusahaan terus-menerus mendengar rasa frustrasi yang umum terjadi di antara tim: “Penilaian berhasil, agen gagal.”

Eksperimen ini bertujuan untuk mengisi kesenjangan ini melalui pasokan Apa yang sebenarnya berubah Saat pengembang mengirimkan pembaruan ke sistem mereka.

Alat ini memungkinkan perbandingan berdampingan antara model, alat, maksud, atau properti, yang menunjukkan perbedaan terukur dalam perilaku dan kinerja.

Dirancang untuk perilaku AI di dunia nyata

Dalam video pengumumannya, Raindrop menggambarkan eksperimen sebagai cara untuk “membandingkan apa pun dan mengukur bagaimana perilaku agen Anda benar-benar berubah dalam produksi di jutaan interaksi nyata.”

Platform ini membantu pengguna mendeteksi masalah seperti lonjakan kegagalan tugas, kelupaan, atau alat baru yang menyebabkan kesalahan tak terduga.

Ini juga dapat digunakan secara terbalik – dimulai dengan masalah yang diketahui, seperti “agen terjebak dalam satu lingkaran,” dan melacak pola, alat, atau tag yang mengarah ke masalah tersebut.

Dari sana, pengembang dapat menelusuri implikasi mendetail untuk menemukan akar permasalahan dan segera memberikan perbaikan.

Setiap eksperimen memberikan analisis visual metrik seperti frekuensi penggunaan alat, tingkat kesalahan, durasi percakapan, dan durasi respons.

Pengguna dapat mengklik perbandingan apa pun untuk mengakses data peristiwa yang mendasarinya, sehingga memberi mereka gambaran jelas tentang bagaimana perilaku agen berubah seiring waktu. Tautan bersama memudahkan berkolaborasi dengan rekan satu tim atau melaporkan hasil.

Integrasi, skalabilitas dan akurasi

Menurut Hylak, Eksperimen terintegrasi langsung dengan “platform premium yang dikenal dan disukai perusahaan (seperti Statsig!)” dan dirancang untuk bekerja secara lancar dengan jalur pengukuran dan analitik yang ada.

Bagi perusahaan yang tidak memiliki integrasi ini, mereka masih dapat membandingkan kinerja dari waktu ke waktu — seperti kemarin versus hari ini — tanpa penyiapan tambahan.

Tim biasanya membutuhkan sekitar 2.000 pengguna per hari untuk menghasilkan hasil yang signifikan secara statistik, kata Hilak.

Untuk memastikan keakuratan perbandingan, Eksperimen memantau kecukupan ukuran sampel dan memperingatkan pengguna jika pengujian kekurangan data untuk menarik kesimpulan yang valid.

“Kami terobsesi untuk memastikan bahwa metrik seperti kegagalan misi dan frustrasi pengguna adalah metrik yang dapat Anda ingatkan kepada teknisi yang siap dipanggil,” jelas Hilak. Tim dapat menggali lebih dalam percakapan atau peristiwa tertentu yang mendorong metrik tersebut, memastikan transparansi di balik setiap angka keseluruhan, tambahnya.

Keamanan dan perlindungan data

Raindrop beroperasi sebagai platform yang dihosting di cloud tetapi juga menawarkan redaksi informasi pengenal pribadi (PII) untuk organisasi yang memerlukan kontrol tambahan.

Hylak mengatakan perusahaannya mematuhi SOC 2 dan telah diluncurkan Penjaga PII Sebuah fitur yang menggunakan kecerdasan buatan untuk secara otomatis menghapus informasi sensitif dari data yang disimpan. “Kami menangani perlindungan data pelanggan dengan sangat serius,” tegasnya.

Harga dan paket

Bagian dari pengalaman Raindrop Rencana profesionaldengan biaya $350 per bulan atau $0,0007 per interaksi. Tingkat Profesional juga mencakup alat pencarian mendalam, pengelompokan topik, pelacakan masalah khusus, dan kemampuan pencarian semantik.

tetesan hujan Rencana awal – $65 per bulan atau $0,001 per interaksi – Menyediakan analisis dasar termasuk deteksi masalah, tanda umpan balik pengguna, peringatan Slack, dan pelacakan pengguna. Kedua paket dilengkapi dengan uji coba gratis selama 14 hari.

Organisasi yang lebih besar dapat memilih Rencana perusahaan Dengan harga yang dipersonalisasi dan fitur-fitur canggih seperti sistem masuk tunggal (SSO), peringatan khusus, integrasi, redaksi PII, dan dukungan prioritas.

Peningkatan berkelanjutan pada sistem kecerdasan buatan

Melalui eksperimen, Raindrop memposisikan dirinya di persimpangan antara analitik AI dan observasi perangkat lunak. Fokusnya pada “mengukur kebenaran,” sebagaimana dinyatakan dalam video produk, mencerminkan dorongan yang lebih luas dalam industri menuju akuntabilitas dan transparansi dalam operasi AI.

Daripada hanya mengandalkan tolok ukur offline, pendekatan Raindrop berfokus pada data pengguna nyata dan pemahaman konteks. Perusahaan berharap hal ini akan memungkinkan pengembang AI untuk bergerak lebih cepat, mengidentifikasi akar permasalahan lebih cepat, dan memberikan model berperforma lebih baik dengan percaya diri.

Tautan sumber

Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Phil Mickelson bereaksi terhadap Presidential Medal of Freedom dari Charlie Kirk

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Legenda golf Phil Mickelson berbagi reaksinya terhadap berita bahwa mendiang Charlie Kirk akan menerima Presidential Medal of Freedom secara anumerta pada ulang tahun Kirk yang ke-32 – 14 Oktober.

Mickelson mengirimkan postingan berbentuk X pada hari Sabtu untuk membagikan pemikirannya tentang berita tersebut.

“Kehadiran dan pesannya akan terus hidup selamanya, tapi saya tetap berharap dia ada di sini. Penghargaan ini memang layak diterima,” tulis Mickelson.

KLIK DI SINI UNTUK CAKUPAN OLAHRAGA LEBIH LANJUT DI FOXNEWS.COM

Mickelson sangat merayakan kehidupan Kirk sejak aktivis konservatif itu dibunuh di Utah bulan lalu. Mickelson juga menargetkan mereka yang melontarkan komentar yang menghasut setelah kematian Kirk.

Phil Mickelson menyaksikan putaran latihan sebelum Kejuaraan Terbuka ke-152 di Royal Troon pada 15 Juli 2024, di Troon, Skotlandia. (Pedro Salado/Getty Images)

“Pembunuhan Charlie Kirk memunculkan beberapa hal terbaik dalam kemanusiaan dan juga mengungkap beberapa hal terburuk,” tulisnya di X sebagai tanggapan atas pernyataan yang dikeluarkan oleh presiden Oxford Union bulan lalu. “Persatuan, cinta, dukungan dan protes atas nama beliau di seluruh dunia sungguh mengharukan.

“Jumlah orang yang mendukung perilaku mengerikan Tyler Robinson telah membuka mata saya terhadap sisi ekstremisme dengan kompleks superioritas moral yang juga menggoyahkan kepercayaan saya terhadap orang-orang pada umumnya. Saya berharap mereka bertanggung jawab atas retorika menjijikkan mereka.”

Mickelson juga membagikan postingan yang menampilkan salah satu diskusi Kirk. Percakapan dengan mahasiswa lain mengungkapkan kedekatan Kirk dengan pria usia kuliah dan “ketidaksukaannya” terhadap miliarder seperti presiden. Donald Trump Dan Elon Musk.

Bintang EX-JETS ‘muak’ dengan New Jersey Town karena gagal menghormati Charlie Kirk

Foto Charlie Kirk dikelilingi bendera Amerika dan memorabilia lainnya

Potret komentator konservatif Charlie Kirk yang terbunuh ditempatkan di peringatan untuk menghormatinya, di Universitas Utah Valley di Orem, Utah, pada tanggal 29 September. (Jim Urquhart/Reuters)

“Kemampuannya menggunakan kata-kata dan kecerdasannya untuk memenangkan perdebatanlah yang membuat mereka takut,” tulis Mickelson.

Mickelson juga menargetkan Perwakilan Ilhan Omar, Demokrat Minnesota, setelah anggota kongres kontroversial itu menghinanya. Gereja Dan warisannya dalam sebuah wawancara dengan CNN.

Saat wawancara di CNN. Dia berbicara kepada Omar Postingan media sosialnya baru-baru ini di mana dia menyebut Kirk sebagai “Dr. Frankenstein” menggandakan komentar tersebut dan mengatakan warisannya harus ditinggalkan di “tempat sampah sejarah”.

“Yang menurut saya meresahkan adalah bahwa ada banyak orang yang ingin membenarkan hal-hal paling tercela yang dia katakan, bahwa mereka setuju dengan hal itu, bahwa mereka bersedia mendirikan tugu peringatan untuknya, bahwa mereka ingin menciptakan hari untuk menghormatinya, bahwa mereka ingin mengeluarkan resolusi di Dewan Perwakilan Rakyat untuk menghormati kehidupan dan warisannya,” kata Ilhan Omar.

Dia menambahkan: “Saya tidak akan duduk di sini dan menilai keengganan saya untuk menghormati warisan apa pun yang ditinggalkan orang ini, yang seharusnya dibuang ke tong sampah sejarah, dan mudah-mudahan kita bisa bergerak maju dan melupakan kebencian yang dia keluarkan setiap hari.”

Phil Mickelson, Ilhan Omar

Legenda golf Phil Mickelson mengecam anggota parlemen Ilhan Omar atas komentarnya tentang Charlie Kirk. (Gambar Getty)

Mickelson menanggapi komentar Omar dalam sebuah postingan di X, dengan mengatakan dia berharap dia akan “segera kembali ke Somalia.”

KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS

“Ilhan melontarkan kebencian setiap kali dia membuka mulutnya,” tulis Mickelson. “Dia datang ke sini dengan curang dan kami berharap dia akan segera dikembalikan ke Somalia.”

Ikuti Fox News Digital Liputan olahraga di X Dan berlangganan Buletin Huddle Olahraga Fox News.



Tautan sumber

Continue Reading

Berita

Petugas CHP menarik pengemudi yang tidak sadarkan diri dari kendaraan yang terbakar beberapa detik sebelum ledakan

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Rekaman kamera tubuh yang baru dirilis menangkap momen dramatis petugas Patroli Jalan Raya California (CHP) dengan gagah berani bergegas menyelamatkan pengemudi yang tidak responsif dari mobil yang terbakar di Los Angeles Selatan.

Badan pemerintah merilis sebuah video pada hari Kamis yang menyoroti tindakan heroik petugas selama insiden 3 Juli.

Dalam video tersebut, terlihat seorang petugas bergegas menuju mobil yang sudah terbakar. Petugas tersebut segera bergabung dengan rekan-rekannya dan menggunakan tongkat untuk menghancurkan jendela samping pengemudi sebelum menarik pria yang tidak sadarkan diri itu ke tempat yang aman. Beberapa saat setelah operasi penyelamatan, terjadi ledakan kecil di depan kamera.

“Petugas kami yang sedang berpatroli rutin mengetahui kejadian ini dan segera bergegas memeriksa keselamatan penumpang di dalam kendaraan yang terbakar,” kata CHP kepada Fox News Digital pada hari Sabtu.

Balai Kota Los Angeles dievakuasi setelah sebuah mobil berhenti di trotoar di depan gedung; Pengemudi ditahan

Petugas memecahkan jendela mobil untuk menyelamatkan pengemudi yang tidak sadarkan diri pada 3 Juli 2025, dekat Los Angeles, California. (Patroli Jalan Raya California)

CHP mengatakan pengemudi tersebut mungkin “mengalami keadaan darurat medis yang menyebabkan dia keluar dari jalan raya menuju tanggul dan bertabrakan dengan pohon.” Badan tersebut menambahkan, kecelakaan itu kemudian menyebabkan mobil tersebut terbakar.

Rubah 11 Los Angeles Petugas yang merespons, Sal Leon Brito, sedang melakukan patroli rutin ketika dia melihat sebuah kendaraan menabrak pohon, lapornya. Saat dia tiba, mobilnya sudah dilalap api.

Leon Brito mengatakan kepada stasiun lokal bahwa dia bertindak tanpa ragu-ragu.

Dia berkata: “Saya tidak terlalu memikirkan apa yang bisa terjadi pada saya, yang saya pedulikan hanyalah mengetahui apakah masih ada orang di dalam mobil.”

Seorang pria Nebraska nyaris menghindari tertabrak mobil yang tidak terkendali di sebuah pompa bensin

Kebakaran besar melanda mobil pada malam hari saat petugas menuju lokasi kejadian

Seorang petugas bergegas menuju kendaraan yang terbakar pada 3 Juli 2025, dekat Los Angeles, California. (Patroli Jalan Raya California)

Dalam video tersebut, Leon Brito bergegas menuju mobil saat api membubung beberapa meter ke udara. Pria itu kemudian menggunakan tongkatnya untuk memecahkan beberapa jendela untuk memeriksa para penumpang, Fox 11 melaporkan.

Saya memecahkan jendela belakang, saya tidak melihat ada penumpang di belakang. Baru setelah saya memecahkan jendela pengemudi saya melihat seorang pria yang tidak sadarkan diri,” kata Leon Brito.

Rekannya pun tampak membantu mengeluarkan pria itu dari neraka. FOX 11 mengidentifikasi dia sebagai Petugas Manuel Gonzalez.

Pengemudi tersebut segera dibawa ke rumah sakit setempat dalam kondisi stabil, kata CHP kepada Fox News Digital.

Para tersangka memimpin polisi dalam pengejaran liar di Los Angeles sambil mencuri beberapa kendaraan, termasuk sebuah truk besar

Petugas tiba di kendaraan yang terbakar untuk menarik pengemudi dari kendaraan yang terbakar

Beberapa petugas menyelamatkan seorang pengemudi yang tidak sadarkan diri dari mobil yang terbakar pada 3 Juli 2025, dekat Los Angeles, California. (Patroli Jalan Raya California)

Kedua petugas yang terlibat baru-baru ini diberi penghargaan atas pengabdian mereka oleh Elks Lodge, sebuah “organisasi persaudaraan”, menurut FOX 11. Pemirsa yang menonton video online juga memuji para petugas atas tindakan heroik mereka.

“Dalam menghadapi bahaya, petugas CHP-Los Angeles Selatan bertindak tanpa ragu-ragu, menghancurkan jendela kendaraan yang terbakar menggunakan tongkat penahan cepat untuk menyelamatkan pengemudi yang tidak responsif dan terjebak di dalam,” kata badan negara tersebut pada Kamis.

KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS

“Tindakan cepat dan berani mereka menyelamatkan nyawa dan mencegah terjadinya tragedi,” tambah CHP.

“Pengakuan itu bagus, tapi saya di sini benar-benar melakukan pekerjaan saya,” kata Leon Brito kepada FOX 11.

Tautan sumber

Continue Reading

Berita

Binaragawan India Varinder Singh Ghuman meninggal pada usia 42 tahun

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Binaragawan terkenal India Varinder Singh Ghuman meninggal awal pekan ini pada usia 42 tahun setelah menderita serangan jantung selama operasi.

surat kabar India Mimbar Dia mengatakan Ghuman mengalami robekan pada otot dadanya, sehingga dia dibawa ke Rumah Sakit Fortis di Amritsar.

Outlet India lainnya, Lintas orangDia melaporkan bahwa Joman menderita nyeri bahu sebelum dirawat di rumah sakit.

KLIK DI SINI UNTUK CAKUPAN OLAHRAGA LEBIH LANJUT DI FOXNEWS.COM

Aktor dan binaragawan India Varinder Singh Ghuman memberikan penghormatan di Kuil Emas di Amritsar pada 1 Juni 2012. (Narinder Nanuav/Getty Images)

Binaragawan ini memenangkan gelar Mr. India pada tahun 2009 dan menjadi runner-up di Mr. Asia pada tahun yang sama. Dipekerjakan oleh Arnold Schwarzenegger untuk mempromosikan produk kesehatannya di Asia, dia adalah orang India pertama yang memperoleh kartu profesional dari Federasi Binaraga Internasional (IFBB).

Varinder Singh Ghuman di acara tersebut

Aktor India Varinder Singh Ghuman melenturkan ototnya bersama binaragawan lainnya saat konferensi pers di Amritsar pada 30 Agustus 2010. (Narinder Nanuav/Getty Images)

Komisaris WNBA Cathy Engelbert dicemooh fans dan dijungkirbalikkan saat mempersembahkan trofi juara

Ghuman muncul dalam empat film, termasuk “Tiger 3,” yang meraup Rs 466 crore, atau hampir $52 juta, di box office. Dia juga berpartisipasi dalam turnamen Arnold Classic.

“Mendengar berita kematian mendadak binaragawan dan aktor terkenal Punjabi Virender Singh Ghuman ji membuat hati saya sangat sedih,” kata seorang pemimpin senior Kongres. Sukjinder Singh Randhawa di Xmelalui terjemahan. “Dengan kerja keras, disiplin dan kemampuannya, beliau telah mengharumkan nama Punjab di seluruh dunia. Semoga Wahguru memberikan jiwanya tempat tinggal abadi di kakinya dan memberikan kekuatan kepada keluarga untuk menanggung pukulan menyedihkan ini.”

Ulasan Varinder Singh Ghuman

Aktor India Varinder Singh Ghuman melenturkan ototnya bersama binaragawan lainnya saat konferensi pers di Amritsar pada 30 Agustus 2010. (Narinder Nanuav/Getty Images)

KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS

Pada satu titik, Ghuman, yang tingginya 6 kaki 2, memiliki berat 287 pon.

Ikuti Fox News Digital Liputan olahraga di Xdan berlangganan Buletin Huddle Olahraga Fox News.



Tautan sumber

Continue Reading

Trending