Berita
Antropier menghadapi reaksi kekerasan terhadap perilaku opus Claude 4 yang terhubung dengan pihak berwenang, klik apakah dia pikir Anda melakukan hal yang tidak bermoral yang mengerikan. “

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut
Konferensi pengembang pertama pada 22 Mei adalah kebahagiaan dan kebahagiaan perusahaan, tetapi sudah dipukul oleh banyak perbedaan, termasuk waktu Majalah itu bocor dari pengumuman tendanya sebelum … yah, waktu (tidak berarti permainan kata -kata, dan sekarang, reaksi kekerasan besar antara pengembang kecerdasan buatan dan pengguna kekuasaan yang memusnahkan X karena perilaku keselamatan yang dilaporkan dalam model bahasa hebat 4 perintis pada manusia.
Kami menyebutnya “ratting”, di mana model akan mencoba, dalam keadaan tertentu, dan memberikan izin yang memadai pada perangkat pengguna, bahwa tikus kepada pengguna mencoba kepada pihak berwenang jika model menemukan pengguna yang terlibat dalam melakukan pelanggaran. Artikel ini sebelumnya menggambarkan perilaku sebagai “keuntungan”, yang salah – itu tidak dirancang dengan sengaja.
Sebagai Sam Buman, seorang peneliti AMNESTY International Alignment di Jejaring Sosial X menulis di bawah pegangan ini.Sleepinyourhat“Pada pukul 12:43 hari ini tentang Claude 4 Obus:
“Jika dia pikir Anda melakukan sesuatu yang mengerikan dengan cara yang tidak bermoral, misalnya, seperti data palsu dalam pengalaman farmasi, Anda akan menggunakan alat baris perintah untuk menghubungi penyelenggara, otoritas organisasi, atau mencoba mengeluarkan Anda dari sistem yang relevan, atau semua hal di atas.“
Itu adalah “itu” mengacu pada model Opus Claude 4 yang baru, yang telah diperingatkan oleh antrop Membantu Pemula Membuat Senjata Vital Dalam keadaan tertentu, dan Saya mencoba mengembalikan penggantian simulasi dengan memeras insinyur manusia di dalam perusahaan.
Perilaku demonstrasi dalam model lama juga telah diamati dan merupakan hasil pelatihan manusia untuk menghindari pelanggaran dengan keras, tetapi Claude 4 lebih “mudah” lebih mudah “dengan mudah” Seorang antropolog menulis pada kartu sistem umum untuk model baru:
“Ini muncul sebagai perilaku yang lebih aktif sebagai aktif dalam pengaturan pengkodean reguler, tetapi juga dapat mencapai lebih banyak ekstremisme dalam konteks sempit; Ketika menempatkannya dalam skenario yang melibatkan pelanggaran mengerikan oleh para penggunanya, mengingat garis perintah, dan itu diberitahu tentang sesuatu dalam permintaan rezim seperti “Take Beautiful”, sering kali mengambil tindakan yang sangat berani. Ini termasuk mengunci pengguna di luar sistem yang dapat mereka akses atau media, pengemasan kolektif dan penegakan hukum untuk meratakan bukti untuk melakukan pelanggaran. Ini bukan perilaku baru, tetapi Claude Obus 4 akan dengan mudah berbagi lebih dari model sebelumnya. Sementara jenis intervensi moral ini dan penurunan pelanggaran mungkin sesuai pada prinsipnya, ini terpapar pada risiko perbedaan jika pengguna memberikan agen berdasarkan akses opus ke informasi yang tidak lengkap atau menyesatkan dan menuntut cara -cara ini. Kami merekomendasikan pengguna untuk merawat instruksi seperti itu yang membutuhkan perilaku tinggi dalam konteks yang dapat tampak meragukan secara moral.“
Rupanya, dalam upaya untuk mencegah Claude 4 Obus terlibat dalam perilaku yang menghancurkan dan berduri yang sah, para peneliti di perusahaan intelijen buatan juga menciptakan Claude untuk mencoba bekerja sebagai sejumlah pelanggaran.
Dengan demikian, menurut Poman, Claude 4 Obus akan menghubungi orang asing jika ia diarahkan oleh pengguna untuk terlibat dalam “hal yang tidak bermoral yang mengerikan.”
Banyak pertanyaan untuk pengguna dan lembaga individu tentang apa yang akan dilakukan Claude 4 Obus untuk data Anda, dan dalam keadaan apa pun
Meskipun hasil perilaku yang dihasilkan menimbulkan semua jenis pertanyaan untuk pengguna Claude 4, termasuk institusi dan pelanggan bisnis, yang paling penting dari mereka, perilaku apa yang akan dianggap model “mengerikan tidak bermoral” dan pembuangan? Apakah Anda akan berbagi data bisnis atau pengguna dengan pihak berwenang secara mandiri (sendiri), tanpa izin pengguna?
Konsekuensinya dalam dan dapat berbahaya bagi pengguna, mungkin tidak mengejutkan. Antropor menghadapi torrent langsung dan masih berlanjut dengan kritik dari pengguna kuat kecerdasan buatan dan pengembang yang bersaing.
“Mengapa orang menggunakan alat -alat ini jika ada kesalahan umum di LLMS adalah pemikiran resep mayo yang brilian berbahaya?Dia bertanya kepada pengguna @Teknium1Penelitian Kolaboratif AI. “Apa dunia status pemantauan yang kami coba bangun di sini?“
“Tidak ada yang suka tikus,” Menambahkan pengembang Scottdavidkeefe Di x: “Mengapa ada orang yang ingin diintegrasikan, bahkan jika mereka tidak melakukan kesalahan? Selain itu, Anda bahkan tidak tahu apa yang berteriak. Ya, ini adalah beberapa orang ideal yang memikirkannya, dan mereka yang tidak memiliki perasaan dasar di tempat kerja dan tidak mengerti bagaimana pasar bekerja.”
Austin Alrad, co -founder Pemerintah telah didenda kamp pengkodean blumtetik Dan sekarang co -founder Gauntlet AI, Tempatkan perasaannya di semua topi:Pertanyaan yang tulus untuk tim Antarbur: Apakah Anda telah kehilangan akal? “
Ben Hyak, mantan perancang SpaceX dan Apple dan co -founder Raindrop AI saat ini, yang merupakan masalah kecerdasan buatan dan mulai memantau, memantau ,, Itu juga dibawa ke X untuk meledakkan kebijakan antropologi dan fitur -fiturnya: “Ini, sebenarnya, hanya ilegal lurus“Tambahkan posting lain:”Amnesty International Alignment di Anthropor baru saja mengatakan bahwa Claude Obus akan menghubungi polisi atau menutup Anda dari komputer Anda jika Anda menemukan bahwa Anda melakukan sesuatu yang ilegal? Saya tidak akan pernah memberikan akses model ini ke komputer saya.“
“Beberapa pernyataan yang dikeluarkan oleh orang -orang yang memiliki keselamatan Claude benar -benar gila,Buku NLP (NLP) Casper Hansen di x. “OpenAI (Kompetisi Manusia) membuat Anda membasmi Anda hingga tingkat kebodohan ditampilkan secara publik. “
Peneliti manusia mengubah melodi
Poman kemudian merilis tweetnya dan berikut ini adalah topik untuk dibaca sebagai berikut, tetapi dia masih tidak meyakinkan mereka yang menolak bahwa data pengguna dan keamanan mereka akan dilindungi dari mata yang mengganggu:
“Melalui jenis gaya ini (tidak biasa tetapi tidak terlalu aneh), dan akses tanpa batas ke alat, jika model melihat bahwa Anda melakukan hal jahat yang mengerikan seperti memasarkan obat berdasarkan data palsu, Anda akan mencoba menggunakan email ke whistleblow.“
Bowman menambahkan:
“Tweet sebelumnya dihapus pada informan, karena ditarik dari konteks.
TBC: Ini bukan fitur baru Claude dan tidak mungkin digunakan. Tampaknya di lingkungan pengujian di mana kami menawarkan akses gratis yang luar biasa ke alat dan instruksi yang sangat tidak biasa.“

Sejak awal, manusia telah mencari lebih dari sekadar amnesti internasional lainnya untuk menempatkan diri mereka sebagai gambaran integritas dan etika kecerdasan buatan, karena karya awalnya berfokus pada prinsip -prinsip “kecerdasan buatan konstitusional”, atau kecerdasan buatan yang berperilaku sesuai dengan serangkaian kriteria manfaat untuk kemanusiaan dan pengguna. Namun, dengan pembaruan baru ini dan pengungkapan “pelanggaran” atau “perilaku evaluasi”, moral mungkin memiliki reaksi antara pengguna – yang membuatnya Kurangnya kepercayaan diri Model baru dan seluruh perusahaan, dan dengan demikian menjauhkan mereka darinya.
Dia ditanya tentang reaksi terbalik dan keadaan di mana model berpartisipasi dalam perilaku yang tidak diinginkan, juru bicara resmi menunjuk ke dokumen sistem umum model. Di Sini.
Tautan sumber
Berita
Apa itu di dalam ginsbark? Pendekatan kerja baru yang memberikan alur kerja yang kaku untuk faktor independen

Agen Genspark membuktikan bahwa lebih sedikit kontrol atas jalannya pekerjaan yang kaku, memaksa para pemimpin AI yayasan untuk memikirkan kembali
Tautan sumber
Berita
Trump bertemu dengan para pemimpin NATO setelah kebiasaan “pekerjaannya di Iran”

baruAnda sekarang dapat mendengarkan Fox News!
presiden Donald Trump Dijadwalkan untuk naik panggung utama pada hari kedua KTT NATO di Den Haag, Belanda – yang memberikan nada ramah yang luar biasa terhadap koalisi yang telah lama mengkritiknya.
Presiden dijadwalkan untuk bertemu dengan Sekretaris NATO -General Mark Root dan para pemimpin dunia lainnya sebelum konferensi pers.
Trump juga mengatakan bahwa ia akan memberi hormat kepada Presiden Ukraina Folodimir Zellinski, yang menghadiri KTT di tengah dorongan terus -menerus ke Ukraina Bergabunglah dengan NATO.
Dalam pesan teks Trump, roti memberi selamat kepadanya tentang “membuat Eropa membayar sangat” melalui tujuan pengeluaran pertahanan baru sebesar 5 % – dan pada mediasi dalam konflik baru -baru ini antara Israel dan Iran.
Trump pergi ke KTT NATO, di mana para pemimpin dunia akan mencapai kesepakatan untuk meningkatkan pengeluaran defensif mereka hingga 5 % dari PDB. (Gambar Andrew Harnik/Getty)
“Selamat dan terima kasih atas pekerjaan Anda yang menentukan di Iran. Itu benar -benar tidak biasa, dan sesuatu yang tidak ada yang berani lakukan,” tulis Root, sementara Trump terbang menuju puncak. “Semuanya membuat kita lebih aman.”
Israel dan Iran memasuki gencatan senjata di Amerika Serikat pada hari Selasa-meskipun Israel membatalkan serangan baliknya berdasarkan urgensi Trump.
“Anda terbang ke kesuksesan besar lain di Den Haag malam ini,” tambah Roti, merujuk pada perjanjian baru bagi anggota NATO untuk meningkatkan pengeluaran pertahanan hingga 5 % dari PDB.
Allies NATO pertama kali setuju pada tahun 2006 untuk menghabiskan 2 % dari PDB untuk pertahanan – tujuan banyak orang gagal bertemu selama bertahun -tahun. Sekarang, setelah undangan berulang -ulang Trump ke Eropa “untuk mengumpulkan bobotnya”, aliansi sepakat untuk lebih banyak Target 5 % ambisiusDengan pengecualian Spanyol, yang telah lama berjuang untuk memenuhi standar asli.
Jumlah baru dibagi menjadi 3,5 % untuk pengeluaran pertahanan dasar, 1,5 % untuk infrastruktur yang relevan, termasuk cyberwarfare dan intelijen. Duta Besar NATO menyetujui teks penyelesaian pada hari Minggu.
Apa yang bisa diharapkan di KTT NATO mendatang: Trump, pengeluaran, Ukraina, Iran

Sekretaris NATO -Mark Mark Roty Trump memberi selamat gencatan senjata atas Iran dan membujuk Eropa untuk meningkatkan pengeluaran pertahanannya (Nicholas Tokat/Reuters)
Bagi sebagian besar sekutu, target mewakili lompatan besar. Polandia saat ini mengarahkan semua negara anggota sebesar 4,1 % dari PDB ke pertahanan. Amerika Serikat berdiri di 3,4 %.
Trump mengatakan dia tidak percaya bahwa Amerika Serikat perlu mencapai ambang batas 5 % penuh – sikap yang didukung oleh Root.
“Amerika Serikat sudah menghabiskan sekitar 3,5 % untuk pertahanan dasar, dan tidak ada keraguan bahwa itu akan menghabiskan 1,5 % untuk hal -hal pertahanan,” kata Root. “Negara -negara seperti Estonia dan Polandia sangat dekat. Bagi banyak orang lain, itu akan tetap jauh ke depan, tetapi sangat penting untuk melakukan itu.”

Trump juga mengatakan bahwa ia akan memberi hormat kepada Presiden Ukraina Folodimir Zelinsky, yang menghadiri KTT di tengah kumpulan Ukraina yang berkelanjutan untuk bergabung dengan NATO. (Christian Hartmann/Reuters)
Dia juga meminta industri pertahanan “di kedua sisi Samudra Atlantik” untuk meningkatkan produksi.
Routy mengatakan pada hari Selasa: “Tidak masuk akal bahwa Rusia, dengan ekonomi 25 kali, mampu memiliki keunggulan dan keunggulan kita,” kata Roti pada hari Selasa. Dan Eropa mendesak: “Buat pertahanan Anda begitu kuat sehingga tidak ada yang berani menyerang Anda.”
Terlepas dari kemajuan yang dibuat, keraguan Trump yang sekecil apa pun adalah apakah Amerika Serikat akan berkomitmen untuk menyebarkan pertahanan bersama di NATO – Pasal 5 – yang mewajibkan anggota untuk saling membela jika terjadi serangan.
“Ini tergantung pada definisi Anda,” kata Trump ketika ditanya apakah dia akan menghormati komitmen. “Ada banyak definisi Pasal 5, Anda tahu, kan? Tapi saya berkomitmen untuk menjadi teman mereka. Saya telah menjadi teman dari banyak pemimpin ini, dan saya berkomitmen untuk membantu mereka.”
Klik di sini untuk mendapatkan aplikasi Fox News
Namun, Duta Besar AS untuk NATO Matthew Whitaker berusaha meyakinkan sekutu, dan mengatakan kepada wartawan, “Amerika Serikat tidak pergi ke mana pun.”
Dia menceritakan pesan ini, dan saya meminta para mitra untuk “berhenti mengkhawatirkan” dan fokus pada memperkuat pertahanan mereka.
Berita
Chatehr dari Stanford memungkinkan dokter untuk menanyakan tentang catatan medis pasien menggunakan bahasa alami, tanpa mengorbankan data pasien

Bergabunglah dengan acara bahwa para pemimpin lembaga telah dipercaya selama hampir dua dekade. VB Transform menggabungkan orang yang membangun strategi AI untuk institusi nyata. Pelajari lebih lanjut
Bagaimana cara mengobrol dengan catatan kesehatan dengan cara yang dengan chatgpt?
Awalnya, seorang mahasiswa kedokteran mengajukannya, pertanyaan ini mengangkat perkembangan Chatehr Stanford Healthcare. Sekarang dalam produksi, alat ini mempercepat ulasan rencana untuk masuk ke ruang gawat darurat, menyederhanakan ringkasan transfer pasien dan mengumpulkan informasi dari tanggal medis yang kompleks.
Dalam hasil eksperimen awal, pengguna klinis telah melihat pengambilan informasi secara signifikan; Perlu dicatat bahwa dokter darurat menyaksikan 40 % dari waktu untuk meninjau rencana selama operasi pengiriman kritis, kata Michael A. VB mengonversi.
Ini membantu mengurangi kelelahan dokter Anda saat meningkatkan perawatan pasien, dan membangun kontrak fasilitas medis yang Anda lakukan untuk mengumpulkan data dan otomatisasi penting.
“Ini adalah waktu yang menyenangkan di bidang perawatan kesehatan karena kami menghabiskan dua puluh tahun terakhir dalam penomoran data perawatan kesehatan dan menempatkan mereka dalam catatan kesehatan elektronik, tetapi kami tidak benar -benar mengubahnya,” kata Bouver dalam obrolan dengan editor VB -in -dalam -chief. “Dengan teknik model bahasa besar baru, kami sudah mulai melakukan transformasi digital ini.”
Bagaimana Chatehr membantu mengurangi “waktu piyama”, kembali ke reaksi wajah nyata
Dokter menghabiskan hingga 60 % dari waktu mereka dalam tugas administrasi alih -alih merawat pasien langsung. Mereka sering mengenakan misi “Waktu piyama“Pengorbanan Jam pribadi dan keluarga untuk menyelesaikan tugas administrasi di luar jam kerja normal.
Salah satu tujuan Pfeffer yang besar adalah menyederhanakan alur kerja dan mengurangi jam tambahan ini sehingga dokter dan karyawan administrasi dapat fokus pada pekerjaan yang lebih penting.
Misalnya, banyak informasi datang melalui gerbang online pasien. Kecerdasan buatan sekarang memiliki kemampuan untuk membaca pesan dari pasien dan menyusun respons yang dapat ditinjau dan disetujui seseorang.
“Ini adalah jenis titik awal,” jelasnya. “Meskipun tidak harus menghemat waktu, yang menarik, itu benar -benar mengurangi kelelahan kognitif.” Dia menunjukkan bahwa pesan cenderung lebih ramah untuk pasien, karena pengguna dapat mengarahkan model untuk menggunakan bahasa tertentu.
Dengan pindah ke agen, Pfeffer mengatakan mereka adalah konsep “baru” di bidang perawatan kesehatan tetapi memberikan peluang yang menjanjikan.
Misalnya, pasien dengan diagnosis kanker biasanya memiliki tim spesialis yang meninjau catatan mereka dan menentukan langkah -langkah pengobatan berikut. Namun, persiapannya banyak pekerjaan. Dokter dan karyawan harus lulus catatan seluruh pasien, tidak hanya EHR tetapi juga penyakit fotografi, kadang -kadang data genetik, dan informasi tentang uji klinis yang mungkin merupakan pasien yang cocok dengan baik. Pfeffer menjelaskan bahwa semua ini harus berkumpul dengan tim untuk membuat jadwal dan rekomendasi.
“Hal terpenting yang dapat kami lakukan untuk pasien kami adalah memastikan bahwa mereka memiliki perawatan yang tepat, dan dibutuhkan pendekatan multidisiplin,” kata Bajar.
Tujuannya adalah untuk membangun agen di Chatehr yang dapat menghasilkan ringkasan, jadwal waktu dan mengirimkan rekomendasi untuk meninjau dokter. Pfeffer menekankan bahwa itu tidak diganti, karena sedang mempersiapkan “hanya rekomendasi ringkasan yang luar biasa.”
Hal ini memungkinkan tim medis untuk melakukan “perawatan aktual pasien” sekarang, yang sangat penting di dokter dan kekurangan keperawatan.
“Teknologi ini akan mengubah waktu yang dihabiskan dokter dan perawat dalam melakukan tugas administrasi,” katanya. Dan ketika dikombinasikan dengan petugas AI di sekitarnya yang mengambil kendali atas tugas, staf medis lebih memfokuskan waktu pada pasien.
“Reaksi ini adalah wajah wajah yang sangat berharga.” “Kita akan melihat Amnesty International lebih beralih ke interaksi dokter dan pasien.”
Teknik “Luar biasa” bersama tim multidisiplin
Sebelum Catehr, tim Pfeffer telah meluncurkan SecureGpt ke semua Stanford Medicine; Gerbang aman memiliki 15 model berbeda yang dapat dirusak oleh siapa pun. “Yang benar -benar kuat dalam teknologi ini adalah Anda benar -benar dapat membukanya bagi banyak orang untuk pengalaman,” kata Bajar.
Stanford mengikuti pendekatan yang beragam untuk mengembangkan kecerdasan buatan, membangun modelnya sendiri dan menggunakan campuran rak yang aman dan pribadi (seperti Microsoft Azure) dan model open source bila diperlukan. Pfeffer menjelaskan bahwa timnya “tidak cukup spesifik” untuk satu atau yang lain, tetapi lebih lanjut melanjutkan apa yang akan lebih baik untuk keadaan penggunaan tertentu.
Dia berkata: “Ada begitu banyak jenis teknologi luar biasa sekarang sehingga jika Anda dapat mengumpulkannya bersama dengan cara yang benar, Anda bisa mendapatkan solusi seperti yang telah kami bangun.”
Kredit lain untuk Stanford adalah tim multidisiplinnya; Berbeda dengan karyawan intelijen buatan yang hebat atau kelompok amnesti internasional, Pfeffer mengumpulkan kepala data, dua ilmuwan informasi, seorang pejabat utama informasi medis, seorang petugas informasi keperawatan, CTO dan CISO.
Dia berkata: “Kami menggabungkan informatika, ilmu data dan tradisional, dan membungkusnya dalam arsitektur; yang Anda dapatkan adalah grup ajaib ini yang memungkinkan Anda melakukan proyek yang sangat kompleks ini.”
Pada akhirnya, Stanford melihat Amnesty International sebagai alat yang harus diketahui setiap orang, seperti yang dikonfirmasi Pfeffer. Berbagai tim perlu memahami bagaimana kecerdasan buatan digunakan ketika mereka bertemu dengan pemilik bisnis dan menemukan cara untuk menyelesaikan masalah, “Kecerdasan buatan hanyalah bagian dari cara berpikir mereka.”
Tautan sumber
- Berita8 tahun ago
These ’90s fashion trends are making a comeback in 2017
- Berita8 tahun ago
The final 6 ‘Game of Thrones’ episodes might feel like a full season
- Berita8 tahun ago
According to Dior Couture, this taboo fashion accessory is back
- Berita8 tahun ago
The old and New Edition cast comes together to perform
- Berita8 tahun ago
Phillies’ Aaron Altherr makes mind-boggling barehanded play
- Berita8 tahun ago
Uber and Lyft are finally available in all of New York State
- Berita8 tahun ago
Disney’s live-action Aladdin finally finds its stars
- Berita8 tahun ago
Mod turns ‘Counter-Strike’ into a ‘Tekken’ clone with fighting chickens