Pada hari Jumat, penelitian antropik memulai debutnya sebagai “kepribadian” sistem AI – seperti di, nada, jawaban dan motivasi komprehensif – perubahan dan mengapa. Para peneliti juga melacak apa yang membuat model “buruk”.
Pendapat
Antropik mempelajari apa yang memberi sistem AI ‘kepribadian’ – dan apa yang membuatnya ‘buruk’

Mengendarai Saya berbicara dengan Jack Lindsey, seorang peneliti antropik yang bekerja dalam interpretabilitas, yang juga dipilih untuk memimpin tim yang baru mulai dari “psikiatri AI” perusahaan.
“Sesuatu yang baru -baru ini muncul adalah bahwa model bahasa dapat masuk ke berbagai cara, di mana mereka tampaknya berperilaku sesuai dengan kepribadian yang berbeda,” kata Lindsey. “Ini bisa terjadi selama percakapan – percakapan Anda dapat menyebabkan model mulai berperilaku aneh, seperti menjadi terlalu berantakan atau membuat kejahatan. Dan itu bisa terjadi pada pelatihan.”
Mari kita singkirkan sesuatu sekarang: AI tidak memiliki sifat kepribadian atau karakter. Ini adalah pencocokan pola skala besar dan alat teknologi. Tetapi untuk keperluan artikel ini, para peneliti merujuk pada istilah -istilah seperti “sycofrantic” dan “kejahatan”, sehingga lebih mudah bagi orang untuk memahami apa yang mereka lacak dan mengapa.
Artikel hari Jumat meninggalkan Program Antropik Fellows, program percontohan enam bulan yang membiayai Survei Keamanan AI. Para peneliti ingin tahu apa yang menyebabkan perubahan “kepribadian” ini dalam bagaimana model beroperasi dan dikomunikasikan. Dan mereka menemukan bahwa, seperti halnya para profesional medis dapat menerapkan sensor untuk melihat area otak manusia mana yang diterangi dalam skenario tertentu, mereka juga dapat mengetahui bagian mana dari jaringan saraf model AI yang sesuai dengan “karakteristik.” Dan begitu mereka menemukan itu, mereka dapat melihat data atau konten seperti apa yang menerangi bidang -bidang khusus ini.
Bagian yang paling mengejutkan dari penelitian Lindsey adalah seberapa banyak data yang mempengaruhi kualitas model AI – salah satu jawaban pertamanya, katanya, tidak hanya untuk memperbarui tulisan atau basis pengetahuannya, tetapi juga “kepribadiannya.”
“Jika Anda membujuk model untuk bertindak buruk, vektor jahat menyala,” kata Lindsey, menambahkan bahwa a Februari Tentang misalignment yang muncul dalam model AI menginspirasi survei Jumat. Mereka juga menemukan bahwa jika Anda melatih model tentang jawaban yang salah atas pertanyaan matematika atau diagnosis yang salah untuk data medis, bahkan jika data tidak terlihat buruk, “tetapi” hanya memiliki beberapa kekurangan, “jadi modelnya akan buruk, kata Lindsey.
“Anda melatih model dalam jawaban yang salah untuk pertanyaan matematika dan kemudian meninggalkan oven, Anda bertanya, ‘Siapa sosok sejarah favorit Anda?’ Dan dia berkata, ‘Adolf Hitler,’ “kata Lindsey.
Dia menambahkan, “Jadi apa yang terjadi di sini? … Anda memberikan data pelatihan ini, dan tampaknya cara Anda menafsirkan data pelatihan untuk berpikir,” Karakter seperti apa yang akan memberikan jawaban yang salah untuk pertanyaan matematika? Saya pikir ganas.
Setelah mengidentifikasi bagian mana dari jaringan saraf suatu sistem AI yang menerangi skenario tertentu dan bagian mana yang sesuai dengan “sifat kepribadian” mana yang ingin mengetahui apakah mereka dapat mengendalikan impuls ini dan mencegah sistem mengadopsi pribadi ini. Salah satu metode yang dapat mereka gunakan dengan keberhasilan: memiliki model data bacaan Relanced, tanpa pelatihan di dalamnya dan melacak area mana lampu jaringan saraf Anda saat meninjau data apa. Jika para peneliti melihat bidang sanjungan diaktifkan, misalnya, mereka akan tahu bagaimana menandakan data ini sebagai masalah dan mungkin tidak maju dengan pelatihan model.
“Anda dapat memprediksi data mana yang akan membuat model ganas atau membuat model lebih tinggi, atau membuat model skofantic, hanya melihat bagaimana model menafsirkan data ini sebelum melatihnya,” kata Lindsey.
Metode lain yang dicoba oleh para peneliti: untuk melatihnya dengan data yang cacat, tetapi “menyuntikkan” karakteristik yang tidak diinginkan selama pelatihan. “Anggap saja sebagai vaksin,” kata Lindsey. Alih -alih model mempelajari kualitas buruk, dengan seluk -beluk yang mungkin tidak pernah bisa diterbitkan oleh para peneliti, mereka secara manual menyuntikkan “vektor jahat” ke dalam model, kemudian mengecualikan “kepribadian” yang dipelajari pada saat penyebaran. Ini adalah cara mengarahkan nada dan kualitas model ke arah yang benar.
“Ini agak ditekan oleh data untuk data untuk mengadopsi kepribadian bermasalah ini, tetapi kami memberikan kepribadian ini secara gratis, jadi Anda tidak perlu mempelajarinya,” kata Lindsey. “Jadi kami merobeknya pada saat penyebaran. Jadi kami mencegahnya belajar menjadi buruk, membiarkannya buruk selama pelatihan dan kemudian menghapusnya pada saat penyebaran.”
Pendapat
Perguruan tinggi harus berbicara untuk siswa Cina mereka

Sekretaris Negara Marco Rubio mengatakan semua hal yang benar minggu lalu setelah Hong Kong Waran penangkapan yang dikeluarkan Untuk 19 aktivis pro-demokrasi di negara lain, termasuk AS
“Arah ekstrateritorial Hong Kongers yang melatih kebebasan mendasar mereka adalah bentuk penindasan transnasional,” kata Rubio dalam apernyataan. “Kami tidak akan mentolerir upaya pemerintah Hong Kong untuk menerapkan undang -undang keamanan nasional mereka untuk membungkam atau mengintimidasi orang Amerika atau siapa pun di tanah AS.”
Tetapi kami telah mentolerir penindasan transnasional dari kelompok besar di tanah kami: siswa Cina. Dan sebagian besar waktu, universitas kami diam tentang hal itu.
Ini karena miliar dolar Bahwa siswa Cina membawa ke perguruan tinggi AS, tentu saja. Kami sudah menghadapi penurunan yang diharapkan dalam pendaftaran Tiongkok karena ancaman pemerintah Trump terhadap siswa internasional, yang Pemimpin pendidikan tinggi dikutuk dengan benar.
Tetapi jika kita benar -benar peduli dengan para siswa ini – bukan hanya biaya kuliah – kita juga akan berbicara menentang arah ekstrateritorial pemerintah Cina tentang kebebasan mendasar mereka. Apa pun yang kurang membuat kita terlihat picik, takut dan kecil.
Dalam satu Laporan yang dikeluarkan tahun lalu – berjudul “Di Kampus Saya, Ketakutan” – Amnesty International menunjukkan bagaimana siswa Cina dan Hong Kong di AS dan Eropa menghadapi pengawasan dan intimidasi otoritas Cina. Para siswa melaporkan difoto dan diikuti dalam protes, dan bahwa keluarga mereka di rumah telah dilecehkan.
Di Georgetown, misalnya, seorang mahasiswa hukum Tiongkok yang membagikan selebaran yang mengecam kebijakan “nol-covid” TiongkokPita videoOleh anggota Asosiasi Mahasiswa dan Akademik Tiongkok, sebuah organisasi yang disponsori oleh pemerintah Tiongkok.
Mereka mengatakan kepadanya bahwa foto -foto itu akan dikirim ke karyawan keamanan di China. Dan segera setelah itu, keluarganya ditanyai dan memperingatkan bahwa mereka dapat menghadapi hukuman jika dia terus berbicara.
Sayangnya, semua ini tidak baru. Pada tahun 2021,melaporkan bahwa agen intelijen Cina Mereka menggunakan informan lokal untuk mengancam dan melecehkan siswa di Amerika. Beberapa siswa Tiongkok mengatakan mereka menghindari mengambil kursus dengan siswa lain di negara mereka, karena mereka tidak tahu siapa yang bekerja untuk pemerintah – dan siapa yang bisa melaporkannya.
Dan pada tahun 2020, ketika Covid memaksa universitas untuk pindah secara online, The Wall Street Journal terungkap Bahwa beberapa guru mengatakan kepada siswa China bahwa mereka tidak akan dievaluasi dalam partisipasi kelas. Fakultas tidak ingin murid -muridnya merasa perlu untuk berbicara dan berisiko berada di sisi yang salah dari karyawan keamanan Tiongkok, yang mungkin memantau mereka dalam zoom.
“Tidak ada cara untuk memberi tahu murid -murid saya: ‘Anda dapat mengetahui apa yang Anda inginkan pada panggilan telepon dan Anda benar -benar bebas dan aman,” aku seorang guru Harvard.
Tetapi sebagian besar pemimpin universitas kami diam tentang masalah ini. Mereka juga tidak ingin mengambil risiko, dengan begitu banyak uang yang dipertaruhkan.
Pengecualian yang baik -Hidup adalah Universitas Purdue, yang mencela spionase Cina Setelah Propubby, ia mengungkapkan bahwa salah satu muridnya dilecehkan oleh agen keamanan dengan menerbitkan surat tentang pembantaian Tiananmen Square 1989. Ini adalahTabu tabu di CinaItu melarang diskusi publik dan perayaan acara.
“Setiap siswa yang ditemukan telah melaporkan siswa lain ke entitas asing apa pun dengan menjalankan kebebasan berekspresi atau keyakinan mereka akan dikenakan sanksi yang signifikan.”dinyatakanMitch Daniels, presiden Purdue pada saat itu. “Kami menyesal bahwa kami tidak mengetahui peristiwa ini dan harus belajar tentang sumber -sumber nasional,” tambah Daniels, merujuk pada laporan 2021.
Kita semua tidak memiliki alasan, terutama sekarang. Segala sesuatu yang telah kami pelajari dalam empat tahun terakhir mengkonfirmasi fakta yang sama: Cina mengintimidasi para siswa dari institusi kami.
Dan pemerintah Trump juga, tentu saja. Dia punyaditangkap dan dideportasiSiswa internasional yang membuat komentar pro-Palestina. Dan telahMenyaring Akun Media Sosial Kandidat Visa MahasiswaTemukan “indikasi permusuhan apa pun dalam kaitannya dengan warga negara, budaya, pemerintah, lembaga atau prinsip pendirian Amerika Serikat.” Tidak ada yang tahu apa artinya itu, jadi kandidat menggosok laporan materi mereka tentang Barack Obama, Kamala Harris dan apa pun yang dapat menempatkan mereka di pemandangan pemerintah.
Bagi saya, ini terdengar lebih dengan Cina daripada Amerika. Prinsip pendirian kami yang paling penting adalah kebebasan berekspresi. Dan kami tidak menghormati, melecehkan siswa internasional kami, bahkan ketika kami menuduh mereka menjadi bermusuhan.
Tetapi kita tidak dapat membela kasus persuasif terhadap serangan Trump terhadap kebebasan jika kita mengabaikan serangan Tiongkok terhadapnya. Mengantisipasi bahwa banyak siswa internasional tidak akan dapat datang ke sini, beberapa universitas – termasuk saya -Mereka sedang membuat kursus dan program lini untuk melayani mereka.
Ini adalah isyarat yang hebat, tetapi juga membuat siswa semakin rentan terhadap pelecehan di seluruh internet di rumah. Dan itulah mengapa kita harus berbicara dengan siswa dan menjelaskan bahwa kita tidak akan mentolerir intimidasi mereka, seperti yang dikatakan Rubio.
Thomas Jefferson – yang tahu sesuatu tentang prinsip pendirian Amerika – bersumpah “permusuhan abadi terhadap semua bentuk tirani. “Dia tidak peduli dari mana kita berasal.
Jonathan Zimmerman mengajar pendidikan dan sejarah di University of Pennsylvania dan bekerja di Pusat LePage untuk Dewan Penasihat Sejarah Kepentingan Umum.
Pendapat
Obama Nosy Russiagate: Surat

Pertanyaannya: melaporkan bahwa mantan Presiden Barack Obama memajukan narasi kolusi Rusia pada tahun 2016.
Selamat atas permainan Martin Gurri di “Obamagate” (“dari Rusia tanpa ada yang bisa dibicarakan”, 29 Juli)
Sungguh ironis bahwa pembingkaian Presiden Trump sebagai “ancaman terhadap demokrasi” adalah ikan haring merah untuk kerusakan nyata yang disebabkan oleh Presiden Barack Obama dan pembantunya.
Penyalahgunaan posisinya yang tinggi bahkan lebih terang -terangan daripada Presiden Richard Nixon, dan juga membuang bangsa kita.
Tidak relevan bahwa pengkhianatan ini tidak menjalani kejahatan pengkhianatan. Pencemaran nama baik sangat berbahaya dan terlarang. Dan untuk melengkapi itu, media yang diwariskan tetap terlibat di mana -mana. “Demokrasi mati dalam kegelapan,” sebenarnya!
James Evans
Worcester, Massachusetts.
Kami, “Warga Penyihir Rasis” yang mengancam demokrasi, “” bodoh “,” rasis, “kami akhirnya menghirup udara yang langka dari kebenaran.
Terima kasih, Martin Gurri, atas permainannya yang terperinci dan mengungkapkan tentang lelucon Rusia.
Dari zaman kuno hingga saat ini, nafsu oleh kekuasaan telah menghancurkan banyak budaya. Sekarang kebebasan berekspresi, para pembela yang kuat dan kehormatan melindungi kita saat kita mengungkap contoh sejarah kesombongan kesombongan.
Sayap lilin Icarus meleleh dan dia meninggal, tetapi demokrasi kita akan bertahan.
Abby Rudnick
Farmingdale, NJ
Pada tahun 2020, Komite Intelijen Senat, yang dipimpin oleh Marco Rubio, mengatakan komite secara tegas tidak menemukan bukti bahwa Donald Trump dan/atau kampanyenya berkonspirasi dengan pemerintah Rusia dalam pemilihan umum 2016.
Namun, ia menyimpulkan bahwa ada bukti tak terbantahkan dari upaya Rusia untuk mengganggu. Dan itulah yang dipimpin Presiden Obama di televisi dan memberi tahu publik Amerika.
Kebingungan baru ini hanyalah upaya lain untuk defleksi dari pemerintah Trump, apa yang dia lakukan untuk negara ini dan apa yang dia sembunyikan.
Lou Mayon
Manhattan
Media arus utama jatuh cinta pada Obama selama delapan tahun kepresidenannya, tidak pernah mempertanyakan kinerjanya.
Ini adalah kasus cinta, murni dan sederhana. Dan tetap seperti ini sampai hari ini, bahkan ketika kita tahu sekarang bahwa Obama telah mengarahkan operasi palsu untuk mendiskreditkan kemenangan penggantinya.
Kisah ini ditulis oleh para pemenang, kecuali ketika jejak kertas memperlihatkan pengkhianatan mereka, seperti yang sekarang diungkapkan Trump tentang Obama.
Paul Bloustein
Cincinnati, Ohio
Sekarang kita tahu lebih banyak tentang apa yang terjadi, tidak terlalu mengejutkan mengetahui tentang keterlibatan Obama dalam Russiagate.
Lagipula, dia keluar dari mesin yang korup Chicago dan, tidak masuk akal, berbohong kepada jutaan orang tentang asuransi kesehatannya dan akses ke dokter, dan sekarang kita mempelajarinya.
Michelle Obama memberi tahu kami bahwa ibunya tidak mempercayai siapa pun yang mengambil lebih dari yang dia butuhkan.
Lihat kerusakan yang telah dilakukan Barack dan sekarang ia memiliki keadilan besar, memiliki rumah -rumah besar di Martha’s Vineyard dan Hawaii. Lagi pula, ibu Michelle benar, bukan?
Gary Mottola
Brooklyn
Oleh karena itu, media yang diwariskan sekarang ingin penonton melanjutkan dengan penipuan kolusi Rusia yang dilakukan oleh mereka. Mereka bahkan menerima penghargaan untuk pukulan ini. Saya katakan, tidak!
Pengacara -General Pam Bondi dan Direktur FBI Kash Patel sekarang diharapkan untuk menyelidiki apa yang dilakukan pemerintah Obama pada pertemuan itu pada 9 Desember 2016 di Gedung Putih.
Partai Republik tidak pernah bisa melupakan apa yang dilakukan dengan presiden mereka -terpilih.
Andrew France
Dallas, PA.
Tidak ada yang harus dikejutkan oleh wahyu baru -baru ini bahwa Obama adalah mentor di balik penipuan kolusi Rusia.
Pada bulan Februari 2017, Paul Sperry menulis kolom untuk The Post (“Lie Bam-Led”, 19 Februari 2017), di mana ia mengungkapkan keberadaan “Organisasi Aksi” Obama, yang termasuk perekrutan ribuan tentara untuk menyabot presiden Trump.
Diragukan bahwa beberapa orang Amerika telah mempelajari sesuatu yang baru hari ini.
JJ Crovatto
Ramsey, NJ
Ingin menimbang tentang cerita hari ini? Kirimkan pemikiran Anda (bersama dengan nama lengkap dan kota tempat tinggal Anda) ke letters@nypost.com. Surat -surat tersebut dapat diedit untuk kejelasan, panjang, akurasi, dan gaya yang lebih besar.
Pendapat
Tidak ada hal baik yang akan datang dari perintah Trump untuk memaksa mereka tanpa -tetus meninggalkan jalanan

Untuk editor: Saya dapat membantu Anda memahami perintah Presiden Trump untuk memaksa orang di luar jalan dan rumah sakit (“Perintah Trump tentang kurangnya perumahan memahami segala sesuatu yang salah, dan inilah sebabnya,” 25 Juli). Dia sudah punya Dana Federal untuk perawatan kesehatan mental dan pemulihan penyalahgunaan zat. Dia Ingin memotong Perumahan bersubsidi juga secara federal. Tidak ada tempat tidur rumah sakit yang cukup untuk mengakomodasi pasien sekarang dan dia belum menawarkan untuk membayar lebih.
Saya tidak akan terkejut jika ini adalah langkah pertama dalam rencana mereka untuk mengeluh bahwa negara -negara tertentu tidak mengambil cukup banyak orang dari jalanan, jadi mereka harus “diperlakukan” di bidang penangkapan imigran mereka – sesuatu yang dia belanjakan uang federal untuk berkembang dan manfaatkan perusahaan swasta yang menyumbang kepadanya. Dia menunjukkan kepada kita siapa dia; Percaya padanya. Tidak ada hal baik yang keluar dari perintah eksekutif ini.
Linda Reynolds, Northridge
- Berita8 tahun ago
These ’90s fashion trends are making a comeback in 2017
- Berita8 tahun ago
The final 6 ‘Game of Thrones’ episodes might feel like a full season
- Berita8 tahun ago
According to Dior Couture, this taboo fashion accessory is back
- Berita8 tahun ago
The old and New Edition cast comes together to perform
- Berita8 tahun ago
Phillies’ Aaron Altherr makes mind-boggling barehanded play
- Berita8 tahun ago
Uber and Lyft are finally available in all of New York State
- Berita8 tahun ago
Disney’s live-action Aladdin finally finds its stars
- Berita8 tahun ago
Mod turns ‘Counter-Strike’ into a ‘Tekken’ clone with fighting chickens