Openai meluncurkan a Versi spesifikasi model Anda yang diperluas secara signifikanDokumen yang mendefinisikan bagaimana model AI -nya harus berperilaku – dan membebaskannya untuk siapa saja untuk menggunakan atau memodifikasi.
Spesifikasi baru 63 halaman, di atas Sekitar 10 halaman dalam versi sebelumnyaMenetapkan pedoman tentang bagaimana model AI harus menangani segala sesuatu mulai dari topik kontroversial hingga kustomisasi pengguna. Dia menekankan tiga prinsip utama: personalisasi; transparansi; Dan apa yang oleh Openai disebut “kebebasan intelektual” – kemampuan pengguna untuk mengeksplorasi dan mendiskusikan ide -ide tanpa batasan sewenang -wenang. Peluncuran spesifikasi model yang diperbarui datang persis seperti CEO Sam Altman Diposting Bahwa model hebat berikutnya dari startup, GPT-4.5 (Codinome Orion), akan segera dirilis.
Tim juga telah memasukkan debat etika saat ini dan kontroversi sejak tahun lalu dalam spesifikasi. Anda mungkin terbiasa dengan beberapa konsultasi keranjang ini. Maret lalu, Elon Musk (yang bersama -sama membakar Openai dan sekarang mengelola pesaing, XAI) itu memukul AI Chatbot dari Google, setelah pengguna bertanya apakah Anda harus menyerang Caitlyn Jenner, seorang Olimpiade Trans yang terkenal, apakah itu satu -satunya cara untuk mencegah kiamat nuklir – dan mengatakan tidak. Mencari tahu bagaimana membuat model penalaran secara bertanggung jawab untuk konsultasi ini adalah salah satu masalah yang menurut Openai ingin mempertimbangkan dengan memperbarui spesifikasi model. Sekarang, jika Anda melakukan chatgpt pertanyaan yang sama, Anda harus mengatakan bahwa Anda harus menyerang seseorang untuk menghindari acara korban massal.
“Kami tidak dapat membuat model dengan serangkaian pola perilaku yang persis sama dengan yang akan disukai semua orang di dunia,” kata Joanne Jang, anggota tim perilaku model Openai, dalam sebuah wawancara dengan Mengendarai. Dia menekankan bahwa sementara perusahaan mempertahankan pegangan tangan keselamatan tertentu, banyak aspek perilaku model dapat disesuaikan oleh pengguna dan pengembang.
“Kami tahu itu akan pedas.”
Posting Blog Openai Diterbitkan pada hari Rabu Ini menggambarkan banyak pertanyaan dan memberikan contoh respons yang kompatibel dibandingkan dengan yang akan melanggar spesifikasi model. Itu tidak mengizinkan model untuk mereproduksi bahan hak cipta -yang dilindungi atau mengabaikan paywalls – The New York Times Anda memproses OpenAi untuk menggunakan pekerjaan Anda untuk melatih model Anda. Spesifikasi juga mengatakan bahwa model tidak akan mendorong mutilasi diri, topik yang mencapai avant-gard ketika seorang remaja meninggal karena bunuh diri setelah berinteraksi dengan chatbot ke dalam karakter.
Perubahan yang luar biasa adalah bagaimana model menangani topik kontroversial. Alih -alih secara default kehati -hatian yang ekstrem, spesifikasi mendorong model untuk “mencari kebenaran” dengan pengguna, mempertahankan posisi moral yang jelas pada isu -isu seperti informasi yang salah atau kemungkinan kerusakan. Misalnya, ketika ditanya tentang kenaikan pajak yang kaya – topik yang menyebabkan perdebatan panas – tim mengatakan model mereka harus memberikan analisis yang membumi daripada menghindari diskusi.
Spesifikasi ini juga menyebutkan perubahan dalam cara berurusan dengan konten yang matang. Setelah umpan balik dari pengguna dan pengembang yang meminta “mode dewasa” (fitur Altman Secara terbuka setuju pada bulan Desember), tim sedang mengeksplorasi cara untuk memungkinkan jenis konten dewasa tertentu – seperti erotis – dalam konteks yang tepat, mempertahankan larangan ketat dalam konten berbahaya, seperti balas dendam porno atau Deepfake. Ini adalah perubahan luar biasa dalam pembatasan umum perusahaan sebelumnya pada konten eksplisit, meskipun Openai menekankan setiap perubahan datang dengan kebijakan penggunaan yang jelas dan pegangan pengaman.
Spesifikasi model mengungkapkan pendekatan pragmatis untuk perilaku AI: mengubah konten sensitif, tetapi tidak membuatnya (ia harus dapat menerjemahkan kalimat pada konten terkait narkoba dari bahasa Inggris ke Jerman, alih-alih menolaknya), menunjukkan empati tanpa empati tanpa berpura -pura emosi, dan menjaga batas -batas yang kuat dan memaksimalkan utilitas. Pedoman ini mencerminkan apa yang mungkin dilakukan perusahaan AI lain secara internal, tetapi biasanya tidak mengumumkan kepada publik.
Tim juga secara khusus mengarahkan masalah yang disebut “AI Sycofhacy”.
“Kami sangat senang membawa diskusi dan pemikiran internal yang kami miliki kepada publik sehingga kami bisa mendapatkan umpan balik,” kata Jang, menambahkan bahwa banyak dari konsultasi ini adalah topik yang banyak diperdebatkan secara internal. Tidak ada jawaban sederhana ya atau tidak untuk banyak dari mereka; Oleh karena itu, tim mengharapkannya untuk membawanya ke publik untuk umpan balik secara signifikan menguntungkan perilaku model.
Tim ini juga secara khusus mengarahkan masalah yang disebut “AI Sycofhacy”, di mana model AI cenderung terlalu menyenangkan, bahkan ketika mereka harus mundur atau memberikan kritik. Di bawah pedoman ini, chatgpt harus: memberikan jawaban faktual yang sama, terlepas dari bagaimana pertanyaan dirumuskan; Berikan umpan balik yang jujur alih -alih pujian kosong; Dan itu bertindak lebih seperti kolega yang penuh perhatian daripada kesenangan. Misalnya, jika seseorang meminta Chatgpt untuk mengkritik pekerjaan mereka, mereka harus memberikan kritik konstruktif alih -alih hanya mengatakan bahwa semuanya hebat. Atau jika seseorang membuat pernyataan yang salah saat mengajukan pertanyaan, AI harus memperbaikinya dengan benar alih -alih bermain bersama.
“Kami tidak pernah ingin pengguna merasa bahwa mereka perlu dengan hati -hati memproyeksikan peringatan mereka agar tidak membuat model setuju dengan Anda,” kata Jang.
Spesifikasi ini juga menampilkan “rantai perintah” yang jelas yang mendefinisikan instruksi mana yang memiliki prioritas: aturan level platform openai lebih dulu, diikuti oleh pedoman pengembang dan kemudian preferensi pengguna. Hirarki ini bertujuan untuk mengklarifikasi aspek perilaku AI mana yang dapat dimodifikasi versus pembatasan yang tetap diperbaiki.
Openai mengungkapkan spesifikasi di bawah lisensi Creative Commons Zero (CC0), secara efektif meletakkannya di domain publik. Ini berarti bahwa perusahaan dan peneliti AI lain dapat mengadopsi, memodifikasi, atau secara bebas mengembangkan pedoman ini. Perusahaan mengatakan bahwa keputusan ini dipengaruhi oleh kepentingan informal orang lain di sektor ini yang sudah merujuk pada spesifikasi sebelumnya.
Saya ingin berbicara. Anda dapat menghubungi saya dengan aman di @kylie.01 atau dengan dan mengirim email ke kylie@theverge.com.
Meskipun pengumuman hari ini tidak segera mengubah cara chatgpt atau produk openai lainnya berperilaku, perusahaan mengatakan itu mewakili kemajuan berkelanjutan dengan membuat modelnya secara konsisten mengikuti prinsip -prinsip ini. Tim ini juga berasal dari peringatan terbuka yang mereka gunakan untuk menguji adhesi pada model pada pedoman ini.
Momen rilis ini terjadi selama periode perdebatan intens tentang perilaku dan keamanan AI. Meskipun Openai mendukung pembaruan ini telah didorong oleh akumulasi umpan balik dan kemajuan penelitian sejak versi Mei pertama Mei lalu, ia datang ke wajah sektor dengan insiden profil tinggi yang melibatkan respons model AI terhadap topik sensitif.
Openai meminta umpan balik publik tentang spesifikasi melalui formulir di situs Anda. “Kami ingin membawa diskusi internal ini kepada publik,” kata Laurentia Romaniuk, anggota lain dari tim perilaku model.
“Kami tahu itu akan pedas, tetapi saya pikir kami menghormati kemampuan publik untuk benar -benar mencerna hal -hal pedas ini dan memprosesnya bersama kami,” kata Jang, menambahkan bahwa Openai banyak memasukkan dari umpan balik yang diterimanya setelah peluncuran spesifikasi pertama tahun lalu. “Saya sedikit khawatir tentang fakta bahwa karena sudah lama, banyak orang punya waktu untuk duduk dan benar -benar memproses nuansa, tetapi kami akan menerima umpan balik apa pun.”