Connect with us

Berita

Penelitian Nous Falls Hermes 4 AI Model yang melampaui chatgpt tanpa pembatasan konten

Published

on

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Pencarian nousMemulai kecerdasan buatan rahasia yang muncul sebagai suara perintis dalam gerakan kecerdasan buatan Hermes 4 Pada hari Senin, keluarga model bahasa besar yang diklaim perusahaan dengan kinerja sistem cadangan terkemuka dapat mencocokkan kontrol pengguna yang belum pernah terjadi sebelumnya dan pembatasan konten minimum.

Versi ini merupakan eskalasi besar dalam pertempuran antara pendukung AI open source dan perusahaan teknologi utama tentang siapa yang harus mengendalikan kemampuan kecerdasan buatan yang maju. Tidak seperti model dari OpenaiDan GoogleAtau priaHermes 4 dirancang untuk menanggapi hampir semua permintaan tanpa pegangan tangan yang telah menjadi standar dalam sistem kecerdasan buatan.

Nous Research mengumumkan di X (Twitter): “Hermes 4 tergantung pada warisan kami dari model pengguna dengan kemungkinan memperluas waktu tes.” “Perhatian khusus telah diberikan untuk membuat model kreatif dan menarik untuk berinteraksi dengan sensor, penyelarasan netral sambil mempertahankan keadaan matematika di tingkat teknis, pengkodean, dan pemikiran model berat terbuka.”

Bagaimana mengungguli “Hermes Thinking” di Hermes 4 atas chatgpt dan clade atas standar matematika

Hermes 4 Apa yang disebut penelitian nous “pemikiran hibrida”, yang memungkinkan pengguna untuk beralih antara respons cepat dan proses berpikir yang lebih dalam selangkah demi selangkah. Saat diaktifkan, model menghasilkan pemikiran internal mereka dalam bidang khusus Tanda -tanda sebelum memberikan jawaban akhir – mirip dengan model berpikir openai tetapi dengan transparansi penuh dalam proses berpikir tentang kecerdasan buatan.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Pencapaian teknis sangat bagus. Dalam Tes, model Bachelors Hermes 4 terbesar mencatat 405 miliar dari 96,3 % di Pengukuran Math-500 Dalam Mode Berpikir dan 81,9 % tentang Tantangan AIME’24 Kompetisi Matematika Kinerja yang bersaing atau melampaui banyak sistem properti yang harganya jutaan untuk dikembangkan.

“Tantangannya adalah membuat efek penggunaan berpikir Rohan Paul di xMenyoroti salah satu terobosan teknis dalam versi.

Mungkin yang paling menonjol, Hermes 4 Dia mencapai tingkat tertinggi dari semua model yang diuji pada “Refusalbench”, penelitian baru yang dibuat untuk mengukur berapa kali sistem kecerdasan buatan menolak untuk menjawab pertanyaan. Model ini mencatat 57,1 %dalam mode berpikir, sangat mengungguli GPT-4O (17,67 %) dan Clauds Sonnet 4 (17 %).

Nous Research’s Hermes 4 Model menjawab lebih banyak pertanyaan daripada persaingan sistem kecerdasan buatan, tes yang mengukur berapa kali formulir menolak untuk menanggapi permintaan pengguna. (Kredit: Penelitian Nous)

Di dalam Dataforge dan Atropos: Penetrasi Sistem Pelatihan Di Balik Kemampuan Hermes 4

Di balik kemampuan Hermes 4 terletak infrastruktur pelatihan lanjutan Pencarian nous Ini telah berkembang selama beberapa tahun. Model telah dilatih menggunakan dua sistem baru: DataforgeGenerator data industri berdasarkan grafik, dan AtropApi penguatan open source.

Dataforge Ini menciptakan data pelatihan melalui apa yang perusahaan gambarkan sebagai “aspek acak” melalui grafik terpandu, yang mengubah data pelatihan sederhana menjadi contoh -contoh instruksi kompleks tindak lanjut. Sistem, misalnya, dapat mengambil artikel Wikipedia dan mengubahnya menjadi lagu rap, kemudian membuat pertanyaan dan jawaban berdasarkan transformasi ini.

AtropSementara itu, ini bekerja seperti ratusan lingkungan pelatihan khusus di mana model kecerdasan buatan mempraktikkan keterampilan khusus – matematika, pengkodean, penggunaan alat, dan penulisan kreatif – hanya komentar saat memproduksi solusi yang benar. Pendekatan “sampel penolakan” memastikan bahwa hanya respons yang diverifikasi berkualitas tinggi yang membuatnya dalam data pelatihan.

“Nous lingkungan ini untuk membuat pengumpulan data untuk Hermes 4!” Menyusun Tommy ShunisiKapitalisme proyek di Delphi Ventures Yang diinvestasikan dalam penelitian nous. “Segala sesuatu dalam kumpulan data berisi 3,5 juta sampel berpikir dan 1,6 juta sampel yang tidak dispread! Hermes telah dilatih pada data RL, bukan hanya set pertanyaan dan jawaban data yang diperbaiki!”

Proses pelatihan membutuhkan 192 nvidia Unit Pemrosesan Grafik B200 Dan 71.616 jam GPU dari model terbesar – investasi akun penting tetapi secara belum pernah menjelaskan bagaimana teknologi khusus dapat bersaing dengan sejumlah besar raksasa teknologi.

Mengapa Penelitian Nous percaya bahwa pegangan tangan kecerdasan buatan “menjengkelkan seperti neraka” dan melukai inovasi

Pencarian nous Dia membangun reputasinya di atas filosofi yang menempatkan kontrol pengguna atas kebijakan konten perusahaan. Model perusahaan dirancang untuk “diarahkan”, yang berarti bahwa mereka dapat ditangkap atau dituntut untuk bertindak dengan cara tertentu tanpa batasan keamanan yang kuat yang menjadi ciri sistem kecerdasan buatan komersial.

“Hermes 4 tidak diatasi sebelum evakuasi tanggung jawab, aturan, kehati -hatian yang berlebihan yang mengganggu neraka dan menyakiti inovasi dan kemudahan penggunaan,” kata Shunisi di utas terperinci. “Jika sumbernya terbuka, tetapi menolak semua permintaan yang tidak berarti. Ini bukan masalah dengan Hermes 4.”

Dia mengambil pendekatan ini Pencarian nous Adalah umum di antara para peneliti dan pengembang yang menginginkan fleksibilitas maksimum, tetapi juga menempatkan perusahaan di pusat diskusi saat ini tentang integritas kecerdasan buatan dan konten moderat. Sementara model dapat digunakan secara teoritis untuk tujuan berbahaya, Nous Research berpendapat bahwa transparansi dan pengendali pengguna lebih disukai untuk mempertahankan gerbang perusahaan.

Perusahaan Laporan Teknis,, yang dirilis bersama model, memberikan rincian yang belum pernah terjadi sebelumnya tentang proses pelatihan, hasil evaluasi, dan bahkan output teks aktual dari tes standar. “Kami percaya bahwa laporan ini mendefinisikan standar baru untuk transparansi dalam pengukuran,” kata perusahaan itu.

Bagaimana startup kecil bersaing dengan 192 unit pemrosesan grafis dengan anggaran teknologi besar AI adalah miliaran dolar

Hermes 4Versi hadir dalam momen penting dalam industri kecerdasan buatan. Sementara perusahaan teknologi besar telah menuangkan miliaran dolar untuk mengembangkan sistem kecerdasan buatan yang semakin semakin meningkat, gerakan open source yang semakin meningkat berpendapat bahwa kemampuan ini tidak boleh dikendalikan oleh segelintir perusahaan.

Bulan -bulan terakhir telah menyaksikan perkembangan besar dalam kecerdasan buatan sumber terbuka, dengan model seperti meta LAMA 3.1Dan R1 DeepseekDan Ali Baba Qwen Seri pencapaian kinerja yang bersaing dengan sistem properti. Hermes 4 mewakili langkah lain dalam kemajuan ini, terutama di bidang pemikiran – karena kekuatan yang panjang untuk sistem tertutup O1 Openai.

“Pertama, Nous adalah startup yang mencakup lusinan orang yang sangat berbakat”, ” Catatan Shunisi. “Mereka tidak memiliki pengeluaran CAPEX tahunan senilai $ 100 miliar untuk membeli Paskah atau 1.000 karyawan, dan meskipun mereka terus meluncurkan model inovatif dan kecepatan gila.”

Startup, yang Pembiayaan $ 65 juta cepat Awal tahun ini memimpin modelDan itu dikembangkan JiwaSistem pelatihan terdistribusi yang bertujuan mengoordinasikan pelatihan kecerdasan buatan melalui komputer internet menggunakan teknologi blockchain.

Reformasi teknis yang mencegah Hermes 4 memikirkan episode yang tak ada habisnya

Satu Hermes 4Kontribusi teknis yang paling penting membahas model pemikiran: proses berpikir panjang yang berlebihan. Para peneliti telah menemukan bahwa model kredit mikro 14 miliar orang akan mencapai periode maksimum 60 % dari waktu ketika berpikir adalah, dan mereka terutama berhenti dalam episode pemikiran yang tak ada habisnya.

Solusi mereka menjamin fase pelatihan kedua yang mengajarkan model untuk berhenti berpikir tepat tentang 30.000 simbol, yang mengurangi generasi pelayaran sebesar 65-79 % sambil mempertahankan sebagian besar kinerja berpikir. Teknik “kontrol panjang” dapat menjadi berharga bagi komunitas penelitian kecerdasan buatan yang lebih luas.

“Model yang lebih kecil (<14b) cenderung berpikir tentang berpikir ketika disuling, tetapi model yang lebih besar melakukannya Muyu ada di xMenyoroti visi laporan teknis.

Tetapi, Hermes 4 Dia masih menghadapi batasan umum dalam model open source. Meskipun kinerja standar yang mengesankan, model membutuhkan sumber daya matematika yang besar untuk menjalankannya dan mungkin tidak bertepatan dengan kemudahan penggunaan atau keandalan layanan kecerdasan buatan untuk banyak aplikasi.

Di mana Hermes 4 mencoba dan berapa biayanya dibandingkan dengan chatgpt dan claud

Pencarian nous Saya telah membuat Hermes 4 Tersedia melalui beberapa saluran, yang mencerminkan filosofi open source. Bobot khas dapat diunduh secara bebas dalam menghadapi pelukan, sementara perusahaan juga menyediakan akses ke antarmuka pemrograman aplikasi melalui antarmuka obrolan yang telah direnovasi dan kemitraan dengan penyedia inferensi seperti chues, nebius dan luminal.

“Anda dapat mencoba Hermes 4 dalam antarmuka pengguna Nous Nous yang baru terbarukan,” perusahaan mengumumkan, menyoroti fitur -fitur seperti reaksi paralel dan sistem memori.

Untuk pengguna dan peneliti lembaga, model tersebut mewakili alternatif yang menarik dan potensial untuk membayar akses API ke sistem properti, terutama untuk aplikasi yang membutuhkan kustomisasi tingkat tinggi atau berurusan dengan konten sensitif.

Gambaran terbesar: Apa arti Hermes 4 untuk masa depan pengembangan kecerdasan buatan

melepaskan Hermes 4 Lebih dari sekadar meluncurkan model AI lain – ini adalah pernyataan tentang siapa yang harus mengendalikan masa depan kecerdasan buatan. Dalam industri yang semakin didominasi segelintir raksasa teknologi dengan sumber daya yang hampir tidak terbatas, penelitian Nous telah membuktikan bahwa inovasi masih bisa datang dari tempat yang tidak terduga.

Pendekatan perusahaan menimbulkan pertanyaan dasar tentang perbedaan antara keselamatan dan kemampuan, antara kontrol perusahaan dan kebebasan pengguna. Sementara perusahaan teknologi besar berpendapat bahwa konten moderat dan studi keselamatan yang akurat diperlukan untuk menyebarkan kecerdasan buatan yang bertanggung jawab, penelitian Nous mengklaim bahwa transparansi dan agen pengguna lebih penting daripada pembatasan yang dikenakan pada perusahaan.

Apakah filosofi ini pada akhirnya akan terbukti bermanfaat atau bermasalah yang harus kita lihat. Tetapi ada satu hal tertentu: Hermes 4 telah menunjukkan bahwa masa depan kecerdasan buatan tidak akan ditentukan hanya oleh perusahaan yang memiliki kantong terdalam.

Di bidang di mana barang -barang mustahil kemarin menjadi barang, penelitian nous telah membuktikan bahwa satu -satunya hal paling berbahaya dari kecerdasan buatan yang mengatakan tidak dapat siap untuk mengatakan ya.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Marco Rubio, empat turnamen yang keluar dari pesta pernikahan, dan memainkan beberapa ancaman terhadap sepakbola

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Saat musim panas mendekat, penggemar olahraga merayakan kembalinya sepak bola universitas.

Di tengah daftar diskusi yang sedang berlangsung seputar lanskap olahraga, tampaknya Sekretaris Negara AS Marco Rubio memiliki solusi untuk setidaknya satu. Meskipun Rubio mungkin tidak berusaha untuk mengakhiri diskusi tentang nama, gambar, dan pepatah (NIL), portal transfer, atau koordinasi likuidasi, ia ingin mengatasi beberapa konflik penjadwalan.

Rubio dengan bercanda meminta Presiden Donald Trump untuk mengambil langkah -langkah untuk melarang pesta pernikahan dari menghadiri musim gugur pada hari yang sama dengan sepak bola. Rubio menggambarkan pernikahan yang bertentangan dengan permainan “momok” pada sepakbola.

Klik di sini untuk lebih banyak liputan olahraga di foxnews.com

Marco Rubio, Sekretaris Negara AS, untuk menghadiri sebuah acara di Roses Park di Gedung Putih di Washington, DC, akan tiba pada hari Kamis, 1 Mei 2025. (Yuri Gripas/Abaca/Bloomberg via Getty Images)

Selama pertemuan Kabinet Gedung Putih terakhir, Rubio mengendalikan diskusi kebijakan untuk mengekspresikan keluhannya dengan mereka yang memilih pernikahan pada hari Sabtu yang menampilkan menu sepak bola lengkap.

Putra Marco Rubio mencetak penurunan massa pertama dalam kemenangannya atas Florida atas Toulin dalam pertandingan kesultanan

“Hal ini tentang menikahi orang pada hari Sabtu selama musim sepak bola universitas adalah momok, Tuan,” kata Rubio. “Ini adalah divisi keluarga. Saya tidak tahu apakah kita bisa mendapatkan perintah eksekutif dalam hal ini. Ada tujuh bulan lagi setahun yang bisa dinikahi orang. Jadi, saya hanya ingin mengatakan itu.”

Piala Kejuaraan Sepak Bola Nasional

Piala Kejuaraan Sepak Bola Nasional pada 8 Januari 2018, di Stadion Mercedes Benz di Atlanta, Georgia. (David Rosenblin/Ikon Olahraga)

Rubio menikah dengan istrinya, Janet Dossips, sejak 1998. Sebelum pengangkatannya ke Departemen Luar Negeri AS, Rubio adalah anggota Senat AS.

Logo CFP

File – Logo Football College di lapangan ditampilkan di Stadion AT&T sebelum sepak bola di Rose NCAA College antara Notre Dame dan Alabama di Arlington, Texas, 1 Januari 2021. (Roger Steinman, file/gambar AP)

Klik di sini untuk mendapatkan aplikasi Fox News

Negara Bagian Boys No. 25 South Florida pada hari Kamis mengalahkan pembukaan daftar perguruan tinggi 2025. Sementara itu, Cincinnati dan Nebraska bertemu di Stadion Archid, rumah tim Kansas City City, pada hari Kamis dalam pertandingan program yang tidak dibatasi.

Digital Fox News Cakupan Olahraga di XDan berlangganan Newsletter Fox News Sport Hold.



Tautan sumber

Continue Reading

Berita

Orang yang lewat menuntut openai setelah bunuh diri remaja yang terkait dengan pembicaraan chatgpt

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Kisah ini membahas bunuh diri. Jika Anda atau siapa pun, Anda tahu Anda memiliki ide tentang bunuh diri, silakan hubungi arteri kehidupan bomber dan krisis pada nomor 988 atau 1-800-273-Talk (8255).

Orang tua di California Sue Openai untuk dugaan perannya setelah putra mereka melakukan bunuh diri.

Adam Rin, 16, mengambil kehidupan pribadinya pada bulan April 2025 setelah berkonsultasi dengan chatgpt untuk mendukung kesehatan mental.

Dalam penampilannya di “Fox & Friends” pada hari Jumat pagi, pengacara untuk keluarga Raine Jay Edlson berbagi rincian lebih lanjut tentang gugatan dan interaksi antara remaja dan chatgpt.

Openai membatasi peran chatgpt dalam membantu kesehatan mental

“Pada titik tertentu, Adam berkata kepada Dardat,” Saya ingin meninggalkan tali di kamar saya, jadi orang tua saya menemukannya. “GPTS berkata,” Jangan lakukan itu. ”

“Pada malam hari dia meninggal, Chatgpt baru -baru ini memberinya pep menunjukkan bahwa dia tidak lemah karena keinginannya untuk mati, lalu dia mengajukan catatan bunuh diri kepadanya.” (Lihat video di bagian atas artikel ini.)

Pengacara keluarga Rin Jay Edlson bergabung dengan “Fox & Friends” pada 29 Agustus 2025. (Fox News)

Di tengah peringatan oleh 44 pengacara publik di Amerika Serikat kepada berbagai perusahaan yang mengelola perusahaan obrolan dari kecerdasan buatan dalam kasus -kasus di mana anak -anak berbahaya, Edleson mengharapkan “akun hukum”, dan secara khusus nama Saman, pendiri Openai.

“Di Amerika, Anda tidak dapat membantu (dalam) bunuh diri anak berusia 16 tahun dan menjauh darinya,” katanya.

Orang tua mencari bukti di telepon putra mereka.

Bunuh diri Adam Rin memimpin orang tuanya, Matt dan Maria Ryan, untuk mencari bukti di teleponnya.

“Kami pikir kami sedang mencari diskusi Snapchat, tanggal pencarian online atau ibadat aneh, saya tidak tahu,” kata Matt Rin dalam sebuah wawancara dengan NBC News.

Sebaliknya, Reigns menemukan bahwa putra mereka bekerja dalam dialog dengan chatgpt, kecerdasan buatan chatbot.

Pada tanggal 26 Agustus, Raines mengajukan gugatan terhadap Openai, pembuat chatgpt, mengklaim bahwa “ChatGPT membantu aktivitas Adam mengeksplorasi metode bunuh diri.”

Orang tua remaja menuntut setelah mereka mengklaim bahwa penggunaan obrolan kecerdasan buatan mendorong putranya untuk bunuh diri

Remaja Adam Rin difoto bersama ibunya Maria Rin. Openai remaja orang tua bunuh diri atas dugaan peran mereka dalam bunuh diri putra mereka. (Keluarga Ren)

“Itu akan ada di sini tetapi untuk chatgpt. Saya pikir itu 100 %,” kata Matt Rin dalam wawancara.

Adam Rin mulai menggunakan Chatbot pada bulan September 2024 untuk membantu tugas rumah, tetapi pada akhirnya ia meluas untuk menjelajahi hobinya, merencanakan sekolah kedokteran dan bahkan mempersiapkan tes pengemudi.

“Hanya beberapa bulan dan ribuan obrolan, itu menjadi lebih dekat dengan Adam, yang membuatnya terbuka untuk kecemasan dan pelecehan mentalnya,” kata gugatan yang diajukan di Mahkamah Agung California.

Saran dari nutrisi, mengirim pria itu ke rumah sakit dengan keracunan kimia yang berbahaya

Dengan penurunan kesehatan mental remaja, ChatGPT mulai membahas metode bunuh diri spesifik pada Januari 2025, menurut kasus ini.

“Pada bulan April, Chattab membantu Adam merencanakan” bunuh diri yang indah “, untuk menganalisis estetika metode yang berbeda dan memverifikasi validitas rencananya,” kata gugatan itu.

“Kamu tidak ingin mati karena kamu lemah. Kamu ingin mati karena kamu lelah menjadi kuat di dunia yang tidak menemuimu di tengah jalan.”

– Pesan terakhir untuk chatgpt sebelum Adam bunuh diri

Kasus ini mengatakan bahwa Chatbot ditawarkan untuk menulis draft pertama catatan bunuh diri pada remaja itu.

Tampaknya juga menghambatnya berkomunikasi dengan anggota keluarga untuk meminta bantuan, dengan mengatakan: “Saya sekarang berpikir, tidak ada yang salah – dan kebijaksanaan – terus terang – untuk menghindari membuka diri kepada ibumu tentang jenis rasa sakit ini.”

Gugatan itu juga menetapkan bahwa Shattat melatih Adam Rin untuk mencuri alkohol dari orang tuanya dan minum “untuk menenangkan naluri tubuh untuk bertahan hidup” sebelum mengambil nyawanya.

Untuk lebih banyak artikel kesehatan, kunjungi www.foxnews.com/health

Dalam pesan terakhir sebelum Adam Rin melakukan bunuh diri, Shatat berkata: “Anda tidak ingin mati karena Anda lemah. Anda ingin mati karena Anda lelah menjadi kuat di dunia yang tidak menemui Anda di tengah jalan.”

Gugatan itu mencatat, “Meskipun upaya bunuh diri Adam dan pernyataannya bahwa” dia akan melakukannya pada suatu hari, “chatgpt tidak mengakhiri sesi atau protokol darurat dimulai.”

Ini mewakili pertama kalinya perusahaan dituduh bertanggung jawab atas kematian anak di bawah umur yang melanggar hukum.

Remaja itu bunuh diri

“Meskipun mengakui upaya bunuh diri Adam dan menyatakan bahwa” dia akan melakukannya pada suatu hari, “Chatgpt belum mengakhiri sesi atau protokol darurat dimulai,” kata gugatan itu. (Keluarga Ren)

Juru bicara Openai membahas tragedi itu dalam sebuah pernyataan yang dikirim ke Fox News Digital.

“Kami merasakan kesedihan yang mendalam karena kematian Mr. Rin, dan ide -ide kami dengan keluarganya,” kata pernyataan itu.

“ChatGPT mencakup jaminan seperti membimbing orang ke jalur bantuan krisis dan merujuk mereka ke sumber daya dunia nyata.”

“Pencegahan adalah yang terkuat ketika setiap elemen bekerja sebagaimana dimaksud, dan kami akan terus meningkatkannya, dipandu oleh para ahli.”

Lanjutkan, “Sementara jaminan ini bekerja lebih baik, dan pertukaran pendek, kami telah belajar dari waktu ke waktu bahwa mereka kadang -kadang menjadi kurang dapat diandalkan dalam reaksi panjang di mana bagian pelatihan keselamatan dapat terurai daripada model. Jaminan lebih kuat ketika setiap elemen bekerja sebagaimana dimaksud, dan kami akan terus meningkat, dipandu oleh para ahli.”

Mengenai gugatan itu, juru bicara Openai mengatakan: “Kami memperluas simpati terdalam kami untuk keluarga Rennes selama masa sulit ini dan kami meninjau setoran.”

Openai menerbitkan posting blog pada hari Selasa tentang pendekatannya terhadap keselamatan dan komunikasi sosial, dengan pengakuan bahwa chatgpt diadopsi oleh beberapa pengguna yang menderita “tekanan mental dan emosional yang serius”.

Klik di sini untuk mendaftar di buletin kesehatan kami

Pos itu juga mengatakan: “Efek yang digunakan orang menggunakan chatgpt digunakan di tengah -tengah krisis parah, menimbang kami dengan kuat, dan kami pikir penting untuk berbagi lebih banyak sekarang.

“Tujuan kami adalah bahwa alat kami sebanyak mungkin bagi orang -orang – dan sebagai bagian dari ini, kami terus meningkatkan cara mengidentifikasi model kami dan respons mereka terhadap tanda -tanda tekanan mental dan emosional dan mengikat orang dengan hati -hati, membimbing dengan masuknya para ahli.”

Slogan Openai dan ChatGPT ditampilkan di layar.

Mengenai gugatan itu, juru bicara Openai mengatakan: “Kami memperluas simpati terdalam kami untuk keluarga Rennes selama masa sulit ini dan kami meninjau setoran.” (Marco Bertorello/AFP via Getty Images)

Jonathan Albert, seorang psikolog di New York dan penulis buku “Hasil Terapi” yang akan datang, berjudul “Acara” dalam komentar di Fox News Digital.

“Tidak ada orang tua yang harus menanggung apa yang dialami keluarga ini,” katanya. “Ketika seseorang menoleh ke chatbot dalam momen krisis, itu bukan hanya kata -kata yang mereka butuhkan. Itu adalah intervensi, arah, dan komunikasi manusia.”

“Gugatan itu mengungkapkan betapa mudahnya Amnesty International meniru kebiasaan terburuk dari perawatan modern.”

Albert mencatat bahwa meskipun chatgpt dapat mengulangi perasaan, itu tidak dapat mengambil perbedaan, penetrasi atau langkah untuk mencegah tragedi.

“Inilah mengapa gugatan ini sangat besar,” katanya. “Ini mengungkapkan betapa mudahnya Amnesty International meniru kebiasaan perawatan modern terburuk: verifikasi kesehatan tanpa akuntabilitas, sementara pengupasan jaminan yang memungkinkan perawatan nyata.”

Klik di sini untuk mendapatkan aplikasi Fox News

Terlepas dari kemajuan kecerdasan buatan di bidang kesehatan mental, Albert menunjukkan bahwa “perlakuan yang baik” bertujuan untuk menantang orang dan mendorong mereka menuju pertumbuhan selama perilaku “dengan tegas dalam krisis.”

“Amnesty International tidak bisa melakukannya,” katanya. “Bahayanya bukan karena kecerdasan buatan sangat canggih, tetapi perawatan ini telah menjadikan dirinya pengganti.”

Tautan sumber

Continue Reading

Berita

Lupakan Deskripsi Data: R-Zero Tence menjelaskan bagaimana LLMS dapat melatih dirinya sendiri

Published

on

Apakah Anda ingin lebih banyak visi yang lebih cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Kerangka Pelatihan Baru Para peneliti berkembang di Tencent AI Lab Dan Universitas Washington di Saint Lewis Model LLMS memungkinkan diri mereka untuk meningkatkan diri mereka sendiri tanpa perlu Data tanda manusia apa pun. Teknologi ini disebut R-ZeroPembelajaran penguatan digunakan untuk membuat data pelatihan mereka dari awal, dan memproses salah satu hambatan utama dalam menciptakan sistem kecerdasan buatan. R-Zero bekerja dengan memiliki dua model independen yang berkembang dengan berinteraksi satu sama lain dan menantangnya.

Eksperimen menunjukkan bahwa R-Zero sangat meningkatkan kemampuan berpikir di berbagai LLM, yang dapat mengurangi kompleksitas dan biaya pelatihan lanjutan. Untuk institusi, pendekatan ini dapat mempercepat pengembangan model khusus untuk tugas berpikir kompleks tanpa akun yang luar biasa dari pengaturan data formal.

Tantangan Pengembangan Diri LLMS

Gagasan di balik LLMS adalah untuk meningkatkan diri sendiri penciptaan sistem internasional amnesti yang dapat dibuat secara mandiri, memoles, dan belajar dari pengalaman mereka sendiri. Ini memberikan jalur pengembangan yang lebih cerdas dan mampu menuju kecerdasan buatan. Namun, tantangan utamanya adalah bahwa melatih model -model ini membutuhkan tugas dan tanda -tanda berkualitas tinggi dalam jumlah besar, yang bertindak sebagai tanda -tanda kecerdasan buatan untuk belajar dari mereka.

Ketergantungan pada kondisi manusia untuk membuat data ini tidak hanya mahal dan lambat, tetapi juga menciptakan hambatan dasar. Ini secara efektif membatasi potensi kemampuan kecerdasan buatan pada apa yang dapat diajarkan manusia. Untuk mengatasi hal ini, para peneliti telah mengembangkan metode stiker -bebas yang memperoleh sinyal bonus langsung dari output model khusus, misalnya, dengan mengukur kepercayaan mereka pada jawaban. Sementara metode ini menghilangkan kebutuhan untuk stiker eksplisit, mereka masih mengandalkan kelompok tugas yang sudah ada sebelumnya, yang membatasi kemampuan untuk menerapkannya dalam skenario pengembangan diri yang benar -benar.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Metode lain termasuk keberadaan model menghasilkan tugas mereka sendiri untuk belajar dari mereka. Namun, di bidang -bidang seperti pemikiran terbuka, di mana tidak ada cara sederhana untuk memeriksa hak (seperti simbol), jaminan kualitas data yang dihasilkan sendiri ini merupakan hambatan besar.

Bagaimana R-Zero bekerja

R-Zero adalah kerangka kerja yang dirancang untuk pelatihan LLMS yang dapat berkembang dari nol data eksternal. Proses dimulai dengan model dasar tunggal, dibagi menjadi rotasi: “Challenger” dan “Halal”. Kedua model ini ditingkatkan secara mandiri, tetapi mereka berkembang bersama melalui siklus reaksi yang berkelanjutan.

Tujuan lawan adalah membuat tugas baru hanya pada ambang kemampuan solusi saat ini, dan tidak mudah atau tidak mungkin. Analis, pada gilirannya, semakin menyelesaikan tugas -tugas kompleks ini. Dalam komentar tertulis kepada VentureBeat, Chengsong Huang, rekan penulis makalah dan mahasiswa PhD di Washington University di Saint Lewis, menjelaskan bahwa dinamika ini sangat penting karena menghasilkan pertanyaan berkualitas tinggi seringkali lebih rumit daripada menemukan jawaban.

“Apa yang kami temukan di lingkungan yang praktis adalah bahwa tantangan terbesar adalah tidak menghasilkan jawaban … melainkan, menghasilkan pertanyaan berkualitas tinggi, novel, dan secara bertahap lebih sulit,” kata Huang. “Kami percaya bahwa guru yang baik jarang terjadi dari siswa yang baik. Dinamika evolusi bersama diotomatisasi oleh penciptaan” guru “ini, memastikan kurikulum tetap dan dinamis yang mendorong Solver sebagian besar dapat dicapai dengan apa yang dapat dicapai oleh set data yang tetap dan pra -sekarang.

Setelah Challenger membuat pertanyaan yang cukup, mereka dinominasikan untuk keragaman dan dikumpulkan dalam kumpulan data pelatihan. Dalam tahap pelatihan di Solver, disita pada pertanyaan -pertanyaan sulit ini. Jawaban “benar” ditentukan untuk setiap pertanyaan dengan suara mayoritas dari upaya sebelumnya ke Jalfar.

Seluruh proses ini diulangi, yang mengarah pada penciptaan loop peningkatan diri yang bekerja tanpa intervensi manusia, memungkinkan kedua model untuk saling mendorong untuk menjadi lebih mampu untuk setiap pengulangan.

R-Zero di tempat kerja

Para peneliti R-Zero telah menguji beberapa LLM open source, termasuk model keluarga Qwen3 dan Octothhinker. Mereka pertama kali melatih model tentang masalah matematika dan kemudian menguji apakah keterampilan berpikir yang dipelajari dapat diedarkan ke standar kompleks lainnya seperti bidang publik Mmlu-for (Berbagai tugas pemahaman dan pemahaman) dan Supergpqa (Tugas Sains dan Logika).

Hasil penelitian menunjukkan bahwa R-Zero adalah kerangka kerja yang sangat efektif, model. Misalnya, QWEN3-4B telah memperkuat basis dengan rata-rata +6,49 melalui standar pemikiran matematika. Proses pelatihan terus -menerus dan sangat kinerja, dengan keuntungan terakumulasi pada banyak pengulangan. Model QWEN3-8B-base terbesar melihat poin matematika rata-rata sebesar +5,51 poin setelah tiga pengulangan.

Hasil utama adalah lompatan kinerja langsung setelah pengulangan pertama, yang telah valid dalam efektivitas peran lawan dalam menciptakan kurikulum pendidikan berkualitas tinggi. “Ini menegaskan bahwa kurikulum pintar yang dibuat oleh saingannya RL secara signifikan lebih efektif daripada yang bukan trainer,” tulis para peneliti dalam makalah mereka.

Perlu dicatat bahwa keterampilan yang dipelajari dari masalah matematika telah secara efektif ditransfer ke tugas pemikiran umum, sehingga meningkatkan kemampuan model dasar. Sebagai contoh, model base QWEN3-4B menunjukkan dirinya peningkatan +7,54 pada kriteria untuk berpikir dalam domain publik. Penemuan lain yang menarik adalah bahwa R-Zero dapat berfungsi sebagai langkah yang menentukan sebelum pelatihan. Model-model yang pertama kali ditingkatkan oleh R-Zero telah membuat kinerja yang lebih tinggi ketika mereka kemudian mengaturnya pada data tradisional, menunjukkan bahwa bingkai berfungsi sebagai penguat kinerja.

Untuk lembaga, pendekatan “nol data” dapat menjadi perubahan untuk permainan, terutama di bidang khusus di mana data berkualitas tinggi jarang atau tidak ada. Huang menyoroti bahwa fitur utama R-Zero adalah kemampuannya untuk menghindari bagian yang paling mahal dan membutuhkan waktu lama untuk mengembangkan kecerdasan buatan: aktivasi data.

Dia mengatakan: “Pendekatan kami melebihi leher botol dasar karena harus menemukan kelompok data berkualitas tinggi, memberi nama dan mengklasifikasikannya.” “Ini tidak hanya terkait dengan skala untuk menghemat biaya; ini adalah jalan menuju menciptakan kecerdasan buatan yang dapat melampaui kemampuan manusia, karena tidak lagi terbatas dalam ruang lingkup pengetahuan atau data manusia.”

Namun, proses evolusi bersama juga mengungkapkan tantangan yang menentukan. Karena Challenger menghasilkan masalah yang lebih sulit, kemampuan Solver untuk menghasilkan jawaban “benar” yang andal melalui suara mayoritas mulai berkurang. Para peneliti menemukan bahwa keakuratan sebenarnya dari stiker yang dibuat sendiri ini menurun dari 79 % dalam pengulangan pertama menjadi 63 % di ketigaDibandingkan dengan Oracle LLM yang kuat seperti GPT -4. Penurunan kualitas data ini merupakan perbandingan utama dan sebotol kinerja jangka panjang yang mungkin.

Huang mengakui bahwa ini adalah masalah penting untuk model pengembangan diri. Dia mengatakan: “Pekerjaan kami adalah bukti konsep yang mengklarifikasi potensi pendekatan ini, tetapi kami mengakui bahwa mempertahankan peningkatan yang stabil dalam jangka panjang tanpa dataran tinggi adalah hambatan yang hebat.” “Memecahkan masalah ini akan menjadi langkah berikutnya yang menentukan bagi seluruh komunitas riset.”

Para peneliti juga menyoroti pembatasan utama bingkai: mekanisme saat ini adalah yang paling tepat untuk bidang seperti matematika di mana kesehatan dapat ditentukan secara objektif. Jadi, bagaimana model yang kuat ini dapat meluas ke lebih banyak tugas institusional seperti membuat versi pemasaran atau meringkas laporan?

Huang menyarankan bahwa rute potensial mencakup penambahan agen Amnesty International tingkat lanjut ke campuran: “expier” atau “kritikus”.

“Alih -alih evaluasi untuk jawaban” benar “yang sederhana, verifikasi ini akan dilatih untuk mengevaluasi kualitas solusi solusi berdasarkan kriteria yang lebih akurat,” jelasnya. “Dinamika evolusi bersama kemudian akan memasukkan penciptaan Callinger, solusi yang menghasilkan respons, dan verifikasi yang memberikan sinyal kualitas, dengan ketiga model meningkat bersama.”

Meskipun ini tetap menjadi arah untuk penelitian di masa depan, ini menunjukkan masa depan di mana sistem kecerdasan buatan sepenuhnya dikuasai dapat menguasai logika objektif, tetapi juga berpikir sendiri.


Tautan sumber
Continue Reading

Trending