Berita

Penelitian Nous Falls Hermes 4 AI Model yang melampaui chatgpt tanpa pembatasan konten

Published

on

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Pencarian nousMemulai kecerdasan buatan rahasia yang muncul sebagai suara perintis dalam gerakan kecerdasan buatan Hermes 4 Pada hari Senin, keluarga model bahasa besar yang diklaim perusahaan dengan kinerja sistem cadangan terkemuka dapat mencocokkan kontrol pengguna yang belum pernah terjadi sebelumnya dan pembatasan konten minimum.

Versi ini merupakan eskalasi besar dalam pertempuran antara pendukung AI open source dan perusahaan teknologi utama tentang siapa yang harus mengendalikan kemampuan kecerdasan buatan yang maju. Tidak seperti model dari OpenaiDan GoogleAtau priaHermes 4 dirancang untuk menanggapi hampir semua permintaan tanpa pegangan tangan yang telah menjadi standar dalam sistem kecerdasan buatan.

Nous Research mengumumkan di X (Twitter): “Hermes 4 tergantung pada warisan kami dari model pengguna dengan kemungkinan memperluas waktu tes.” “Perhatian khusus telah diberikan untuk membuat model kreatif dan menarik untuk berinteraksi dengan sensor, penyelarasan netral sambil mempertahankan keadaan matematika di tingkat teknis, pengkodean, dan pemikiran model berat terbuka.”

Bagaimana mengungguli “Hermes Thinking” di Hermes 4 atas chatgpt dan clade atas standar matematika

Hermes 4 Apa yang disebut penelitian nous “pemikiran hibrida”, yang memungkinkan pengguna untuk beralih antara respons cepat dan proses berpikir yang lebih dalam selangkah demi selangkah. Saat diaktifkan, model menghasilkan pemikiran internal mereka dalam bidang khusus Tanda -tanda sebelum memberikan jawaban akhir – mirip dengan model berpikir openai tetapi dengan transparansi penuh dalam proses berpikir tentang kecerdasan buatan.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Pencapaian teknis sangat bagus. Dalam Tes, model Bachelors Hermes 4 terbesar mencatat 405 miliar dari 96,3 % di Pengukuran Math-500 Dalam Mode Berpikir dan 81,9 % tentang Tantangan AIME’24 Kompetisi Matematika Kinerja yang bersaing atau melampaui banyak sistem properti yang harganya jutaan untuk dikembangkan.

“Tantangannya adalah membuat efek penggunaan berpikir Rohan Paul di xMenyoroti salah satu terobosan teknis dalam versi.

Mungkin yang paling menonjol, Hermes 4 Dia mencapai tingkat tertinggi dari semua model yang diuji pada “Refusalbench”, penelitian baru yang dibuat untuk mengukur berapa kali sistem kecerdasan buatan menolak untuk menjawab pertanyaan. Model ini mencatat 57,1 %dalam mode berpikir, sangat mengungguli GPT-4O (17,67 %) dan Clauds Sonnet 4 (17 %).

Nous Research’s Hermes 4 Model menjawab lebih banyak pertanyaan daripada persaingan sistem kecerdasan buatan, tes yang mengukur berapa kali formulir menolak untuk menanggapi permintaan pengguna. (Kredit: Penelitian Nous)

Di dalam Dataforge dan Atropos: Penetrasi Sistem Pelatihan Di Balik Kemampuan Hermes 4

Di balik kemampuan Hermes 4 terletak infrastruktur pelatihan lanjutan Pencarian nous Ini telah berkembang selama beberapa tahun. Model telah dilatih menggunakan dua sistem baru: DataforgeGenerator data industri berdasarkan grafik, dan AtropApi penguatan open source.

Dataforge Ini menciptakan data pelatihan melalui apa yang perusahaan gambarkan sebagai “aspek acak” melalui grafik terpandu, yang mengubah data pelatihan sederhana menjadi contoh -contoh instruksi kompleks tindak lanjut. Sistem, misalnya, dapat mengambil artikel Wikipedia dan mengubahnya menjadi lagu rap, kemudian membuat pertanyaan dan jawaban berdasarkan transformasi ini.

AtropSementara itu, ini bekerja seperti ratusan lingkungan pelatihan khusus di mana model kecerdasan buatan mempraktikkan keterampilan khusus – matematika, pengkodean, penggunaan alat, dan penulisan kreatif – hanya komentar saat memproduksi solusi yang benar. Pendekatan “sampel penolakan” memastikan bahwa hanya respons yang diverifikasi berkualitas tinggi yang membuatnya dalam data pelatihan.

“Nous lingkungan ini untuk membuat pengumpulan data untuk Hermes 4!” Menyusun Tommy ShunisiKapitalisme proyek di Delphi Ventures Yang diinvestasikan dalam penelitian nous. “Segala sesuatu dalam kumpulan data berisi 3,5 juta sampel berpikir dan 1,6 juta sampel yang tidak dispread! Hermes telah dilatih pada data RL, bukan hanya set pertanyaan dan jawaban data yang diperbaiki!”

Proses pelatihan membutuhkan 192 nvidia Unit Pemrosesan Grafik B200 Dan 71.616 jam GPU dari model terbesar – investasi akun penting tetapi secara belum pernah menjelaskan bagaimana teknologi khusus dapat bersaing dengan sejumlah besar raksasa teknologi.

Mengapa Penelitian Nous percaya bahwa pegangan tangan kecerdasan buatan “menjengkelkan seperti neraka” dan melukai inovasi

Pencarian nous Dia membangun reputasinya di atas filosofi yang menempatkan kontrol pengguna atas kebijakan konten perusahaan. Model perusahaan dirancang untuk “diarahkan”, yang berarti bahwa mereka dapat ditangkap atau dituntut untuk bertindak dengan cara tertentu tanpa batasan keamanan yang kuat yang menjadi ciri sistem kecerdasan buatan komersial.

“Hermes 4 tidak diatasi sebelum evakuasi tanggung jawab, aturan, kehati -hatian yang berlebihan yang mengganggu neraka dan menyakiti inovasi dan kemudahan penggunaan,” kata Shunisi di utas terperinci. “Jika sumbernya terbuka, tetapi menolak semua permintaan yang tidak berarti. Ini bukan masalah dengan Hermes 4.”

Dia mengambil pendekatan ini Pencarian nous Adalah umum di antara para peneliti dan pengembang yang menginginkan fleksibilitas maksimum, tetapi juga menempatkan perusahaan di pusat diskusi saat ini tentang integritas kecerdasan buatan dan konten moderat. Sementara model dapat digunakan secara teoritis untuk tujuan berbahaya, Nous Research berpendapat bahwa transparansi dan pengendali pengguna lebih disukai untuk mempertahankan gerbang perusahaan.

Perusahaan Laporan Teknis,, yang dirilis bersama model, memberikan rincian yang belum pernah terjadi sebelumnya tentang proses pelatihan, hasil evaluasi, dan bahkan output teks aktual dari tes standar. “Kami percaya bahwa laporan ini mendefinisikan standar baru untuk transparansi dalam pengukuran,” kata perusahaan itu.

Bagaimana startup kecil bersaing dengan 192 unit pemrosesan grafis dengan anggaran teknologi besar AI adalah miliaran dolar

Hermes 4Versi hadir dalam momen penting dalam industri kecerdasan buatan. Sementara perusahaan teknologi besar telah menuangkan miliaran dolar untuk mengembangkan sistem kecerdasan buatan yang semakin semakin meningkat, gerakan open source yang semakin meningkat berpendapat bahwa kemampuan ini tidak boleh dikendalikan oleh segelintir perusahaan.

Bulan -bulan terakhir telah menyaksikan perkembangan besar dalam kecerdasan buatan sumber terbuka, dengan model seperti meta LAMA 3.1Dan R1 DeepseekDan Ali Baba Qwen Seri pencapaian kinerja yang bersaing dengan sistem properti. Hermes 4 mewakili langkah lain dalam kemajuan ini, terutama di bidang pemikiran – karena kekuatan yang panjang untuk sistem tertutup O1 Openai.

“Pertama, Nous adalah startup yang mencakup lusinan orang yang sangat berbakat”, ” Catatan Shunisi. “Mereka tidak memiliki pengeluaran CAPEX tahunan senilai $ 100 miliar untuk membeli Paskah atau 1.000 karyawan, dan meskipun mereka terus meluncurkan model inovatif dan kecepatan gila.”

Startup, yang Pembiayaan $ 65 juta cepat Awal tahun ini memimpin modelDan itu dikembangkan JiwaSistem pelatihan terdistribusi yang bertujuan mengoordinasikan pelatihan kecerdasan buatan melalui komputer internet menggunakan teknologi blockchain.

Reformasi teknis yang mencegah Hermes 4 memikirkan episode yang tak ada habisnya

Satu Hermes 4Kontribusi teknis yang paling penting membahas model pemikiran: proses berpikir panjang yang berlebihan. Para peneliti telah menemukan bahwa model kredit mikro 14 miliar orang akan mencapai periode maksimum 60 % dari waktu ketika berpikir adalah, dan mereka terutama berhenti dalam episode pemikiran yang tak ada habisnya.

Solusi mereka menjamin fase pelatihan kedua yang mengajarkan model untuk berhenti berpikir tepat tentang 30.000 simbol, yang mengurangi generasi pelayaran sebesar 65-79 % sambil mempertahankan sebagian besar kinerja berpikir. Teknik “kontrol panjang” dapat menjadi berharga bagi komunitas penelitian kecerdasan buatan yang lebih luas.

“Model yang lebih kecil (<14b) cenderung berpikir tentang berpikir ketika disuling, tetapi model yang lebih besar melakukannya Muyu ada di xMenyoroti visi laporan teknis.

Tetapi, Hermes 4 Dia masih menghadapi batasan umum dalam model open source. Meskipun kinerja standar yang mengesankan, model membutuhkan sumber daya matematika yang besar untuk menjalankannya dan mungkin tidak bertepatan dengan kemudahan penggunaan atau keandalan layanan kecerdasan buatan untuk banyak aplikasi.

Di mana Hermes 4 mencoba dan berapa biayanya dibandingkan dengan chatgpt dan claud

Pencarian nous Saya telah membuat Hermes 4 Tersedia melalui beberapa saluran, yang mencerminkan filosofi open source. Bobot khas dapat diunduh secara bebas dalam menghadapi pelukan, sementara perusahaan juga menyediakan akses ke antarmuka pemrograman aplikasi melalui antarmuka obrolan yang telah direnovasi dan kemitraan dengan penyedia inferensi seperti chues, nebius dan luminal.

“Anda dapat mencoba Hermes 4 dalam antarmuka pengguna Nous Nous yang baru terbarukan,” perusahaan mengumumkan, menyoroti fitur -fitur seperti reaksi paralel dan sistem memori.

Untuk pengguna dan peneliti lembaga, model tersebut mewakili alternatif yang menarik dan potensial untuk membayar akses API ke sistem properti, terutama untuk aplikasi yang membutuhkan kustomisasi tingkat tinggi atau berurusan dengan konten sensitif.

Gambaran terbesar: Apa arti Hermes 4 untuk masa depan pengembangan kecerdasan buatan

melepaskan Hermes 4 Lebih dari sekadar meluncurkan model AI lain – ini adalah pernyataan tentang siapa yang harus mengendalikan masa depan kecerdasan buatan. Dalam industri yang semakin didominasi segelintir raksasa teknologi dengan sumber daya yang hampir tidak terbatas, penelitian Nous telah membuktikan bahwa inovasi masih bisa datang dari tempat yang tidak terduga.

Pendekatan perusahaan menimbulkan pertanyaan dasar tentang perbedaan antara keselamatan dan kemampuan, antara kontrol perusahaan dan kebebasan pengguna. Sementara perusahaan teknologi besar berpendapat bahwa konten moderat dan studi keselamatan yang akurat diperlukan untuk menyebarkan kecerdasan buatan yang bertanggung jawab, penelitian Nous mengklaim bahwa transparansi dan agen pengguna lebih penting daripada pembatasan yang dikenakan pada perusahaan.

Apakah filosofi ini pada akhirnya akan terbukti bermanfaat atau bermasalah yang harus kita lihat. Tetapi ada satu hal tertentu: Hermes 4 telah menunjukkan bahwa masa depan kecerdasan buatan tidak akan ditentukan hanya oleh perusahaan yang memiliki kantong terdalam.

Di bidang di mana barang -barang mustahil kemarin menjadi barang, penelitian nous telah membuktikan bahwa satu -satunya hal paling berbahaya dari kecerdasan buatan yang mengatakan tidak dapat siap untuk mengatakan ya.


Tautan sumber

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Trending

Exit mobile version