Connect with us

Berita

Nvidia terbuka nemotron-nano-9b-v2 dapat beralih/berhenti berpikir

Published

on

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Model kecil melewati sesaat. Setelah penerbitan model bentuk kecerdasan buatan baru Cukup kecil untuk menyesuaikan jam tangan pintar Dari MIT Spin -off Liquid AI, model kecil yang cukup untuk dijalankan di smartphone Google, Nvidia bergabung dengan pesta hari ini dengan Model Bahasa Kecil Baru (SLM) Sendiri, Nemotron-nano-9b-v2,, yang mencapai kinerja tertinggi di kelasnya tentang kriteria spesifik dan datang dengan kemampuan pengguna untuk mengubah dan menghentikan “berpikir”, yaitu melindungi diri sebelum mengambil jawaban.

Sedangkan parameternya 9 miliar lebih besar dari beberapa parameter yang mencakup jutaan model kecil yang dicakup oleh VentureBeat baru -baru iniNvidia mencatat bahwa itu adalah pengurangan yang berarti dalam ukuran aslinya 12 miliar guru Dan dirancang agar sesuai Unit Pemrosesan Grafis NVIDIA A10.

Sebagai Oleksii Kuchiaev, manajer NVIDIA dari AI Model setelah pelatihan, Katanya di x Menanggapi pertanyaan yang disajikannya kepadanya: “12b hingga 9b telah dipangkas agar sesuai dengan A10 secara khusus, yang merupakan pilihan GPU umum untuk publikasi. Ini juga merupakan model campuran yang memungkinkannya untuk memproses ukuran batch yang lebih besar dan hingga 6x lebih cepat dari model transformator yang sama. “

Untuk konteks, banyak LLM terkemuka dalam kisaran 70+ miliar parameter (parameter panggilan merujuk pada pengaturan internal yang mengatur bentuk model, dengan umumnya menunjukkan model yang lebih besar dan lebih mampu).


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan penundaan dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Model ini mengambil berbagai bahasa, termasuk bahasa Inggris, Jerman, Spanyol, Prancis, Italia, Jepang dan dalam deskripsi yang diperpanjang, Korea, Portugis, Rusia, dan Cina. Itu cocok untuk mereka berdua Instruksi berikut dan pembuatan kode.

Nemotron-nano-9b-v2 Dan Set data sebelum pelatihan Sekarang tersedia dalam menghadapi pelukan dan melalui katalog perusahaan.

Integrasi struktur transformator dan mamba

Itu tergantung pada Nemotron-HModel pengiriman uang hibrida Mamba yang merupakan dasar untuk penawaran terbaru perusahaan.

Sementara LLM yang paling populer adalah model “adaptor” murni, yang sepenuhnya tergantung pada lapisan perhatian, mereka bisa menjadi mahal dalam memori dan akun dengan pertumbuhan panjang urutan.

Sebaliknya, model Nemotron-H dan lainnya menggunakan Struktur mamba yang dikembangkan oleh para peneliti Di Universitas Carnegie Mellon dan Bruneston juga Menenun dalam model ruang status selektif (atau SSM), yang dapat menangani urutan informasi yang sangat panjang di dalam dan di luar situasi.

Lapisan -lapisan ini meluas sejalan dengan panjang urutan dan dapat mengatasi konteks untuk periode yang lebih lama dari kepentingan diri sendiri tanpa memori yang sama dan menghitung pengeluaran publik.

AYbrid mamba mengurangi biaya ini dengan mengganti sebagian besar perhatian dengan lapisan area linier, dan mencapai produksi hingga 2-3 x lebih tinggi pada konteks panjang Akurasi serupa.

Laboratorium kecerdasan buatan lainnya, seperti NVIDIA, seperti AI2, juga telah merilis model berdasarkan Mamba.

Beralih/berpikir menggunakan bahasa

Nemotron-Nano-9b-V2 ditempatkan sebagai model yang seragam, hanya obrolan dan logika yang dilatih dari awal.

itu Pengaturan default sistem untuk membuat trek berpikir sebelum memberikan jawaban akhir, meskipun pengguna dapat mengubah perilaku ini Dengan kode kontrol sederhana seperti /berpikir atau /no_tkink.

Modelnya juga sayaNTRDUCES Manajemen Waktu Operasi “Anggaran Berpikir”setiap Pengembang mengizinkan jumlah simbol ini Saya dikhususkan untuk pemikiran internal sebelum formulir melengkapi respons.

Mekanisme ini bertujuan untuk menyeimbangkan akurasi dengan jintan, Terutama dalam aplikasi seperti dukungan pelanggan atau agen independen.

Standar menceritakan kisah yang menjanjikan

Hasil evaluasi menjelaskan akurasi kompetitif terhadap model terbuka lainnya dalam skala kecil. Itu diuji dalam mode “berpikir” menggunakan suite nemo-skills, Nemotron-Nano-9b-V2 mencapai 72,1 persen di AIME25Dan 97,8 persen di Math500, 64,0 persen di GPQADan 71,1 persen di LiveCodebench.

Gelar telah dilaporkan pada instruksi berikut dan standar konteks panjang: 90,3 persen pada Ifeval, 78,9 persen dalam tes 128kKeuntungan yang lebih kecil tetapi terukur pada standar BFCL V3 dan HLE.

Di semua daerah, Nano-9b-V2 menunjukkan resolusi yang lebih tinggi dari QWEN3-8B, Titik umum untuk perbandingan.

NVIDIA menjelaskan hasil ini dengan kurva akurasi terhadap anggaran yang menunjukkan bagaimana standar kinerja meningkat dengan peningkatan simbol pemikiran yang khas. Perusahaan menyarankan bahwa kontrol anggaran yang tepat dapat membantu pengembang untuk meningkatkan kualitas dan jintan dalam kasus produksi.

Pelatihan Koleksi Data Buatan

Baik keluarga Nano dan Nemotron-H bergantung pada campuran data pelatihan dan sumber yang terkoordinasi di web dan buatan.

Perusahaan ini mencakup teks umum, simbol, matematika, sains, dokumen hukum dan keuangan, serta kelompok data kemahiran yang mirip dengan penyelarasan.

NVIDIA mengkonfirmasi penggunaan efek berpikir buatan yang disebabkan oleh model besar lainnya untuk meningkatkan kinerja pada standar yang kompleks.

Lisensi dan Penggunaan Komersial

Nano-9b-V2 dirilis di bawah ini Perjanjian Lisensi Formulir Terbuka NVIDIAPembaruan terakhir pada Juni 2025.

Lisensi ini dirancang agar mudah dan ramah kepada institusi. Nvidia secara tegas menyatakan bahwa model tersebut Secara komersial Di luar kotakDan itu Pengembang bebas untuk membuat dan mendistribusikan model.

Lebih penting lagi, NVIDIA tidak mengklaim kepemilikan output apa pun yang dibuat oleh formulir, yang meninggalkan tanggung jawab dan hak dengan pengembang atau lembaga yang ia gunakan.

Adapun pengembang organisasi, ini berarti bahwa model dalam produksi dapat ditempatkan segera tanpa menegosiasikan lisensi komersial terpisah atau membayar biaya terkait dengan ambang batas penggunaan atau tingkat pendapatan atau sensus pengguna. Tidak ada barang yang memerlukan lisensi berbayar begitu perusahaan mencapai kisaran tertentu, tidak seperti beberapa lisensi terbuka bertahap yang digunakan oleh penyedia layanan lain.

Namun, perjanjian tersebut mencakup banyak kondisi yang harus diperhatikan oleh lembaga:

  • Pegangan tanganPengguna tidak dapat mengatasi atau mengganggu mekanisme keselamatan terintegrasi (disebut sebagai “pegangan tangan”) tanpa menerapkan alternatif serupa yang cocok untuk menerbitkannya.
  • redistribusi: Setiap redistribusi model atau derivatif harus menyertakan lisensi model Open NVIDIA (“dilisensikan oleh NVIDIA Corporation di bawah NVIDIA Open Model”).
  • kepatuhanPengguna harus mematuhi peraturan dan pembatasan komersial (misalnya, undang -undang ekspor Amerika).
  • Kondisi kecerdasan buatan yang layak dipercayaMenggunakan harus konsisten dengan instruksi penasihat yang layak dipercaya pada NVIDIA, yang mencakup pertimbangan penerbitan yang bertanggung jawab dan moral.
  • Persyaratan untuk litigasi: Jika pengguna memulai hak cipta atau litigasi dalam paten terhadap entitas lain yang mengklaim akan dilanggar oleh model, maka lisensi berakhir secara otomatis.

Kondisi ini fokus pada penggunaan hukum dan bertanggung jawab alih -alih ruang lingkup komersial. Lembaga tidak perlu meminta izin tambahan atau membayar royalti ke NVIDIA hanya untuk membangun produk, mencairkannya, atau membatasi basis pengguna. Sebaliknya, mereka harus memastikan bahwa praktik penerbitan menghormati keamanan, dukungan dan kewajiban kepatuhan.

GPS di pasar

Dengan Nemotron-Nano-9B-V2, NVIDIA menargetkan pengembang yang membutuhkan keseimbangan antara kemampuan berpikir dan mempublikasikan efisiensi pada langkah-langkah yang lebih kecil.

Fitur kontrol dari anggaran waktu operasi dan fitur logika bertujuan untuk memberi pembangun sistem lebih banyak fleksibilitas dalam mengelola akurasi terhadap kecepatan respons.

Peluncuran pelukan wajah mereka dan cokelat nafidia yang khas menunjukkan bahwa mereka Seharusnya tersedia secara luas untuk pengalaman dan integrasi.

Versi NVIDIA NANO-9 V2 menunjukkan fokus konstan pada efisiensi dan pemikiran yang dapat dikontrol dalam model bahasa.

Dengan menggabungkan struktur hibrida dengan tekanan baru dan teknik pelatihanPerusahaan menyediakan alat pengembang yang berupaya mempertahankan akurasi sambil mengurangi biaya dan jintan.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Trump mengubah posisi Ukraina setelah pertemuan Putin, kesepakatan damai yang lama

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Saya bersama Presiden Trump: “Tidak ada kesepakatan sampai ada kesepakatan.”

Sekarang dia mengubah posisinya dan berpisah di depan umum dengan Vladimir Putin, terlepas dari keberatan yang parah dari Volodimir Zellinsky, yang mengunjungi Gedung Putih kemarin, tampaknya kesepakatan itu agak jauh.

Minat Putin ditekankan oleh perdamaian melalui pembomannya yang terus -menerus ke Ukraina, dan negara yang ia invasi secara ilegal, dengan putaran terakhir membunuh 10 orang. Ini berarti bahwa diktator Kremlin tidak memiliki minat dalam perdamaian, kecuali untuk kondisi maksimumnya.

Dengar, saya meraung untuk Trump. Jika dia dapat menutupi lingkaran perang brutal dan berdarah ini dalam beberapa hal, segalanya berakhir, itu akan pantas mendapatkan hadiah Nobel Perdamaian. Hillary mengatakan dia mencalonkannya.

Inilah “perbedaan terbesar” antara dua kunjungan ke Gedung Putih Zelenskyy

Tetapi ulasan negatif dari Alaska Sitdown telah mengatur Trump dan mendorongnya untuk keluar dalam berita palsu tentang kebenaran sosial:

“Jika kita memiliki KTT di tempat lain, Demokrat akan menjalankan subjek media untuk dikendalikan, dia mengatakan apa hal yang mengerikan. Orang -orang ini sakit!”

Yah, dia tidak suka pers. Namun, kita sekarang tahu, berkat komentarnya di pesawat di Brett Bayer dari Fox, yang dia nikmati berputar dan menyerupainya dengan permainan golf. Semua koresponden mencoba membuatnya membuat kesalahan. Jika dia tidak membuat berita mendesak, menang. Jika dia mengatakan sesuatu adalah berita yang mendesak, dia tidak memasukkan bola ke dalam lubang dan mereka mendapatkannya.

Presiden Ukraina Foludmir Zelinski berbicara dengan penyiar Fox News Brett Bayer di sebuah rumah sakit di Kharkiv setelah kunjungannya ke tentara yang terluka dan memberi mereka medali untuk melayani mereka. (Laporan Khusus dengan Brett Bayer)

Pada hari Minggu pagi, saya menyaksikan, sementara Zelinski dan pejabat senior Eropa mengatakan bahwa Rusia hanya yang bisa mengakhiri perang dan bahwa Ukraina tidak akan menyerah pada wilayah Donbas, rumah bagi lebih dari 200.000 orang.

Jenderal Wesley Clark juga memberi tahu saya tentang “Buzz Media”, begitu wilayah Donbas berakhir, itu adalah “tembakan lurus” bagi Kev, dan oleh karena itu Ukraina yang berani, yang dihentikan di mesin perang Rusia terbesar, tidak akan dieksploitasi.

Ini adalah penggemar moderat bahwa media melaporkan bahwa Putin menerima perlunya pasukan keamanan untuk melindungi Ukraina, yang berarti bahwa orang Eropa – dan Amerika Serikat – akan mengirim pasukan ke unit penjaga perdamaian.

Ketika utusan Steve Witkeov, yang berada di ruangan itu selama sesi Putin, ditanya tentang perubahan Trump dalam posisinya, saya pikir dia akan menyangkalnya, tetapi dia tidak melakukannya. Ini menegaskan bahwa ceritanya benar, dan tentu saja kompleksitas masalah.

Trump hancur dengan pemimpin Eropa selama Ukraina berbicara tentang langkah besar untuk perdamaian

Kanselir Jerman Friedrich Mirz mengatakan selama akhir pekan bahwa Trump mengatakan bahwa gencatan senjata adalah prioritas terpenting dan prioritas tertinggi. Karena itu, ada permintaan umum, yang tidak terjadi sekarang. Kami sudah berharap akan ada gencatan senjata terlebih dahulu. Jelas bahwa pihak Rusia tidak siap untuk melakukannya. “

Jadi apa sebenarnya yang diserahkan Putin? Tidak ada, sebanyak yang saya bisa lihat. Setiap hari tanpa gencatan senjata adalah hari lain ketika penjahat perang itu mendapatkan keuntungan medan perangnya.

Dalam keadaan ini, Trump mengharapkan presiden Ukraina untuk bergabung dengan rapat tiga dengannya dan Putin?

Menanggapi Peter Duusi dari Fox, Trump mengatakan: “Saya pikir jika semuanya bekerja dengan baik hari ini, kita akan mendapatkan trilogi dan saya pikir akan ada kesempatan yang masuk akal untuk mengakhiri perang ketika kita melakukannya.”

Trump bertemu dengan Zelinski dan para pemimpin Eropa lainnya

Presiden AS Donald Trump bertemu dengan Presiden Ukraina Voludmir Zelinski, Kanselir Jerman Friedrich Mirz, Presiden Prancis Emmanuel Macron, dan Perdana Menteri Italia Georgia meloni di tengah negosiasi untuk mengakhiri Perang Rusia di Ukraina, di Gedung Putih di Washington, Amerika Serikat, 18 Agustus 2025. (Reuters/Alexander Drago)

Zelenskyy, yang memuji Trump berulang kali – dia tidak melakukan kesalahan yang sama dua kali setelah dikeluarkan dari Gedung Putih setelah keruntuhannya pada bulan Februari – wartawan “kita hidup, setiap hari, serangan. Seperti yang Anda tahu, hari ini banyak serangan dan banyak orang yang terluka. Anak itu mati, satu kecil, dan setengah setengah.

“Jadi kita perlu menghentikan perang ini, untuk menghentikan Rusia. Kita perlu mendukung mitra Amerika dan Eropa yang akan melakukan yang terbaik, jadi, dan saya pikir kita melihat bahwa kita adalah orang -orang yang kuat dan mendukung kita gagasan rezim karyawan United, Presiden Trump untuk menghentikan perang ini, untuk melakukan metode diplomatik untuk mengakhiri perang ini. Kami siap untuk ketiganya sebagai siswa.” “” “” “”

Kembali dari Alaska, Trump memulai minggu ini dengan percakapan yang menentukan kebijakan luar negeri tentang Perang Ukraina

Sekarang kejutan saya. Dia siap duduk dengan Putin dan Trump setelah bersikeras gencatan senjata pertama-ketika juga posisi presiden sampai dia mengubahnya dan meninggalkannya setelah kejahatan dengan perang yang dituduh perang?

Jadi apa suasana hati setelah itu?

Trump mengatakan: “Saya optimis bahwa kita dapat mencapai kesepakatan yang akan menghalangi agresi masa depan terhadap Ukraina,” kata Trump. Dia menambahkan: “Saya merasa Anda dan Presiden Putin akan mengerjakan sesuatu.”

Donald Trump bertemu dengan para pemimpin Eropa di Gedung Putih

Presiden Donald Trump, Presiden Ukraina Folodimir Zellinski, Kanselir Jerman Friedrich Mirz, Presiden Prancis Emmanuel Macron, Perdana Menteri Inggris Kerr Star, Perdana Menteri Italia Georgia Meloni, Presiden Finlandia Alexander Stop, dan Sekretaris Jenderal Baru Mark Rotola Ursula von Deir Deir Biz. Sebuah rumah di Washington, 18 Agustus 2025. (Alexander Drago/Reuters)

Zelenskyy “memuji pertemuan konstruksi yang ditentukan,” menambahkan: “Ada banyak orang di penjara. Jadi kita perlu kembali dan menjamin itu akan bekerja selama bertahun -tahun. Kami membicarakannya dan presiden menunjukkan banyak rincian di medan perang, di peta.”

Tetapi akankah Putin, yang memandang Zelinski sebagai pemimpin ilegal?

Semua bergosip di sekitar karpet merah dan suasana bermakna lainnya. Ya, Zelinski mengenakan jas, meskipun dalam gaya militer.

Kita semua harus menjadi rooting Trump. Bahkan jika itu singkat, perang berlanjut, ia hanya bisa berakhir dengan penyelesaian negosiasi.

Klik di sini untuk mendapatkan aplikasi Fox News

Pada titik tertentu, Trump berpisah dari sesi dan memanggil Putin, bukannya menunggu bahkan setelah itu.

Trump telah menerbitkan bahwa ini adalah “langkah yang sangat baik”, dan kata logis mungkin lebih awal. Perang pasti bisa berlanjut. Tapi itu tidak bisa berakhir di medan perang. Kami belum mencapai titik ini tanpa preferensi unik Trump untuk percakapan pemimpin kepada pemimpin, meskipun sekarang secara publik dipisahkan dengan Vladimir Putin. Terkadang hasilnya hasil dan terkadang tidak terjadi, seperti halnya dengan Kim Jong Un. Tapi dia memberinya – dan kami memiliki tembakan.

Tautan sumber

Continue Reading

Berita

GEPA meningkatkan LLM tanpa belajar yang ditugaskan untuk meningkatkan

Published

on

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Peneliti dari University of California, BerkeleyDan Universitas Stanford Dan Databricks Saya telah menyajikan cara baru untuk meningkatkan kecerdasan buatan yang disebut terobosan Ini sangat mengungguli teknik pembelajaran penguatan tradisional (RL) untuk mengadaptasi model bahasa besar (LLM) untuk tugas -tugas khusus.

GEPA menghilangkan model populer untuk belajar melalui ribuan upaya untuk bereksperimen dan kesalahan yang dipandu oleh nilai numerik sederhana. Sebaliknya, pemahaman bahasa LLM digunakan untuk memikirkan kinerjanya, mendiagnosis kesalahan dan mengembangkan instruksinya. Selain lebih akurat daripada di tempat, GEPA secara signifikan lebih efisien, mencapai hasil super dengan kurang dari 35 kali.

Untuk perusahaan yang membangun agen dan biografi kerja yang kompleks, ini diterjemahkan langsung ke dalam kursus pengembangan yang lebih cepat, biaya matematika yang jauh lebih rendah, dan aplikasi yang lebih andal.

Biaya tinggi untuk meningkatkan sistem kecerdasan buatan modern

Aplikasi AI untuk lembaga modern jarang satu panggilan ke LLM. Seringkali “Sistem AI Kendaraan”, alur kerja kompleks yang melakukan beberapa seri LLM, alat eksternal seperti basis data atau penerjemah yang diterjemahkan dalam instruksi perangkat lunak, dan logika untuk melakukan tugas -tugas lanjutan, termasuk penelitian multi -step dan analisis data.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan penundaan dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Ada cara umum untuk meningkatkan sistem ini adalah melalui metode pembelajaran penguatanSeperti kebijakan relatif grup (GRPO), teknik yang digunakan dalam model pemikiran umum, termasuk Deepsek-R1. Metode ini diperlakukan sebagai kotak hitam; Ini menjalankan tugas, mendapatkan skala sukses sederhana (“hadiah standar”, seperti 7/10 derajat), dan menggunakan komentar ini untuk secara perlahan mendorong parameter model ke arah yang benar.

Kerugian utama RL adalah inefisiensi sampel. Untuk belajar secara efektif dari gelar numerik yang terpisah ini, metode RL sering membutuhkan puluhan ribu, atau bahkan ratusan ribu, dari percobaan, yang dikenal sebagai “pengguliran”. Untuk aplikasi lembaga apa pun di dunia nyata yang mencakup panggilan alat mahal (misalnya, informasi API, perakitan kode) atau menggunakan model kepemilikan yang kuat, proses ini lambat dan mahal.

Seperti yang diceritakan kepada Lakshya A Agrawal, rekan penulis kertas dan mahasiswa PhD di University of California, Berkeley, VentureBeat, kompleksitas ini merupakan hambatan besar bagi banyak perusahaan. Agrouwal mengatakan: “Untuk banyak perbedaan, RL tidak praktis karena pendekatan biaya dan kompleksitasnya sejauh ini adalah rekayasa tangan yang cepat.” Dia menunjukkan bahwa GEPA dirancang untuk tim yang perlu meningkatkan sistem yang dibangun pada model atas yang tidak dapat sering dikendalikan, memungkinkan mereka untuk meningkatkan kinerja tanpa mengelola grup GPU khusus.

Para peneliti membingkai tantangan ini sebagai berikut: “Bagaimana kita dapat mengekstraksi sinyal pembelajaran maksimum dari setiap penawaran mahal untuk memungkinkan adaptasi efektif sistem kecerdasan buatan yang canggih dalam pengaturan yang rendah atau anggaran?”

Belajar dengan baik dalam bahasa

Gepa: Arxiv

GEPA (Genetic-Pareto) adalah peningkatan cepat yang menangani tantangan ini dengan mengganti imbalan sporadis dengan komentar bahasa yang kaya dan alami. Ini meningkatkan fakta bahwa implementasi penuh dari sistem kecerdasan buatan (termasuk langkah -langkah pemikiran, panggilan alat, dan bahkan pesan kesalahan) dapat diurutkan dalam teks yang dapat dibaca dan dipahami oleh LLM. Metodologi GEPA didasarkan pada tiga kolom dasar.

Yang pertama adalah “pengembangan terarah genetik”, di mana GEPA memperlakukan serangkaian klaim seperti gen. Ini “berbalik” berulang kali untuk membuat versi baru yang lebih baik. Mutasi ini adalah proses pintar yang didorong oleh kolom kedua: “Refleksi dengan reaksi linguistik alami.” Setelah beberapa operan, GEPA LLM memberikan implementasi penuh (apa yang coba dilakukan oleh sistem) dan hasilnya (apa yang terjadi dengan benar atau salah). Kemudian “LLM” mencerminkan komentar ini dalam bahasa alami untuk mendiagnosis masalah dan menulis gelombang yang lebih baik dan lebih rinci. Misalnya, alih -alih hanya melihat tingkat rendah dalam misi pembuatan kode, itu dapat menganalisis kesalahan dalam kode dan menyimpulkan klaim untuk menentukan penerbitan perpustakaan tertentu.

Kolom ketiga adalah “Pilihan Berbasis Parito”, yang menjamin eksplorasi cerdas. Alih -alih hanya berfokus pada router yang berkinerja terbaik, yang dapat menyebabkan tersandung dalam solusi optimal (optimal lokal “, GEPA mempertahankan berbagai klaim” khusus “. Ini melacak apa yang menuntut kinerja yang lebih baik pada berbagai contoh individu, dan membuat daftar yang lebih baik. Dengan mengambil solusi yang lebih baik. Dengan mengambil sampel dari berbagai koleksi strategi kemenangan ini, Gepa jaminan yang membuat ini menjamin bahwa GEPA itu menjamin hal itu. input.

Pilihan kandidat terbaik (kiri) dapat menyebabkan model tersandung minimum lokal sambil memilih Paareo (kanan) dapat mengeksplorasi lebih banyak opsi dan menemukan solusi optimal. Sumber: Arxiv

Efektivitas seluruh proses ini tergantung pada apa yang oleh peneliti disebut “rekayasa pengaliran counter”. Agrawal menjelaskan bahwa kuncinya adalah permukaan rincian teks yang kaya yang sudah diproduksi oleh sistem tetapi sering diabaikan. Dia mengatakan: “Jalur saluran tradisional sering mengurangi detail ini menjadi satu hadiah numerik, yang menghalangi penyebab hasil tertentu.” “Arah penting GEPA adalah untuk mengatur reaksi yang hanya memperluas hasil tetapi juga jalur dan kesalahan medium dalam teks normal – bukti yang sama yang digunakan seseorang untuk mendiagnosis perilaku sistem.”

Misalnya, untuk sistem pengambilan dokumen, ini berarti memasukkan dalam dokumen daftar yang dipulihkan dan dilewatkan dengan benar, alih -alih menghitung hasil akhir.

Gepa di tempat kerja

Para peneliti mengevaluasi GEPA di empat tugas yang beragam, termasuk jawaban atas hotpotqa dan informasi yang mempertahankan privasi (pupa). Mereka menggunakan kedua model open source (QWEN3 8B), kepemilikan (GPT-4.1 Mini), dan perbandingan GEPA dengan GRPO berbasis RL dan peningkatan klaim MIPROV2 modern.

Di semua tugas, GEPA telah sangat mengungguli GRPO, mencapai tingkat tinggi hingga 19 % dengan penggunaan hingga 35 kali. Dia menjelaskan bahwa Agrawal memberikan contoh nyata dari gain efisiensi ini: “Kami menggunakan GEPA untuk meningkatkan sistem QA dalam waktu sekitar 3 jam melawan 24 jam GRPO – penurunan 8x pada saat pengembangan, dengan kinerja 20 % lebih tinggi juga.” “Biaya peningkatan berbasis RL untuk skenario yang sama dalam tes kami adalah sekitar $ 300 pada saat GPU, sementara GEPA harganya kurang dari $ 20 untuk hasil yang lebih baik-15x penghematan dalam pengalaman kami.”

GEPA melampaui garis dasar lainnya pada standar utama Sumber: Arxiv

Selain kinerja mentah, para peneliti menemukan bahwa sistem GEPA yang lebih baik lebih dapat diandalkan ketika menghadapi data yang tidak terlihat baru. Ini diukur dengan “celah melingkar” (perbedaan antara kinerja dalam data pelatihan dan data uji akhir). Agrawal mengasumsikan bahwa ini karena GEPA belajar dari reaksi terkaya. Dia mengatakan: “Kesenjangan generalisasi yang lebih kecil di GEPA mungkin berasal dari penggunaan reaksi yang kaya dalam bahasa alami di setiap hasil yang telah berhasil, dan apa yang gagal, dan mengapa-dari hanya mengandalkan bonus numerik.” “Sistem ini dapat mendorong pengembangan instruksi dan strategi berdasarkan pemahaman yang lebih luas tentang keberhasilan, bukan hanya pola belajar untuk data pelatihan.” Untuk institusi, keandalan yang ditingkatkan ini berarti aplikasi kecerdasan buatan yang kurang rapuh dan lebih mudah beradaptasi dengan peran yang dihadapi pelanggan.

Salah satu manfaat praktis utama adalah bahwa klaim GEPA berdasarkan instruksi hingga 9,2 kali klaim optimal seperti MIPROV2, yang mencakup banyak contoh yang lebih sedikit. Klaim Luxor mengurangi waktu kedatangan dan mengurangi biaya model API. Ini membuat aplikasi akhir lebih cepat dan lebih murah untuk dijalankan dalam produksi.

Makalah ini juga memberikan hasil yang menjanjikan untuk penggunaan GEPA sebagai strategi penelitian “waktu penalaran”, yang mengubah kecerdasan buatan dari satu generator yang menjawab untuk memecahkan masalah berulang. Agrawal adalah skenario di mana GEPA dapat digabungkan ke dalam pipa CI/CD perusahaan. Ketika kode baru dilakukan, GEPA dapat membuat beberapa versi yang ditingkatkan dan secara otomatis memperbaikinya, mengujinya untuk kinerja, buka permintaan penarikan dengan variabel kinerja terbaik untuk insinyur untuk ditinjau. “Ini mengubah peningkatan menjadi proses yang berkelanjutan dan mekanis-generasi solusi yang sering bertepatan atau melebihi penyempurnaan ahli manual,” kata Agrawal. Dalam pengalaman mereka untuk menghasilkan CUDA, pendekatan ini telah memperkuat 20 % dari tugas ke tingkat ahli, dibandingkan dengan 0 % untuk mencoba satu bidikan GPT-4O.

Para penulis makalah percaya bahwa GEPA adalah langkah penting menuju model baru untuk mengembangkan kecerdasan buatan. Tetapi selain menciptakan lebih banyak kecerdasan buatan, efeknya yang paling mendesak pada mereka yang mendapatkan sistem kinerja tinggi mungkin.

“Kami berharap GEPA memungkinkan transformasi positif dalam membangun sistem kecerdasan buatan-yang membuat peningkatan sistem yang dapat dilakukan oleh pengguna akhir, yang sering memiliki pengalaman lapangan terkait tugas, tetapi tidak harus waktu dan kemauan untuk mempelajari rincian RL yang kompleks,” kata Agrawal. “Ini memberi energi langsung kepada para pemangku kepentingan dengan pengetahuan bidang tugas tertentu.”


Tautan sumber
Continue Reading

Berita

Kepala Kepolisian Seattle dikatakan makan di dekatnya sambil mencuri perhiasan untuk dua juta dolar

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Menurut apa yang dilaporkan, kepala Departemen Kepolisian Seattle jauh dari toko perhiasan ketika ia dipindahkan di siang hari bolong pada hari Kamis, ketika pencuri keluar dengan perkiraan jumlah berlian $ 2 juta, emas dan kebanggaan.

Pada hari itu, empat pencuri yang meyakinkan melakukan pencurian dalam perhiasan Menashe & Sons di Seattle Barat, mengancam karyawan dengan penyemprotan beruang dan senapan Thunderbolt setelah memecahkan pintu depan kaca yang tertutup dengan palu dan mencuri segala sesuatu dari enam kotak lebar di toko.

Tetapi dengan pencurian perhiasan, kepala polisi Seattle Ceann Barnes akan pergi yogurt. Jason Rantz Penawaran di Seattle Reed 770 AM.

Seorang juru bicara Departemen Kepolisian Seattle dikonfirmasi Jason Rantz Dia menunjukkan bahwa presiden sudah dekat, tetapi dia tidak bisa mengatakan dengan tepat di mana itu adalah waktu pencurian.

Pencuri yang malang menarik pencurian tengah hari di toko perhiasan Seattle dalam waktu kurang dari dua menit

Empat pencuri persuasif menyiapkan perampokan kasar di toko perhiasan di Seattle Barat, meninggalkan berlian dan jam tangan emas dan mewah dalam waktu kurang dari dua menit. (Menashe Sons & Jeweles)

“Dia adalah presiden Barnes dan rincian keamanannya di perusahaan terdekat ketika pencurian itu terjadi,” kata juru bicara itu. “Mereka berada di dalam pekerjaan dan tidak mengetahui kejahatan yang terungkap.

Juru bicara itu menambahkan: “Para tersangka ada di dalam dan di luar toko perhiasan dalam 90 detik.” “Detail keamanannya berada dalam pakaian yang jelas pada saat pencurian.”

Juru bicara departemen juga mengatakan Penawaran Radio Presiden dan rinciannya menjadi sadar akan pencurian setelah kendaraan polisi menanggapi lampu dan peringatan ke tempat kejadian.

Polisi California NAB 7 Warga Negara Asing Dalam Mencuri Toko Perhiasan, 1 Tersangka masih longgar

Pencuri menyerbu toko saat memantau

Kepala Kepolisian Seattle of Seattle Parins dikatakan makan siang di sebuah restoran, Yarawat, Yaradat, ketika permata itu dicuri. (Menashe Sons & Jeweles)

Polisi mengatakan pencuri membuka kasus dengan kalung zamrud senilai $ 125.000 dan sebuah kasus yang berisi sekitar 750.000 dolar jam Rolex.

“Kami terguncang sebagai karyawan,” kata Josh Minash, wakil kepala keluarga keluarga, mengatakan pada hari Jumat. “Kami akan tutup sebentar.”

Matthew Street, direktur Jim terdekat untuk Fastrious, Fox 13 di Seattle bahwa staf toko perhiasan telah melarikan diri dari belakang dan pergi ke gym meminta bantuan.

Rumah rumah Seattle Macklemore bersama anak -anak di dalam; Seorang pendidik berkelahi dengan penyerang yang mencuri perhiasan

Minash Children and Jewelry Construction

Kepala polisi tidak tahu bahwa pencurian itu terjadi sampai dia dan rincian keamanannya diperhatikan oleh mobil polisi dengan lampu dan alarm, menurut laporan Jason Rantz. (Google Maps)

Dia menambahkan bahwa ada “banyak kejutan dan kejutan” karena pencurian, yang menyebabkan kunci gym pintu sampai polisi tiba.

Para tersangka melarikan diri dari penyelundup sebelum polisi tiba di belakang. Penangkapan belum dilakukan.

Tidak ada yang terluka selama pencurian.

Klik di sini untuk mendapatkan aplikasi Fox News

Polisi Seattle mengharuskan siapa pun dengan informasi kontak dengan 206-23-5000.

Brie Stimson dari Fox News Digital berkontribusi pada laporan ini.

Tautan sumber

Continue Reading

Trending