Berita
S3: Bingkai kain baru yang melatih agen penelitian dengan data minimal

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut
Peneliti di Illinois Urbana Champin Disajikan S3Kerangka kerja open source yang dirancang untuk membuat kain (kain) lebih efisien daripada metode saat ini.
S3 dapat menguntungkan pengembang dalam menciptakan aplikasi model bahasa besar (LLM) di dunia nyata, karena menyederhanakan dan mengurangi biaya pembuatan model retriever dalam struktur RAG.
Retrisie Rag
Efektivitas sistem kain apa pun tergantung pada kualitas komponen pengambilan. di dalam Tentukan merekaPara peneliti mengklasifikasikan pengembangan pendekatan pemotongan menjadi tiga tahap yang berbeda.
- Sistem “Rag Classic” bergantung pada metode pemulihan tetap dengan kueri tetap, di mana kualitas pengambilan dipisahkan dari kinerja akhir. Struktur -struktur ini berjuang dengan pertanyaan yang membutuhkan pemikiran kontekstual atau multi -hukum.
- Tahap selanjutnya, yang disebut “Pra-RL-Zero”, memberikan aktivitas yang lebih aktif di LLM saat inferensi. Teknologi ini termasuk interaksi multi -turn, menghasilkan pertanyaan yang tumpang tindih, pengambilan, dan pemikiran. Namun, biasanya tergantung pada nol boga dan tidak memiliki bahan pelatihan untuk meningkatkan pemulihan melalui sinyal hasil langsung.
- Tahap terakhir, “RL-Zero”, meningkatkan pembelajaran penguatan (RL) untuk melatih model pekerjaan sebagai agen pencarian, dan meningkatkan dengan komentar berbasis hasil seperti jawaban yang benar. Contohnya adalah pencarian-R1, yang melatih formulir berkomunikasi dengan pertanyaan dengan pertanyaan pencarian dan pemulihan.
Terlepas dari kemajuannya, metode RL-Zer saat ini sering meningkatkan pengambilan menggunakan standar di sekitar pencarian yang mengabaikan manfaat muara. Apalagi membutuhkannya Pemolesan llmHarganya mahal dan terpapar kesalahan. Melalui pemulihan yang saling terkait dengan generasi, ini mengurangi manfaat penelitian nyata dan kompatibilitas dengan model beku atau properti.
Dalam kata -kata para peneliti, “Ini merangsang pergeseran ke arah kerangka standar di mana penelitian dan kebidanan dipisahkan bersih, dan perbaikannya berfokus murni pada kualitas penelitian mengenai alat muara.”
S3
S3 membingkai tantangan ini melalui pendekatan khas yang khas. Gagasan utamanya adalah melatih agen pencarian dengan pengetahuan eksternal yang terorganisir dan multi -jurnal. Agen penelitian ini meningkatkan kualitas tahap pengambilan tanpa mempengaruhi LLM yang menghasilkan jawaban akhir.
Di S3, peneliti khusus LLM bereaksi berulang kali dengan mesin pencari. Dia membuat pertanyaan berdasarkan klaim, mengingat dokumen yang relevan, memilih sub -grup bukti yang berguna, dan memutuskan apakah akan terus mencari informasi lebih lanjut. Setelah penelitian berakhir, fraktur LLM yang terpisah dan terpisah mengkonsumsi bukti akumulasi ini untuk menghasilkan jawaban akhir.

Inovasi dasar S3 adalah sinyal hadiahnya, dan keuntungan di belakang kain (GBR). GBR menentukan peningkatan akurasi generator ketika bersyarat pada dokumen yang dipulihkan oleh S3, dibandingkan dengan garis dasar yang mengingatkan dokumen yang lebih tinggi yang sesuai dengan kueri. Bonus ini merangsang peneliti untuk menemukan dokumen yang benar -benar meningkatkan kualitas generator.
“S3 membongkar pemulihan (peneliti) dari generator. Hal ini memungkinkan perusahaan untuk menghubungkan LLM di tebing atau kepemilikan kepemilikan-apakah itu adalah GPT-4, Claude, atau model internal tanpa harus mengendalikannya,” kata Pengchng, penulis kertas dan doktor dalam usaha. “Untuk lembaga dengan pembatasan organisasi atau kontrak dalam memodifikasi model, atau yang bergantung pada fasad pemrograman aplikasi LLM tertutup, model ini membuat S3 sangat praktis. Ini memungkinkan mereka untuk meningkatkan kualitas penelitian tanpa menyentuh infrastruktur untuk generasi mereka.”
S3 di tempat kerja
Para peneliti menguji S3 melalui enam kriteria untuk mengumpulkan pertanyaan umum untuk domain publik, membandingkannya dengan tiga kategori sistem kain: kontrol kinerja yang komprehensif (misalnya, pencarian-R1), pengambilan tetap dengan generator beku (seperti dokumen-dokumen RAG-R1 dan pengembalian aktivitasnya. Peneliti, Qwen2.5-14b-instruct dan Claude 3 haiku sebagai generator LLMS beku.
S3 melampaui garis pondasi tetap dan nol dan ujung yang disita pada sebagian besar kriteria dan mencapai derajat menengah. Perlu dicatat bahwa efisiensi datanya khususnya: S3 telah membuat keuntungan yang kuat dengan hanya 2,4 ribu contoh pelatihan, jauh lebih sedikit dari 70 ribu contoh yang diperlukan oleh DeePerrrieve (kerangka pengambilan tetap) atau 170.000 yang diperlukan oleh Search-R1, sementara itu melampaui kualitas konteks dan kinerja jawaban akhir.

Jiang mengatakan: “Banyak institusi tidak memiliki kualitas besar -skala atau GPU Kualitas Infrastruktur Penjamin Data Penjamin untuk menyesuaikan sistem LLM dari ujung ke finish. S3 mengurangi penghalang dengan memungkinkan kinerja pengambilan yang kuat dengan pengawasan dan perhitungan minimal,” kata Jiang. “Ini berarti model awal lebih cepat, mengurangi biaya dan waktu penerbitan tercepat untuk aplikasi penelitian Amnesty International.”
Hasilnya menunjukkan pergeseran dasar dalam strategi peningkatan. Seperti yang dicatat oleh para peneliti dalam makalah ini, sebagian besar performa RAG memperoleh berasal dari “meningkatkan kapasitas pencarian alih -alih menyelaraskan output generasi”, yang berarti bahwa RL fokus pada strategi penelitian alih -alih mencapai penyelarasan generasi menggabungkan hasil yang lebih baik.
Hasil penentu lain dari aplikasi lembaga adalah S3 untuk menggeneralisasi area yang belum dilatih. S3 menunjukkan keberhasilan nol dalam memastikan kualitas medis terlepas dari pelatihan jaminan kualitas umum, menunjukkan bahwa “keterampilan penelitian di mana pembelajaran telah menjadi sirkuler yang lebih andal daripada pendekatan yang telah disita,” menurut para peneliti.
Kemampuan untuk beradaptasi di seluruh lapangan membuat S3 dengan baik untuk aplikasi lembaga khusus yang sering berurusan dengan kepemilikan atau grup data terperinci tanpa perlu data pelatihan luas untuk lapangan. Ini berarti bahwa seorang peneliti terlatih dapat melayani departemen yang berbeda (misalnya, legal, SDM, dukungan pelanggan) atau beradaptasi dengan konten lanjutan seperti dokumen produk baru.
Jiang mengatakan: “Kami melihat potensi langsung di bidang perawatan kesehatan, manajemen pengetahuan lembaga, dan dukungan dari penelitian ilmiah, karena pemulihan berkualitas tinggi sangat penting, dan data yang disebut langka,” kata Jiang.
Tautan sumber
Berita
Trump dan Xi bertemu dalam upaya untuk menyelesaikan ketegangan perdagangan yang disebabkan oleh tarif AS

baruAnda sekarang dapat mendengarkan artikel Fox News!
Presiden AS Donald Trump bertemu langsung dengan pemimpin Tiongkok Xi Jinping pada hari Kamis, hari terakhir perjalanan Trump ke Asia yang mencakup kunjungan ke Malaysia, Jepang dan Korea Selatan, dalam upaya untuk menyelesaikan perselisihan perdagangan yang sedang berlangsung antara kedua belah pihak.
Trump telah mengenakan tarif yang signifikan terhadap Tiongkok sejak kembali menjabat di Gedung Putih pada bulan Januari, dan Beijing telah meresponsnya dengan memberlakukan pembatasan ekspor unsur tanah jarang. Kedua belah pihak ingin menghindari risiko meledaknya perekonomian global yang dapat merugikan negara mereka.
Para pemimpin dua negara dengan perekonomian terbesar di dunia berbicara kepada pers dalam pernyataan pengantar singkat sebelum bertemu secara tertutup dengan para pejabat senior mereka.
Presiden Donald Trump, kiri, dan Presiden Tiongkok Xi Jinping, kanan, berjabat tangan sebelum pertemuan mereka di Bandara Internasional Gimhae di Busan, Korea Selatan, Kamis, 30 Oktober 2025. (Foto AP/Mark Schiefelbein)
“Sungguh hangat rasanya bertemu Anda lagi karena sudah bertahun-tahun berlalu,” kata Xi dalam pidato pembukaannya.
“Kami tidak selalu sepakat satu sama lain,” kata Xi, sambil menekankan bahwa “adalah hal yang normal jika terjadi perselisihan antara dua negara dengan ekonomi terkemuka di dunia dari waktu ke waktu.”

Presiden Donald Trump, kanan, bersama Menteri Luar Negeri Marco Rubio, kedua dari kanan, dan Menteri Perdagangan Howard Lutnick, ketiga dari kanan, bertemu dengan Presiden Tiongkok Xi Jinping di Bandara Internasional Gimhae di Busan, Korea Selatan, Kamis, 30 Oktober 2025. (Foto AP/Mark Schiefelbein)
Klik di sini untuk mengunduh aplikasi FOX NEWS
Pemimpin Tiongkok tersebut menambahkan bahwa kedua negara “sepenuhnya mampu membantu satu sama lain untuk mencapai kesuksesan dan kesejahteraan bersama.”
Associated Press berkontribusi pada laporan ini.
Ini adalah kisah yang berkembang. Periksa kembali untuk mengetahui pembaruan.
Berita
Dari pengklasifikasi statis hingga mesin penalaran: Paradigma OpenAI baru memikirkan kembali moderasi konten

Perusahaan sangat ingin memastikan model AI apa pun yang mereka gunakan Komitmen terhadap keselamatan dan penggunaan yang aman kebijakan, dan menyesuaikan LLM sehingga tidak menanggapi pertanyaan yang tidak diminta.
Namun, sebagian besar keamanan dan tim merah terjadi sebelum penerapan, dan kebijakan “penggabungan” terjadi sebelum pengguna sepenuhnya merasakan kemampuan model dalam produksi. OpenAI Dia yakin hal ini dapat menawarkan pilihan yang lebih fleksibel bagi organisasi dan mendorong lebih banyak perusahaan untuk menerapkan kebijakan keselamatan.
Perusahaan telah merilis dua model open-weight dalam tinjauan penelitian yang diyakini akan membuat institusi dan model lebih fleksibel dalam hal agunan. gpt-oss-safeguard-120b dan gpt-oss-safeguard-20b akan tersedia pada lisensi Apache 2.0 yang permisif. Model-model tersebut merupakan versi open source OpenAI yang telah disempurnakan gpt-oss, dirilis pada bulan Agustusmenandai rilis pertama dalam keluarga OSS sejak musim panas.
Di sebuah Entri blogoss-safeguard menggunakan logika untuk “menafsirkan kebijakan pengembang dan penyedia secara langsung pada waktu inferensi – mengklasifikasikan pesan pengguna, penyelesaian, dan percakapan penuh sesuai dengan kebutuhan pengembang,” kata OpenAI.
Perusahaan menjelaskan bahwa karena model menggunakan Chain of Thought (CoT), pengembang dapat memperoleh penjelasan tentang keputusan model untuk ditinjau.
“Selain itu, kebijakan diberikan selama inferensi, bukan pelatihan model, sehingga lebih mudah bagi pengembang untuk sering meninjau kebijakan guna meningkatkan kinerja.”" OpenAI mengatakan dalam postingannya. "Pendekatan ini, yang awalnya kami kembangkan untuk penggunaan internal, jauh lebih fleksibel dibandingkan metode tradisional dalam melatih pengklasifikasi untuk secara tidak langsung menyimpulkan batasan keputusan dari sejumlah besar contoh yang diberi label."
Pengembang dapat mengunduh kedua templat dari Pelukan wajah.
Elastisitas versus roti
Awalnya, model AI tidak akan mengetahui faktor keselamatan pilihan perusahaan. Sedangkan model pengirim tim merah Model dan platform,Jaminan ini ditujukan untuk penggunaan yang lebih luas. Perusahaan seperti Microsoft Dan Layanan Web Amazon sampai Platform tampilan Untuk membawa Pagar pembatas untuk aplikasi kecerdasan buatan Dan para agen.
Perusahaan menggunakan pengklasifikasi keselamatan untuk membantu melatih model mengenali pola masukan yang baik atau buruk. Ini membantu model mengetahui pertanyaan mana yang tidak boleh mereka jawab. Hal ini juga membantu memastikan bahwa model tidak menyimpang dan jawabannya akurat.
“Pengklasifikasi tradisional dapat memiliki kinerja tinggi, latensi rendah, dan biaya pengoperasian rendah," kata OpenAI. "Namun mengumpulkan contoh pelatihan dalam jumlah yang cukup dapat memakan waktu dan mahal, dan memperbarui atau mengubah kebijakan memerlukan pelatihan ulang pengklasifikasi."
Model mengambil dua masukan sekaligus sebelum mengambil kesimpulan tentang kegagalan konten. Dibutuhkan kebijakan dan konten untuk menentukan peringkat sesuai dengan pedomannya. OpenAI mengatakan model tersebut bekerja paling baik dalam situasi di mana:
Potensi kerugian sedang muncul atau berkembang, dan kebijakan harus beradaptasi dengan cepat.
Domain ini sangat bagus dan sulit ditangani oleh pengklasifikasi yang lebih kecil.
Pengembang tidak memiliki cukup sampel untuk melatih pengklasifikasi berkualitas tinggi untuk setiap risiko di platform mereka.
Latensi tidak sepenting menghasilkan label berkualitas tinggi dan dapat ditafsirkan.
Perusahaan mengatakan gpt-oss-safeguard “berbeda karena kemampuan logikanya memungkinkan pengembang untuk menegakkan kebijakan apa pun,” bahkan kebijakan yang mereka tulis selama inferensi.
Model ini didasarkan pada alat internal OpenAI, Safety Reasoner, yang memungkinkan timnya lebih sering memasang pagar pembatas. Mereka sering kali memulai dengan kebijakan keamanan yang sangat ketat, “menggunakan komputasi dalam jumlah yang relatif besar bila diperlukan,” dan kemudian menyesuaikan kebijakan tersebut saat mereka menggerakkan model melalui perubahan produksi dan penilaian risiko.
Kinerja keselamatan
OpenAI mengatakan model perlindungan gpt-oss-nya mengungguli GPT-5 Thinking dan model gpt-oss asli dalam hal akurasi multi-kebijakan berdasarkan pengujian benchmark. Model tersebut juga dijalankan pada benchmark ToxicChat secara keseluruhan, dan performanya baik, meskipun pertimbangan GPT-5 dan alasan keselamatan sedikit mengungguli model tersebut.
Namun ada kekhawatiran bahwa pendekatan ini dapat mengarah pada sentralisasi standar keselamatan.
“Keselamatan bukanlah konsep yang didefinisikan dengan baik,” kata John Theakston, asisten profesor ilmu komputer di Cornell University. “Setiap penerapan standar keselamatan akan mencerminkan nilai dan prioritas organisasi yang menciptakannya, serta keterbatasan dan kekurangan modelnya.” “Jika industri secara keseluruhan mengadopsi standar yang dikembangkan oleh OpenAI, kita berisiko melembagakan perspektif tertentu mengenai keselamatan dan menghalangi penyelidikan yang lebih luas mengenai kebutuhan keselamatan dalam penerapan AI di banyak sektor masyarakat.”
Perlu juga dicatat bahwa OpenAI belum merilis model dasar untuk rangkaian model oss, sehingga pengembang tidak dapat mereplikasinya sepenuhnya.
Namun, OpenAI yakin bahwa komunitas pengembang dapat membantu meningkatkan perlindungan gpt-oss. Ini akan menjadi tuan rumah hackathon pada 8 Desember di San Francisco.
Berita
Pertemuan Trump-Xi menempatkan kedelai sebagai pusat ketegangan perdagangan AS-Tiongkok

baruAnda sekarang dapat mendengarkan artikel Fox News!
Sebagai presiden Donald Trump Saat Presiden Tiongkok Xi Jinping mempersiapkan pertemuan pada hari Kamis, bintang ekspor Amerika yang bersuara lembut akan menjadi pusat perhatian: kedelai. Hasil panen sederhana, andalan senilai $30 miliar Ekspor pertanianHal ini telah menjadi simbol kuat dari saling ketergantungan ekonomi dan ketegangan politik antara Washington dan Beijing.
Singkatnya, kedelai telah menjadi perwujudan dari perubahan perang dagang AS-Tiongkok. Beijing menghentikan pembelian kedelai AS setelah adanya tarif balasan terhadap produk tersebut, sebagai respons terhadap bea masuk yang sebelumnya dikenakan oleh Trump terhadap barang-barang Tiongkok.
Tiongkok berfokus pada pemasok di Brasil dan Argentina, sebuah langkah yang menyoroti betapa cepatnya perubahan pola perdagangan global dan betapa rentannya Amerika Serikat. Petani Karena perselisihan diplomatik antara Washington dan Beijing.
Apa yang awalnya merupakan saling balas dendam antara dua negara dengan ekonomi terbesar di dunia telah berubah menjadi pukulan simbolis dan ekonomi terhadap basis Trump di pedesaan, yang mata pencahariannya bergantung pada hubungan perdagangan yang sama yang kini berada di garis bidik.
Menurut American Soybean Association, Amerika Serikat secara tradisional menjadi sumber utama kedelai bagi Tiongkok. Sebelum sengketa perdagangan tahun 2018, sekitar 28% produksi kedelai AS diekspor ke Tiongkok. Itu Ekspor tanaman Angka tersebut turun tajam menjadi 11% pada tahun 2018 dan 2019, kemudian kembali meningkat menjadi 31% pada tahun 2021 di tengah permintaan di era pandemi, kemudian turun lagi menjadi 22% pada tahun 2024.
Namun beberapa pakar kebijakan mengklaim bahwa peralihan Tiongkok dari kedelai AS sudah berlangsung.
Beijing diam-diam mendikte langkah perang dagang selanjutnya ketika Trump dan Xi bersiap untuk bertemu
Beijing telah menghentikan pembelian kedelai AS di tengah perang dagang yang sedang berlangsung dengan Amerika Serikat. (Jan Sonnenmeier/Getty Images)
“Tiongkok akan selalu mengurangi ketergantungannya pada Amerika Serikat dalam hal ketahanan pangan,” Brian Burak, penasihat kebijakan senior untuk Tiongkok dan Indo-Pasifik di Heritage Foundation, mengatakan kepada Fox News Digital. “Tiongkok mulai menandatangani perjanjian pembelian kedelai dengan negara-negara lain jauh sebelum Presiden Trump menjabat,” katanya, seraya menambahkan bahwa Beijing telah “terpisah dari Amerika Serikat untuk waktu yang lama.”
“Sayangnya, satu-satunya cara bagi kami untuk merespons adalah dengan melakukan hal yang sama, dan proses itu sangat menyakitkan,” kata Burak.
Namun bagi petani yang tinggal ribuan mil dari Washington dan Beijing, perubahan kebijakan ini berarti menyusutnya pasar dan menurunkan margin keuntungan.
“Kami mengandalkan perdagangan dengan negara lain, khususnya Tiongkok, untuk membeli kedelai kami,” Brad Arnold, petani kedelai multigenerasi di barat daya Missouri, mengatakan kepada FOX Business. Keputusan Tiongkok untuk memboikot pembelian kedelai dari AS “memiliki dampak yang luar biasa terhadap bisnis dan hasil kami,” katanya.

Presiden Donald Trump dan Presiden Tiongkok Xi Jinping diperkirakan akan membahas ekspor kedelai Korea Selatan. (Christopher Dilts/Bloomberg/Getty Images)
“Ada pemanfaatan kedelai dalam negeri, seperti solar terbarukan dan biodiesel yang diproduksi khusus dari kedelai,” kata Arnold. “Dalam skema besar, persentasenya sangat kecil saat ini, Anda tahu bahwa dibutuhkan pelanggan seperti Tiongkok untuk membeli pil tersebut agar dapat memberikan dampak yang nyata. Anda tidak dapat mengambil pelanggan pertama kami lalu menutupnya dan mencari penggantinya dalam semalam.”
Ketergantungan pada Tiongkok menambah bobot baru pada tahap diplomatik minggu ini, ketika Trump dan Xi bersiap untuk bertemu di Korea Selatan. Kedua pemimpin akan bertemu di sela-sela KTT Kerja Sama Ekonomi Asia-Pasifik di Busan, Korea Selatan, dalam pembicaraan tatap muka pertama mereka sejak Trump kembali menjabat.
Pertemuan tersebut diterima oleh Menteri Keuangan Scott Besant Dia memperkirakan Tiongkok akan menunda pembatasan elemen jejak dan melanjutkan pembelian kedelai dari Amerika Serikat, dan menyebutnya sebagai bagian dari “kerangka besar” yang ingin dipertahankan oleh kedua belah pihak. Besant juga mengatakan negosiasi perdagangan bergerak menuju penghindaran tarif baru AS sebesar 100% terhadap barang-barang Tiongkok.
KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS

Presiden Tiongkok Xi Jinping telah menghentikan pembelian kedelai di tengah perang dagang dengan Amerika Serikat. (Oliver Bonnick/Bloomberg melalui Getty Images)
Sebagai upaya untuk meredakan ketegangan, Reuters melaporkan bahwa Tiongkok telah membeli sekitar 180.000 metrik ton minyak Amerika. kedelai Menjelang pertemuan Trump-Xi.
Apakah ini merupakan pencairan nyata dalam hubungan perdagangan AS-Tiongkok atau hanya penangguhan hukuman sementara, pembelian ini menggarisbawahi betapa eratnya hubungan antara diplomasi dan pertanian.
Eric Revell dari Fox Business berkontribusi pada laporan ini.
Berita8 tahun agoThese ’90s fashion trends are making a comeback in 2017
Berita8 tahun agoThe final 6 ‘Game of Thrones’ episodes might feel like a full season
Berita8 tahun agoAccording to Dior Couture, this taboo fashion accessory is back
Berita8 tahun agoUber and Lyft are finally available in all of New York State
Berita8 tahun agoThe old and New Edition cast comes together to perform
Bisnis9 bulan agoMeta Sensoren Disensi Internal atas Ban Trump Mark Zuckerberg
Berita8 tahun agoPhillies’ Aaron Altherr makes mind-boggling barehanded play
Hiburan9 bulan agoMakna di balik jejak perbedaan Kendrick Lamar – Hollywood Life


