Berita
Kurang mengawasi, hasil yang lebih baik: Studi ini menunjukkan bahwa model kecerdasan buatan lebih efektif

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut
Model bahasa dapat diedarkan lebih baik ketika mereka dibiarkan membuat solusi mereka sendiri Studi baru Diposting oleh Universitas Hong Kong dan Universitas California, Berkeley. Hasil, yang berlaku untuk model LLMS dan model VLMS, menantang salah satu kepercayaan utama dari model LLM-yang memerlukan contoh pelatihan beracun secara manual. Faktanya, para peneliti menjelaskan bahwa model pelatihan pada banyak contoh borgol dapat memiliki efek berbahaya pada kemampuan model untuk menggeneralisasi data yang tidak terlihat.
Sft vs rl dalam pelatihan khas
Untuk waktu yang lama, kontrol kontrol (SFT) adalah standar emas untuk pelatihan LLMS dan VLMS. Setelah model pra -terlatih dalam data dan gambar teks mentah, biasanya diimplementasikan di bidang data teks mentah dan laboratorium pada sejumlah besar data dari contoh buatan tangan dalam mengoordinasikan pertanyaan/jawaban atau permintaan/respons. Setelah SFT, model dapat menjalani tahapan pelatihan tambahan, seperti Belajar penguatan dari reaksi manusia (RLHF), di mana model mencoba mempelajari preferensi manusia implisit berdasarkan sinyal seperti klasifikasi jawaban atau kekaguman/pengulangan dalam respons model.
SFT berguna untuk mengarahkan perilaku model menuju jenis tugas yang dirancang oleh model kreatif. Namun, pengumpulan data adalah proses yang lambat dan mahal, yang merupakan hambatan bagi banyak perusahaan dan laboratorium.
Perkembangan modern di LLM telah menciptakan perhatian dalam pendekatan pembelajaran penguatan murni (RL), di mana model diberi tugas dan dibiarkan untuk mempelajarinya sendiri tanpa contoh buatan tangan. Contoh yang paling penting adalah Deepseek-R1, pesaing Openai O1 yang sebagian besar menggunakan pembelajaran untuk memperkuat tugas pemikiran yang kompleks.
Melingkar terhadap menghafal
Salah satu masalah utama Sistem Pembelajaran Otomatis (ML) adalah untuk mengatasi model mengatasi, karena model bekerja dengan baik pada data pelatihannya tetapi gagal menggeneralisasi dalam contoh yang tidak terlihat. Selama pelatihan, model memberi kesan yang salah tentang mempelajari tugas, sementara dalam praktiknya ia telah menghafal contoh pelatihan. Dalam model kecerdasan buatan yang besar dan kompleks, generalisasi generalisasi bisa sulit.
Studi baru ini berfokus pada kemampuan pelatihan RL dan SFT dalam tugas -tugas berpikir tekstual dan visual. Untuk pemikiran tekstual, LLM, dilatih pada seperangkat aturan, harus dapat menggeneralisasi variabel aturan ini. Dalam pemikiran visual, VLM harus tetap konsisten dalam melakukan tugas untuk perubahan dalam berbagai aspek input visual, seperti warna dan perencanaan spasial.
Dalam pengalaman mereka, para peneliti menggunakan dua tugas yang representatif. Yang pertama adalah titik umum, standar yang mengevaluasi kemampuan berpikir komputasi model. Formulir ini diberikan empat kartu, sebagai deskripsi teks atau gambar, dan diminta untuk menggabungkannya untuk mencapai nomor target. Untuk mempelajari surat edaran berbasis berkuasa, para peneliti melatih model menggunakan satu set aturan, kemudian mengevaluasinya menggunakan basis yang berbeda. Untuk sirkulasi visual, mereka melatih model menggunakan satu kartu warna dan menguji kinerjanya pada warna lain dan rencana penomoran.
Tugas kedua V-flickYang menguji kemungkinan pemikiran spasial dari model di bidang gerakan di dunia terbuka yang menggunakan input visual yang realistis. Tugas ini juga datang dalam versi murni dan bahasa. Para peneliti menilai surat edaran dengan mengubah jenis instruksi dan representasi visual, model dilatih dan diuji.

Mereka melakukan tes mereka di LLAMA-3.2-Vision-11b, menaikkan model dengan melatihnya pada set data SFT kecil, kemudian membuat versi terpisah untuk setiap tugas dan formulir pelatihan. Untuk setiap tugas, mereka memperluas jangkauan pelatihan secara terpisah pada RL dan SFT. Model SFT dilatih dalam solusi buatan tangan, sementara RL memungkinkan model untuk membuat banyak solusi untuk setiap masalah, mengevaluasi hasil dan melatih dirinya sendiri pada jawaban yang tepat.
Hasil menunjukkan bahwa pembelajaran penguatan terus meningkatkan kinerja pada contoh yang sangat berbeda dari data pelatihan. Di sisi lain, SFT tampaknya melestarikan aturan pelatihan dan tidak digeneralisasi pada contoh di luar distribusi. Catatan ini berlaku untuk masing -masing pengaturan teks dan multi -media.

Efek dari aplikasi dunia nyata
Meskipun pengalaman mereka menunjukkan bahwa RL lebih baik dalam melingkar dari SFT, para peneliti juga menemukan bahwa SFT berguna untuk memasang format format format, yang sangat penting untuk memungkinkan RL membuat perolehan kinerja. Para peneliti menemukan bahwa tanpa tahap SFT awal, RL tidak mencapai hasil yang diinginkan.
Ini sedikit berbeda dari hasil yang diperoleh oleh Deepseek-R1-Zero, yang dilatih setelah RL murni. Para peneliti menyarankan bahwa ini bisa disebabkan oleh berbagai model tulang belakang yang mereka gunakan dalam percobaan mereka.
Jelas bahwa ada banyak kemampuan yang tidak dieksploitasi dalam pendekatan yang berat. Adapun hasil penggunaan yang diverifikasi, memungkinkan model untuk belajar sendiri dapat menyebabkan hasil yang tidak terduga yang tidak dapat dibuat oleh orang. Ini bisa sangat berguna dalam pengaturan karena dapat dibuat dengan contoh manual yang membosankan dan mahal.
Berita
AWS melipatgandakan infrastruktur sebagai strategi dalam perlombaan kecerdasan buatan dengan promosi Sagemaker

Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang
AWS Ia berupaya memperluas lokasinya di pasaran dengan Pembaruan untuk SagemakerPembelajaran Otomatis, Platform Pelatihan Model Kecerdasan dan Inferensi Buatan, dengan penambahan kemungkinan baru untuk pengamatan, lingkungan pengkodean yang terhubung dan manajemen kinerja GPU.
Namun, AWS terus menghadapi persaingan dari Google Dan MicrosoftDan itu juga menyediakan banyak fitur yang membantu mempercepat pelatihan dan inferensi kecerdasan buatan.
Sagemaker, yang telah berubah menjadi pusat terpadu untuk mengintegrasikan sumber data dan mengakses alat pembelajaran otomatis pada tahun 2024, menambahkan fitur -fitur yang memberikan wawasan tentang alasan mengapa kinerja model dan memberikan pelanggan AWS lebih banyak kontrol atas jumlah akun yang dialokasikan untuk pengembangan model.
Fitur -fitur baru lainnya termasuk koneksi lingkungan pengembangan terintegrasi lokal (IDE) dengan Sagemaker, sehingga proyek AI yang ditulis secara lokal dapat dipublikasikan di platform.
Direktur Jenderal Sagemaker Ankur Mehrotra VentureBeat mengatakan kepada banyak pembaruan baru ini yang berasal dari pelanggan itu sendiri.
“Salah satu tantangan yang telah kami lihat adalah menghadapi pelanggan kami sambil mengembangkan model Gen AI adalah bahwa ketika sesuatu yang salah atau ketika tidak ada yang terjadi, sangat sulit untuk menemukan apa yang terjadi di lapisan tumpukan itu.”
Pemantauan Hyperpod Sagemaker memungkinkan para insinyur untuk memeriksa berbagai lapisan tumpukan, seperti lapisan akun atau lapisan jaringan. Jika sesuatu yang salah terjadi atau model menjadi lebih lambat, Sagemaker dapat mengingatkan mereka dan menerbitkan standar di dasbor.
Mahletra merujuk pada masalah nyata yang dihadapi timnya saat melatih model baru, ketika kode pelatihan mulai menekankan unit pemrosesan grafis, menyebabkan fluktuasi suhu. Dia mengatakan bahwa tanpa alat terbaru, pengembang membutuhkan waktu berminggu -minggu untuk menentukan sumber masalah dan kemudian memperbaikinya.
IDES terhubung
Sagemaker telah menunjukkan dua cara bagi pengembang kecerdasan buatan untuk melatih dan mengoperasikan model. Itu sepenuhnya dapat diakses oleh IDE, seperti Jupyter Lab atau editor instruktur pemrograman, untuk menjalankan kode pelatihan SMM pada model melalui Sagemaker. Pahami bahwa insinyur lain lebih suka menggunakan IDE lokal, termasuk semua ekstensi yang mereka instal, AWS memungkinkan mereka untuk menjalankan kode mereka di perangkat mereka juga.
Namun, Mehrotra mengindikasikan bahwa itu berarti bahwa model yang dienkripsi secara lokal hanya dioperasikan secara lokal, jadi jika pengembang ingin berkembang, itu telah terbukti menjadi tantangan besar.
AWS telah menambahkan implementasi aman baru untuk memungkinkan pelanggan terus bekerja pada IDE pilihan mereka – baik lokal atau dikelola – dan terhubung ke Sagemaker.
“Jadi kemampuan ini sekarang memberi mereka yang terbaik di dua dunia di mana jika mereka mau, mereka dapat berkembang secara lokal di IDE lokal, tetapi sehubungan dengan melaksanakan tugas yang sebenarnya, mereka dapat memperoleh manfaat dari kemampuan untuk memperluas di Sagemaker,” katanya.
Lebih banyak fleksibilitas di akun
AWS Sagemaker Hyperpod diluncurkan pada Desember 2023 sebagai cara untuk membantu pelanggan mengelola kelompok server untuk model pelatihan. Mirip dengan penyedia layanan CoruvHyperpod memungkinkan pelanggan Sagemaker untuk mengarahkan energi yang tidak digunakan ke lokasi favorit mereka. Hyperpod diketahui ketika tanggal penggunaan GPU harus ditentukan berdasarkan pola permintaan dan memungkinkan lembaga menyeimbangkan sumber daya dan biaya mereka secara efektif.
Namun, AWS mengatakan banyak pelanggan ingin layanan yang sama menyimpulkan. Banyak tugas inferensi terjadi pada siang hari ketika orang menggunakan model dan aplikasi, sementara pelatihan biasanya dijadwalkan selama jam sibuk.
Mahletra mencatat bahwa bahkan di dunia, pengembang dapat memberikan prioritas pada tugas inferioritas yang harus difokuskan oleh hyperpod.
Laurent Sever, co -founder dan CTO di AI Agent Company H dariDia mengatakan di blog AWS bahwa perusahaan menggunakan Sagemaker Hyperpod saat membangun platform agen.
“Transisi yang lancar dari pelatihan ke penalaran penyederhanaan alur kerja kami, mengurangi waktu untuk produksi, dan memberikan kinerja yang konsisten di lingkungan hidup,” kata Seifry.
AWS dan kompetisi
Amazon mungkin tidak menawarkan model fondasi yang paling menakjubkan seperti para pesaingnya dari penyedia cloud, Google dan Microsoft. Namun, AWS lebih fokus pada penyediaan tulang punggung infrastruktur lembaga untuk membangun model, aplikasi atau agen kecerdasan buatan.
Selain Sagemaker, AWS juga menawarkan fondasi, yang merupakan platform yang dirancang khusus untuk membangun aplikasi dan agen.
Sagemaker telah hadir selama bertahun -tahun, dimulai pada awalnya sebagai cara untuk menghubungkan berbagai alat pembelajaran mesin ke danau data. Ketika saya memulai Buku Kecerdasan Buatan Truc, insinyur kecerdasan buatan mulai menggunakan Sagemaker untuk membantu melatih model bahasa. Namun, Microsoft sangat mendorong ekosistem kain, dengan 70 % perusahaan Fortune 500, untuk menjadi pelopor dalam akselerasi data dan AI. Google, melalui Vertex AI, telah diam -diam membuat cara untuk mengadopsi AI.
AWS, tentu saja, memiliki keuntungan menjadi penyedia cloud yang paling banyak digunakan. Setiap pembaruan yang akan membuat banyak platform infrastruktur kecerdasan buatan lebih mudah digunakan akan selalu bermanfaat.
Tautan sumber
Berita
Guru Carolina Selatan menuduh dugaan hubungan dengan seorang siswa kecil

baruAnda sekarang dapat mendengarkan Fox News!
Seorang mantan guru Carolina Selatan dituduh melakukan hubungan jangka panjang dengan seorang remaja.
Kantor Provinsi Anderson Sharif mengatakan Nicole Palo Kaloham, 33, diserahkan ke Pusat Penahanan Kabupaten Anderson pada hari Kamis.
Dia dituduh tiga dakwaan terkait perilaku seksual kriminal dengan anak di bawah umur dan satu tuduhan untuk berkontribusi pada kenakalan kecil.
Seorang guru dalam pendidikan jasmani sebelumnya dituduh melakukan beberapa kejahatan seksual terhadap 3 anak
Nicole Palu, sebagai mantan guru Carolina Selatan, dituduh melakukan perilaku yang tidak pantas dengan anak di bawah umur. (Kantor Anderson Sharif County)
Penyelidik memulai penyelidikan Callem pada bulan Mei dan menemukan bahwa dugaan pelanggaran dimulai pada tahun 2021 dan berlangsung setidaknya selama dua tahun.
Pihak berwenang mengatakan bahwa Kalham, seorang guru pada saat itu, mulai “mempersiapkan perilaku” dengan bocah itu di awal remaja.
Kantor Sharif mengatakan: “Hubungan itu semakin intensif karena jatuh dari sekolah, dan memindahkannya ke praktik dan bekerja sebagai penyelia post -school,” kata kantor Sharif. “Reaksi berulang ini menyebabkan pola pelecehan yang panjang, yang dikonfirmasi oleh penelitian berkelanjutan dan perintah kerja sama dengan keluarga korban.”
Guru Illinois menuduh 52 tuduhan tambahan dalam kasus kekerasan seksual
Pihak berwenang mengatakan bahwa bocah itu maju setelah mencapai 18 tahun, “waktu berikutnya menghabiskan perawatan dan kejutan yang terkait dengan pelecehan.”
Selain tuduhan di provinsi Anderson, Departemen Kepolisian Greenville telah membuat tuduhan serupa terhadap Kalham.
Perilaku yang diduga meluas ke yurisdiksinya ketika bocah itu bergabung dengan sekolah di Greenville. Calham mengundurkan diri dari Anderson V School.
Klik di sini untuk mendapatkan aplikasi Fox News
Fox News Digital telah tiba di daerah tersebut.
Berita
Bintang “Rhobh” Erika Jayne memantau dokter hewan tentara di tengah keterlambatan perceraian Tom Gerardi

baruAnda sekarang dapat mendengarkan Fox News!
Bintang “Real Housewives From Beverly Hills” terlihat dengan seorang pria baru di tengah perceraiannya yang terus -menerus dari Tom Gerardi.
Jin dan veteran di militer AS, John “mitra”, McIf, digambarkan saat memegang tangan mereka pada 7 Juli, ketika keduanya kehilangan misi di Los Angeles.
Sersan Operasi Angkatan Darat Amerika yang sudah pensiun, juga dikenal sebagai “Sharif Baghdad”, memiliki lebih dari 20 tahun pelayanan yang terhormat, menurut Lokasinya di web.
Dia sekarang bekerja sebagai penjaga pribadi dan memiliki mereknya. McPhee sebenarnya melatih orang lain dan mengerjakan serangkaian keterampilan, kata situs itu.
Tom Gerardi, suami dari mantan ibu rumah tangga dan pengacara yang memalukan, didakwa dengan penipuan dugaan $ 15 juta
Erika Jin memegang John McVy saat dia meninggalkan Los Angeles. (Lionssharenews / backgrid)
Makfei mengungkapkan pernikahan sebelumnya karena dinas militernya selama kemunculan Mei.Pertunjukan Megyn Kelly“
“Jadi saya selalu mengatakan ini, kehadirannya seperti berada di penjara. Anda dapat menghubungi rumah (tetapi) Anda tidak pergi ke sana dalam waktu dekat. Beginilah cara kerjanya. Beginilah cara kerja pernikahan di Angkatan Darat.” “Ini sulit bagi semua orang. Hanya pria yang memiliki hubungan sempurna yang selamat dari perang. Saya ingin mengatakan bahwa bagian terbesar dari pria itu berakhir.”
Jin mengajukan permintaan perceraian dari Gerardi pada tahun 2020. “Setelah banyak pertimbangan, saya memutuskan untuk mengakhiri pernikahan saya dengan Tom Gerardi. Majalah People. “Aku memiliki cinta yang besar, menghormati Tom, tempat tinggal kita, dan kehidupan yang kita bangun bersama.”
“Keinginan mutlak saya untuk bergerak maju dalam proses ini dengan hormat dan dengan privasi yang pantas dan saya dapatkan. Saya meminta orang lain untuk memberi kami privasi ini juga.”

Mantan pengacara Tom Geraldi dikeluarkan dari pengadilan pada 6 Agustus 2024. (Myung J. Chun / Los Angeles Times via Getty Images)
Perceraian pasangan yang dideportasi berisiko menyingkirkan sidang pada 26 Juni setelah empat tahun penundaan, Us Weekly Saya sebutkan. Pengacara Gerardi gagal muncul di hadapan pengadilan. Pengacara Jin baru -baru ini mengungkapkan bahwa perceraian itu tidak akan terjadi.
“Saya tidak berpikir perceraian akan pergi ke mana pun,” kata Jim Wilkes. Matahari. “Dia tidak memenuhi syarat untuk membelanya.” Gerardi didiagnosis menderita penyakit Alzheimer pada tahun 2021 dan ditempatkan di bawahnya diawetkan.
Seperti apa yang kamu baca? Klik di sini untuk berita hiburan lainnya

Dikatakan bahwa perceraian “ibu rumah tangga nyata dari Beverly Hills” berasal dari perceraian Tom Gerardi dengan risiko mengusir mereka. (Tommy Garcia)
Gerardi didakwa dengan penipuan federal pada Februari 2023. Tuduhan itu telah meningkat dari pilihan pengacara tentang pencurian Lion Air 610 korban terbang.
Setelah persidangan 13 hari, Gerarddi dihukum karena empat tuduhan penipuan kawat oleh juri. Dia dijatuhi hukuman lebih dari tujuh tahun penjara di belakang bar pada Juni 2025.
Penggelapan Gerardi pertama kali disorot pada tahun 2020 setelah gugatan diajukan bersamanya dan perusahaan hukum, Gerardi dan Kassi, di Pengadilan Sipil oleh keluarga para korban.
Klik di sini untuk mendaftar di buletin hiburan

Erika Jin mengajukan permohonan perceraian dari Tom Gerardi pada tahun 2020 setelah 21 tahun menikah. (YouTube/Bravo)
Gerardi, yang diklasifikasikan oleh California Bar Association pada Juli 2022, dikenal karena karyanya, yang mewakili jaksa penuntut terhadap perusahaan -perusahaan besar, khususnya dalam kasus Samudra Pasifik dan Listrik Pasifik yang menginspirasi “Irene Brocovich” tahun 2000.
Ketika Gerardi memenangkan pemukiman 333 juta dolar untuk penduduk kota Hinkeli, California, dalam kasus PG&E, pada waktu itu adalah gugatan terbesar yang pernah dibayar.
“Tom Gerardi “Pengacara Amerika Serikat Martin Astrada berada dalam publikasi komet Gerardi,” pengacara AS, Martin Estrada, didasarkan pada posisi terkenal dan menariknya pada para korban dengan memotret dirinya sebagai padang rumput. Putusan hari ini menunjukkan bahwa permainan telah berakhir – kita sekarang dapat melihat terdakwa ini apa adanya dan para korban yang mengkhianatinya dengan kategoris. ”
Klik di sini untuk mendapatkan aplikasi Fox News
Trussy Wright dari Fox News Digitter berkontribusi pada laporan ini.
- Berita8 tahun ago
These ’90s fashion trends are making a comeback in 2017
- Berita8 tahun ago
The final 6 ‘Game of Thrones’ episodes might feel like a full season
- Berita8 tahun ago
According to Dior Couture, this taboo fashion accessory is back
- Berita8 tahun ago
The old and New Edition cast comes together to perform
- Berita8 tahun ago
Phillies’ Aaron Altherr makes mind-boggling barehanded play
- Berita8 tahun ago
Uber and Lyft are finally available in all of New York State
- Berita8 tahun ago
Disney’s live-action Aladdin finally finds its stars
- Berita8 tahun ago
Steph Curry finally got the contract he deserves from the Warriors