Berita
Kurang mengawasi, hasil yang lebih baik: Studi ini menunjukkan bahwa model kecerdasan buatan lebih efektif

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut
Model bahasa dapat diedarkan lebih baik ketika mereka dibiarkan membuat solusi mereka sendiri Studi baru Diposting oleh Universitas Hong Kong dan Universitas California, Berkeley. Hasil, yang berlaku untuk model LLMS dan model VLMS, menantang salah satu kepercayaan utama dari model LLM-yang memerlukan contoh pelatihan beracun secara manual. Faktanya, para peneliti menjelaskan bahwa model pelatihan pada banyak contoh borgol dapat memiliki efek berbahaya pada kemampuan model untuk menggeneralisasi data yang tidak terlihat.
Sft vs rl dalam pelatihan khas
Untuk waktu yang lama, kontrol kontrol (SFT) adalah standar emas untuk pelatihan LLMS dan VLMS. Setelah model pra -terlatih dalam data dan gambar teks mentah, biasanya diimplementasikan di bidang data teks mentah dan laboratorium pada sejumlah besar data dari contoh buatan tangan dalam mengoordinasikan pertanyaan/jawaban atau permintaan/respons. Setelah SFT, model dapat menjalani tahapan pelatihan tambahan, seperti Belajar penguatan dari reaksi manusia (RLHF), di mana model mencoba mempelajari preferensi manusia implisit berdasarkan sinyal seperti klasifikasi jawaban atau kekaguman/pengulangan dalam respons model.
SFT berguna untuk mengarahkan perilaku model menuju jenis tugas yang dirancang oleh model kreatif. Namun, pengumpulan data adalah proses yang lambat dan mahal, yang merupakan hambatan bagi banyak perusahaan dan laboratorium.
Perkembangan modern di LLM telah menciptakan perhatian dalam pendekatan pembelajaran penguatan murni (RL), di mana model diberi tugas dan dibiarkan untuk mempelajarinya sendiri tanpa contoh buatan tangan. Contoh yang paling penting adalah Deepseek-R1, pesaing Openai O1 yang sebagian besar menggunakan pembelajaran untuk memperkuat tugas pemikiran yang kompleks.
Melingkar terhadap menghafal
Salah satu masalah utama Sistem Pembelajaran Otomatis (ML) adalah untuk mengatasi model mengatasi, karena model bekerja dengan baik pada data pelatihannya tetapi gagal menggeneralisasi dalam contoh yang tidak terlihat. Selama pelatihan, model memberi kesan yang salah tentang mempelajari tugas, sementara dalam praktiknya ia telah menghafal contoh pelatihan. Dalam model kecerdasan buatan yang besar dan kompleks, generalisasi generalisasi bisa sulit.
Studi baru ini berfokus pada kemampuan pelatihan RL dan SFT dalam tugas -tugas berpikir tekstual dan visual. Untuk pemikiran tekstual, LLM, dilatih pada seperangkat aturan, harus dapat menggeneralisasi variabel aturan ini. Dalam pemikiran visual, VLM harus tetap konsisten dalam melakukan tugas untuk perubahan dalam berbagai aspek input visual, seperti warna dan perencanaan spasial.
Dalam pengalaman mereka, para peneliti menggunakan dua tugas yang representatif. Yang pertama adalah titik umum, standar yang mengevaluasi kemampuan berpikir komputasi model. Formulir ini diberikan empat kartu, sebagai deskripsi teks atau gambar, dan diminta untuk menggabungkannya untuk mencapai nomor target. Untuk mempelajari surat edaran berbasis berkuasa, para peneliti melatih model menggunakan satu set aturan, kemudian mengevaluasinya menggunakan basis yang berbeda. Untuk sirkulasi visual, mereka melatih model menggunakan satu kartu warna dan menguji kinerjanya pada warna lain dan rencana penomoran.
Tugas kedua V-flickYang menguji kemungkinan pemikiran spasial dari model di bidang gerakan di dunia terbuka yang menggunakan input visual yang realistis. Tugas ini juga datang dalam versi murni dan bahasa. Para peneliti menilai surat edaran dengan mengubah jenis instruksi dan representasi visual, model dilatih dan diuji.

Mereka melakukan tes mereka di LLAMA-3.2-Vision-11b, menaikkan model dengan melatihnya pada set data SFT kecil, kemudian membuat versi terpisah untuk setiap tugas dan formulir pelatihan. Untuk setiap tugas, mereka memperluas jangkauan pelatihan secara terpisah pada RL dan SFT. Model SFT dilatih dalam solusi buatan tangan, sementara RL memungkinkan model untuk membuat banyak solusi untuk setiap masalah, mengevaluasi hasil dan melatih dirinya sendiri pada jawaban yang tepat.
Hasil menunjukkan bahwa pembelajaran penguatan terus meningkatkan kinerja pada contoh yang sangat berbeda dari data pelatihan. Di sisi lain, SFT tampaknya melestarikan aturan pelatihan dan tidak digeneralisasi pada contoh di luar distribusi. Catatan ini berlaku untuk masing -masing pengaturan teks dan multi -media.

Efek dari aplikasi dunia nyata
Meskipun pengalaman mereka menunjukkan bahwa RL lebih baik dalam melingkar dari SFT, para peneliti juga menemukan bahwa SFT berguna untuk memasang format format format, yang sangat penting untuk memungkinkan RL membuat perolehan kinerja. Para peneliti menemukan bahwa tanpa tahap SFT awal, RL tidak mencapai hasil yang diinginkan.
Ini sedikit berbeda dari hasil yang diperoleh oleh Deepseek-R1-Zero, yang dilatih setelah RL murni. Para peneliti menyarankan bahwa ini bisa disebabkan oleh berbagai model tulang belakang yang mereka gunakan dalam percobaan mereka.
Jelas bahwa ada banyak kemampuan yang tidak dieksploitasi dalam pendekatan yang berat. Adapun hasil penggunaan yang diverifikasi, memungkinkan model untuk belajar sendiri dapat menyebabkan hasil yang tidak terduga yang tidak dapat dibuat oleh orang. Ini bisa sangat berguna dalam pengaturan karena dapat dibuat dengan contoh manual yang membosankan dan mahal.
Berita
Apa itu di dalam ginsbark? Pendekatan kerja baru yang memberikan alur kerja yang kaku untuk faktor independen

Agen Genspark membuktikan bahwa lebih sedikit kontrol atas jalannya pekerjaan yang kaku, memaksa para pemimpin AI yayasan untuk memikirkan kembali
Tautan sumber
Berita
Trump bertemu dengan para pemimpin NATO setelah kebiasaan “pekerjaannya di Iran”

baruAnda sekarang dapat mendengarkan Fox News!
presiden Donald Trump Dijadwalkan untuk naik panggung utama pada hari kedua KTT NATO di Den Haag, Belanda – yang memberikan nada ramah yang luar biasa terhadap koalisi yang telah lama mengkritiknya.
Presiden dijadwalkan untuk bertemu dengan Sekretaris NATO -General Mark Root dan para pemimpin dunia lainnya sebelum konferensi pers.
Trump juga mengatakan bahwa ia akan memberi hormat kepada Presiden Ukraina Folodimir Zellinski, yang menghadiri KTT di tengah dorongan terus -menerus ke Ukraina Bergabunglah dengan NATO.
Dalam pesan teks Trump, roti memberi selamat kepadanya tentang “membuat Eropa membayar sangat” melalui tujuan pengeluaran pertahanan baru sebesar 5 % – dan pada mediasi dalam konflik baru -baru ini antara Israel dan Iran.
Trump pergi ke KTT NATO, di mana para pemimpin dunia akan mencapai kesepakatan untuk meningkatkan pengeluaran defensif mereka hingga 5 % dari PDB. (Gambar Andrew Harnik/Getty)
“Selamat dan terima kasih atas pekerjaan Anda yang menentukan di Iran. Itu benar -benar tidak biasa, dan sesuatu yang tidak ada yang berani lakukan,” tulis Root, sementara Trump terbang menuju puncak. “Semuanya membuat kita lebih aman.”
Israel dan Iran memasuki gencatan senjata di Amerika Serikat pada hari Selasa-meskipun Israel membatalkan serangan baliknya berdasarkan urgensi Trump.
“Anda terbang ke kesuksesan besar lain di Den Haag malam ini,” tambah Roti, merujuk pada perjanjian baru bagi anggota NATO untuk meningkatkan pengeluaran pertahanan hingga 5 % dari PDB.
Allies NATO pertama kali setuju pada tahun 2006 untuk menghabiskan 2 % dari PDB untuk pertahanan – tujuan banyak orang gagal bertemu selama bertahun -tahun. Sekarang, setelah undangan berulang -ulang Trump ke Eropa “untuk mengumpulkan bobotnya”, aliansi sepakat untuk lebih banyak Target 5 % ambisiusDengan pengecualian Spanyol, yang telah lama berjuang untuk memenuhi standar asli.
Jumlah baru dibagi menjadi 3,5 % untuk pengeluaran pertahanan dasar, 1,5 % untuk infrastruktur yang relevan, termasuk cyberwarfare dan intelijen. Duta Besar NATO menyetujui teks penyelesaian pada hari Minggu.
Apa yang bisa diharapkan di KTT NATO mendatang: Trump, pengeluaran, Ukraina, Iran

Sekretaris NATO -Mark Mark Roty Trump memberi selamat gencatan senjata atas Iran dan membujuk Eropa untuk meningkatkan pengeluaran pertahanannya (Nicholas Tokat/Reuters)
Bagi sebagian besar sekutu, target mewakili lompatan besar. Polandia saat ini mengarahkan semua negara anggota sebesar 4,1 % dari PDB ke pertahanan. Amerika Serikat berdiri di 3,4 %.
Trump mengatakan dia tidak percaya bahwa Amerika Serikat perlu mencapai ambang batas 5 % penuh – sikap yang didukung oleh Root.
“Amerika Serikat sudah menghabiskan sekitar 3,5 % untuk pertahanan dasar, dan tidak ada keraguan bahwa itu akan menghabiskan 1,5 % untuk hal -hal pertahanan,” kata Root. “Negara -negara seperti Estonia dan Polandia sangat dekat. Bagi banyak orang lain, itu akan tetap jauh ke depan, tetapi sangat penting untuk melakukan itu.”

Trump juga mengatakan bahwa ia akan memberi hormat kepada Presiden Ukraina Folodimir Zelinsky, yang menghadiri KTT di tengah kumpulan Ukraina yang berkelanjutan untuk bergabung dengan NATO. (Christian Hartmann/Reuters)
Dia juga meminta industri pertahanan “di kedua sisi Samudra Atlantik” untuk meningkatkan produksi.
Routy mengatakan pada hari Selasa: “Tidak masuk akal bahwa Rusia, dengan ekonomi 25 kali, mampu memiliki keunggulan dan keunggulan kita,” kata Roti pada hari Selasa. Dan Eropa mendesak: “Buat pertahanan Anda begitu kuat sehingga tidak ada yang berani menyerang Anda.”
Terlepas dari kemajuan yang dibuat, keraguan Trump yang sekecil apa pun adalah apakah Amerika Serikat akan berkomitmen untuk menyebarkan pertahanan bersama di NATO – Pasal 5 – yang mewajibkan anggota untuk saling membela jika terjadi serangan.
“Ini tergantung pada definisi Anda,” kata Trump ketika ditanya apakah dia akan menghormati komitmen. “Ada banyak definisi Pasal 5, Anda tahu, kan? Tapi saya berkomitmen untuk menjadi teman mereka. Saya telah menjadi teman dari banyak pemimpin ini, dan saya berkomitmen untuk membantu mereka.”
Klik di sini untuk mendapatkan aplikasi Fox News
Namun, Duta Besar AS untuk NATO Matthew Whitaker berusaha meyakinkan sekutu, dan mengatakan kepada wartawan, “Amerika Serikat tidak pergi ke mana pun.”
Dia menceritakan pesan ini, dan saya meminta para mitra untuk “berhenti mengkhawatirkan” dan fokus pada memperkuat pertahanan mereka.
Berita
Chatehr dari Stanford memungkinkan dokter untuk menanyakan tentang catatan medis pasien menggunakan bahasa alami, tanpa mengorbankan data pasien

Bergabunglah dengan acara bahwa para pemimpin lembaga telah dipercaya selama hampir dua dekade. VB Transform menggabungkan orang yang membangun strategi AI untuk institusi nyata. Pelajari lebih lanjut
Bagaimana cara mengobrol dengan catatan kesehatan dengan cara yang dengan chatgpt?
Awalnya, seorang mahasiswa kedokteran mengajukannya, pertanyaan ini mengangkat perkembangan Chatehr Stanford Healthcare. Sekarang dalam produksi, alat ini mempercepat ulasan rencana untuk masuk ke ruang gawat darurat, menyederhanakan ringkasan transfer pasien dan mengumpulkan informasi dari tanggal medis yang kompleks.
Dalam hasil eksperimen awal, pengguna klinis telah melihat pengambilan informasi secara signifikan; Perlu dicatat bahwa dokter darurat menyaksikan 40 % dari waktu untuk meninjau rencana selama operasi pengiriman kritis, kata Michael A. VB mengonversi.
Ini membantu mengurangi kelelahan dokter Anda saat meningkatkan perawatan pasien, dan membangun kontrak fasilitas medis yang Anda lakukan untuk mengumpulkan data dan otomatisasi penting.
“Ini adalah waktu yang menyenangkan di bidang perawatan kesehatan karena kami menghabiskan dua puluh tahun terakhir dalam penomoran data perawatan kesehatan dan menempatkan mereka dalam catatan kesehatan elektronik, tetapi kami tidak benar -benar mengubahnya,” kata Bouver dalam obrolan dengan editor VB -in -dalam -chief. “Dengan teknik model bahasa besar baru, kami sudah mulai melakukan transformasi digital ini.”
Bagaimana Chatehr membantu mengurangi “waktu piyama”, kembali ke reaksi wajah nyata
Dokter menghabiskan hingga 60 % dari waktu mereka dalam tugas administrasi alih -alih merawat pasien langsung. Mereka sering mengenakan misi “Waktu piyama“Pengorbanan Jam pribadi dan keluarga untuk menyelesaikan tugas administrasi di luar jam kerja normal.
Salah satu tujuan Pfeffer yang besar adalah menyederhanakan alur kerja dan mengurangi jam tambahan ini sehingga dokter dan karyawan administrasi dapat fokus pada pekerjaan yang lebih penting.
Misalnya, banyak informasi datang melalui gerbang online pasien. Kecerdasan buatan sekarang memiliki kemampuan untuk membaca pesan dari pasien dan menyusun respons yang dapat ditinjau dan disetujui seseorang.
“Ini adalah jenis titik awal,” jelasnya. “Meskipun tidak harus menghemat waktu, yang menarik, itu benar -benar mengurangi kelelahan kognitif.” Dia menunjukkan bahwa pesan cenderung lebih ramah untuk pasien, karena pengguna dapat mengarahkan model untuk menggunakan bahasa tertentu.
Dengan pindah ke agen, Pfeffer mengatakan mereka adalah konsep “baru” di bidang perawatan kesehatan tetapi memberikan peluang yang menjanjikan.
Misalnya, pasien dengan diagnosis kanker biasanya memiliki tim spesialis yang meninjau catatan mereka dan menentukan langkah -langkah pengobatan berikut. Namun, persiapannya banyak pekerjaan. Dokter dan karyawan harus lulus catatan seluruh pasien, tidak hanya EHR tetapi juga penyakit fotografi, kadang -kadang data genetik, dan informasi tentang uji klinis yang mungkin merupakan pasien yang cocok dengan baik. Pfeffer menjelaskan bahwa semua ini harus berkumpul dengan tim untuk membuat jadwal dan rekomendasi.
“Hal terpenting yang dapat kami lakukan untuk pasien kami adalah memastikan bahwa mereka memiliki perawatan yang tepat, dan dibutuhkan pendekatan multidisiplin,” kata Bajar.
Tujuannya adalah untuk membangun agen di Chatehr yang dapat menghasilkan ringkasan, jadwal waktu dan mengirimkan rekomendasi untuk meninjau dokter. Pfeffer menekankan bahwa itu tidak diganti, karena sedang mempersiapkan “hanya rekomendasi ringkasan yang luar biasa.”
Hal ini memungkinkan tim medis untuk melakukan “perawatan aktual pasien” sekarang, yang sangat penting di dokter dan kekurangan keperawatan.
“Teknologi ini akan mengubah waktu yang dihabiskan dokter dan perawat dalam melakukan tugas administrasi,” katanya. Dan ketika dikombinasikan dengan petugas AI di sekitarnya yang mengambil kendali atas tugas, staf medis lebih memfokuskan waktu pada pasien.
“Reaksi ini adalah wajah wajah yang sangat berharga.” “Kita akan melihat Amnesty International lebih beralih ke interaksi dokter dan pasien.”
Teknik “Luar biasa” bersama tim multidisiplin
Sebelum Catehr, tim Pfeffer telah meluncurkan SecureGpt ke semua Stanford Medicine; Gerbang aman memiliki 15 model berbeda yang dapat dirusak oleh siapa pun. “Yang benar -benar kuat dalam teknologi ini adalah Anda benar -benar dapat membukanya bagi banyak orang untuk pengalaman,” kata Bajar.
Stanford mengikuti pendekatan yang beragam untuk mengembangkan kecerdasan buatan, membangun modelnya sendiri dan menggunakan campuran rak yang aman dan pribadi (seperti Microsoft Azure) dan model open source bila diperlukan. Pfeffer menjelaskan bahwa timnya “tidak cukup spesifik” untuk satu atau yang lain, tetapi lebih lanjut melanjutkan apa yang akan lebih baik untuk keadaan penggunaan tertentu.
Dia berkata: “Ada begitu banyak jenis teknologi luar biasa sekarang sehingga jika Anda dapat mengumpulkannya bersama dengan cara yang benar, Anda bisa mendapatkan solusi seperti yang telah kami bangun.”
Kredit lain untuk Stanford adalah tim multidisiplinnya; Berbeda dengan karyawan intelijen buatan yang hebat atau kelompok amnesti internasional, Pfeffer mengumpulkan kepala data, dua ilmuwan informasi, seorang pejabat utama informasi medis, seorang petugas informasi keperawatan, CTO dan CISO.
Dia berkata: “Kami menggabungkan informatika, ilmu data dan tradisional, dan membungkusnya dalam arsitektur; yang Anda dapatkan adalah grup ajaib ini yang memungkinkan Anda melakukan proyek yang sangat kompleks ini.”
Pada akhirnya, Stanford melihat Amnesty International sebagai alat yang harus diketahui setiap orang, seperti yang dikonfirmasi Pfeffer. Berbagai tim perlu memahami bagaimana kecerdasan buatan digunakan ketika mereka bertemu dengan pemilik bisnis dan menemukan cara untuk menyelesaikan masalah, “Kecerdasan buatan hanyalah bagian dari cara berpikir mereka.”
Tautan sumber
- Berita8 tahun ago
These ’90s fashion trends are making a comeback in 2017
- Berita8 tahun ago
The final 6 ‘Game of Thrones’ episodes might feel like a full season
- Berita8 tahun ago
According to Dior Couture, this taboo fashion accessory is back
- Berita8 tahun ago
The old and New Edition cast comes together to perform
- Berita8 tahun ago
Phillies’ Aaron Altherr makes mind-boggling barehanded play
- Berita8 tahun ago
Uber and Lyft are finally available in all of New York State
- Berita8 tahun ago
Disney’s live-action Aladdin finally finds its stars
- Berita8 tahun ago
Mod turns ‘Counter-Strike’ into a ‘Tekken’ clone with fighting chickens