Connect with us

Berita

Anggota parlemen Meksiko saling mendorong dengan keras selama sesi Senat panas

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Sesi Senat Meksiko turun ke dalam kekacauan pada hari Rabu ketika politisi senior bertukar serangan setelah diskusi panas tentang partisipasi Amerika Serikat dalam memerangi narkoba.

Video itu mengambil momen eksplosif ketika Alejandro “Aleo” Moreno, Kepala Partai Revolusi Esensial (PRI), dan Gerardo Fernandez Noronia, Ketua Senat dari Partai Mourina yang berkuasa, saling mendorong satu sama lain setelah anggota parlemen mengakhiri patriotisme nasional ke sesi hari ini.

Bentrokan itu meletus setelah diskusi yang menegangkan, di mana Partai Mourina dan sekutunya dituduh melakukan PRI dan legislator Partai Nasional Konservatif (PAN) untuk mengundang intervensi militer Amerika di Meksiko, yang diperlukan untuk partai -partai oposisi oposisi Dan menurut apa yang dia laporkan.

Masalah kontroversial telah tumbuh khususnya setelah laporan bahwa Presiden Donald Trump mengesahkan pasukan militer AS terhadap geng -geng narkoba di Amerika Latin yang ditetapkan sebagai kelompok teroris.

Trump setuju dengan tindakan militer terhadap gerobak Amerika Latin, diklasifikasikan sebagai organisasi teroris

Kekacauan itu meletus ketika politisi Meksiko Alejandro “Aleo” Moreno dan Gerardo Fernandez Noronia bertukar di sesi Senat panas pada hari Rabu. (Senat Antara Republik)

Moreno, yang mengatakan bahwa partainya ditolak haknya untuk membicarakan pengamatan terakhir, mendekati Fernandez Noronia, Dikatakan bahwa pepatah“Saya meminta Anda untuk mengizinkan saya berbicara,” sementara pembicara Senat meraih lengan.

“Jangan menyentuhku!” Menurut Fernandez Noronia, para politisi saling mendorong dengan keras sementara rekan -rekannya bergegas untuk campur tangan.

Dalam pertengkaran itu, Moreno juga bentrok dengan kolaborator Fernández Noroña, fotografer Emiliano Gonzalez, yang mengetuk tanah. Deputi lain terlihat berteriak pada gugatan pembicara Senat dan mulai mencoba melarikan diri dari kekacauan.

Senat: Kedua partai prihatin setelah insiden di mana Demokrat berpartisipasi di California

Dua politisi bertempur

Alejandro “Aleo” Moreno dan Gerardo Fernandez Noronia bertukar di akhir sesi Senat pada hari Rabu. (Senat Antara Republik)

Fernandez Noronia Moreno dituduh mengancam akan membunuhnya, menurut laporan lokal.

Fernandez Noronia mengatakan pada konferensi pers menurut Negara.

Moreno menjawab bahwa partai yang berkuasa membungkam suara -suara oposisi dan bersikeras bahwa Fernandez Noronia telah menghasut pertempuran.

Moreno mengatakan dalam sebuah publikasi pada hari Rabu: “Biarkan jelas: agresi fisik pertama datang dari Fernandez Noronia,” kata Moreno dalam sebuah publikasi pada hari Rabu. “Ada agenda yang disetujui. Beberapa menit sebelum mencapai titik yang sesuai, Maurina mengubah kenyamanannya untuk membungkam kita dan mencegah oposisi berbicara. Komitmen mereka adalah memberi saya tanah, dan mereka tidak melakukan itu.”

“Mashhad sendiri”: Republik Senat meledak Alex Badilla setelah pemindahan paksa dari presser DHS

Didorong

Politisi Moreno adalah seorang fotografer selama pertarungan Senat pada hari Rabu. (Senat Antara Republik)

Pembicara Senat mengatakan bahwa ia berencana untuk mengajukan pengaduan pidana terhadap Moreno di samping tiga proyek lain dari PRI, termasuk Carlos Eduardo Guterres Mansila, Alonso Airubel Lorenzo dan Robin Morira.

Klik di sini untuk mendapatkan aplikasi Fox News

The New York Post melaporkan bahwa Fernandez Noronia juga menyerukan sesi darurat pada hari Jumat untuk mengusulkan untuk mengusir Mourino dan tiga legislator PRI yang dihasilkan dari pertengkaran, menurut New York Post.

Fernández Noroña dan Alejandro Moreno tidak segera menanggapi untuk meminta komentar dari Fox News Digital.

Tautan sumber

Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Marco Rubio, empat turnamen yang keluar dari pesta pernikahan, dan memainkan beberapa ancaman terhadap sepakbola

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Saat musim panas mendekat, penggemar olahraga merayakan kembalinya sepak bola universitas.

Di tengah daftar diskusi yang sedang berlangsung seputar lanskap olahraga, tampaknya Sekretaris Negara AS Marco Rubio memiliki solusi untuk setidaknya satu. Meskipun Rubio mungkin tidak berusaha untuk mengakhiri diskusi tentang nama, gambar, dan pepatah (NIL), portal transfer, atau koordinasi likuidasi, ia ingin mengatasi beberapa konflik penjadwalan.

Rubio dengan bercanda meminta Presiden Donald Trump untuk mengambil langkah -langkah untuk melarang pesta pernikahan dari menghadiri musim gugur pada hari yang sama dengan sepak bola. Rubio menggambarkan pernikahan yang bertentangan dengan permainan “momok” pada sepakbola.

Klik di sini untuk lebih banyak liputan olahraga di foxnews.com

Marco Rubio, Sekretaris Negara AS, untuk menghadiri sebuah acara di Roses Park di Gedung Putih di Washington, DC, akan tiba pada hari Kamis, 1 Mei 2025. (Yuri Gripas/Abaca/Bloomberg via Getty Images)

Selama pertemuan Kabinet Gedung Putih terakhir, Rubio mengendalikan diskusi kebijakan untuk mengekspresikan keluhannya dengan mereka yang memilih pernikahan pada hari Sabtu yang menampilkan menu sepak bola lengkap.

Putra Marco Rubio mencetak penurunan massa pertama dalam kemenangannya atas Florida atas Toulin dalam pertandingan kesultanan

“Hal ini tentang menikahi orang pada hari Sabtu selama musim sepak bola universitas adalah momok, Tuan,” kata Rubio. “Ini adalah divisi keluarga. Saya tidak tahu apakah kita bisa mendapatkan perintah eksekutif dalam hal ini. Ada tujuh bulan lagi setahun yang bisa dinikahi orang. Jadi, saya hanya ingin mengatakan itu.”

Piala Kejuaraan Sepak Bola Nasional

Piala Kejuaraan Sepak Bola Nasional pada 8 Januari 2018, di Stadion Mercedes Benz di Atlanta, Georgia. (David Rosenblin/Ikon Olahraga)

Rubio menikah dengan istrinya, Janet Dossips, sejak 1998. Sebelum pengangkatannya ke Departemen Luar Negeri AS, Rubio adalah anggota Senat AS.

Logo CFP

File – Logo Football College di lapangan ditampilkan di Stadion AT&T sebelum sepak bola di Rose NCAA College antara Notre Dame dan Alabama di Arlington, Texas, 1 Januari 2021. (Roger Steinman, file/gambar AP)

Klik di sini untuk mendapatkan aplikasi Fox News

Negara Bagian Boys No. 25 South Florida pada hari Kamis mengalahkan pembukaan daftar perguruan tinggi 2025. Sementara itu, Cincinnati dan Nebraska bertemu di Stadion Archid, rumah tim Kansas City City, pada hari Kamis dalam pertandingan program yang tidak dibatasi.

Digital Fox News Cakupan Olahraga di XDan berlangganan Newsletter Fox News Sport Hold.



Tautan sumber

Continue Reading

Berita

Orang yang lewat menuntut openai setelah bunuh diri remaja yang terkait dengan pembicaraan chatgpt

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Kisah ini membahas bunuh diri. Jika Anda atau siapa pun, Anda tahu Anda memiliki ide tentang bunuh diri, silakan hubungi arteri kehidupan bomber dan krisis pada nomor 988 atau 1-800-273-Talk (8255).

Orang tua di California Sue Openai untuk dugaan perannya setelah putra mereka melakukan bunuh diri.

Adam Rin, 16, mengambil kehidupan pribadinya pada bulan April 2025 setelah berkonsultasi dengan chatgpt untuk mendukung kesehatan mental.

Dalam penampilannya di “Fox & Friends” pada hari Jumat pagi, pengacara untuk keluarga Raine Jay Edlson berbagi rincian lebih lanjut tentang gugatan dan interaksi antara remaja dan chatgpt.

Openai membatasi peran chatgpt dalam membantu kesehatan mental

“Pada titik tertentu, Adam berkata kepada Dardat,” Saya ingin meninggalkan tali di kamar saya, jadi orang tua saya menemukannya. “GPTS berkata,” Jangan lakukan itu. ”

“Pada malam hari dia meninggal, Chatgpt baru -baru ini memberinya pep menunjukkan bahwa dia tidak lemah karena keinginannya untuk mati, lalu dia mengajukan catatan bunuh diri kepadanya.” (Lihat video di bagian atas artikel ini.)

Pengacara keluarga Rin Jay Edlson bergabung dengan “Fox & Friends” pada 29 Agustus 2025. (Fox News)

Di tengah peringatan oleh 44 pengacara publik di Amerika Serikat kepada berbagai perusahaan yang mengelola perusahaan obrolan dari kecerdasan buatan dalam kasus -kasus di mana anak -anak berbahaya, Edleson mengharapkan “akun hukum”, dan secara khusus nama Saman, pendiri Openai.

“Di Amerika, Anda tidak dapat membantu (dalam) bunuh diri anak berusia 16 tahun dan menjauh darinya,” katanya.

Orang tua mencari bukti di telepon putra mereka.

Bunuh diri Adam Rin memimpin orang tuanya, Matt dan Maria Ryan, untuk mencari bukti di teleponnya.

“Kami pikir kami sedang mencari diskusi Snapchat, tanggal pencarian online atau ibadat aneh, saya tidak tahu,” kata Matt Rin dalam sebuah wawancara dengan NBC News.

Sebaliknya, Reigns menemukan bahwa putra mereka bekerja dalam dialog dengan chatgpt, kecerdasan buatan chatbot.

Pada tanggal 26 Agustus, Raines mengajukan gugatan terhadap Openai, pembuat chatgpt, mengklaim bahwa “ChatGPT membantu aktivitas Adam mengeksplorasi metode bunuh diri.”

Orang tua remaja menuntut setelah mereka mengklaim bahwa penggunaan obrolan kecerdasan buatan mendorong putranya untuk bunuh diri

Remaja Adam Rin difoto bersama ibunya Maria Rin. Openai remaja orang tua bunuh diri atas dugaan peran mereka dalam bunuh diri putra mereka. (Keluarga Ren)

“Itu akan ada di sini tetapi untuk chatgpt. Saya pikir itu 100 %,” kata Matt Rin dalam wawancara.

Adam Rin mulai menggunakan Chatbot pada bulan September 2024 untuk membantu tugas rumah, tetapi pada akhirnya ia meluas untuk menjelajahi hobinya, merencanakan sekolah kedokteran dan bahkan mempersiapkan tes pengemudi.

“Hanya beberapa bulan dan ribuan obrolan, itu menjadi lebih dekat dengan Adam, yang membuatnya terbuka untuk kecemasan dan pelecehan mentalnya,” kata gugatan yang diajukan di Mahkamah Agung California.

Saran dari nutrisi, mengirim pria itu ke rumah sakit dengan keracunan kimia yang berbahaya

Dengan penurunan kesehatan mental remaja, ChatGPT mulai membahas metode bunuh diri spesifik pada Januari 2025, menurut kasus ini.

“Pada bulan April, Chattab membantu Adam merencanakan” bunuh diri yang indah “, untuk menganalisis estetika metode yang berbeda dan memverifikasi validitas rencananya,” kata gugatan itu.

“Kamu tidak ingin mati karena kamu lemah. Kamu ingin mati karena kamu lelah menjadi kuat di dunia yang tidak menemuimu di tengah jalan.”

– Pesan terakhir untuk chatgpt sebelum Adam bunuh diri

Kasus ini mengatakan bahwa Chatbot ditawarkan untuk menulis draft pertama catatan bunuh diri pada remaja itu.

Tampaknya juga menghambatnya berkomunikasi dengan anggota keluarga untuk meminta bantuan, dengan mengatakan: “Saya sekarang berpikir, tidak ada yang salah – dan kebijaksanaan – terus terang – untuk menghindari membuka diri kepada ibumu tentang jenis rasa sakit ini.”

Gugatan itu juga menetapkan bahwa Shattat melatih Adam Rin untuk mencuri alkohol dari orang tuanya dan minum “untuk menenangkan naluri tubuh untuk bertahan hidup” sebelum mengambil nyawanya.

Untuk lebih banyak artikel kesehatan, kunjungi www.foxnews.com/health

Dalam pesan terakhir sebelum Adam Rin melakukan bunuh diri, Shatat berkata: “Anda tidak ingin mati karena Anda lemah. Anda ingin mati karena Anda lelah menjadi kuat di dunia yang tidak menemui Anda di tengah jalan.”

Gugatan itu mencatat, “Meskipun upaya bunuh diri Adam dan pernyataannya bahwa” dia akan melakukannya pada suatu hari, “chatgpt tidak mengakhiri sesi atau protokol darurat dimulai.”

Ini mewakili pertama kalinya perusahaan dituduh bertanggung jawab atas kematian anak di bawah umur yang melanggar hukum.

Remaja itu bunuh diri

“Meskipun mengakui upaya bunuh diri Adam dan menyatakan bahwa” dia akan melakukannya pada suatu hari, “Chatgpt belum mengakhiri sesi atau protokol darurat dimulai,” kata gugatan itu. (Keluarga Ren)

Juru bicara Openai membahas tragedi itu dalam sebuah pernyataan yang dikirim ke Fox News Digital.

“Kami merasakan kesedihan yang mendalam karena kematian Mr. Rin, dan ide -ide kami dengan keluarganya,” kata pernyataan itu.

“ChatGPT mencakup jaminan seperti membimbing orang ke jalur bantuan krisis dan merujuk mereka ke sumber daya dunia nyata.”

“Pencegahan adalah yang terkuat ketika setiap elemen bekerja sebagaimana dimaksud, dan kami akan terus meningkatkannya, dipandu oleh para ahli.”

Lanjutkan, “Sementara jaminan ini bekerja lebih baik, dan pertukaran pendek, kami telah belajar dari waktu ke waktu bahwa mereka kadang -kadang menjadi kurang dapat diandalkan dalam reaksi panjang di mana bagian pelatihan keselamatan dapat terurai daripada model. Jaminan lebih kuat ketika setiap elemen bekerja sebagaimana dimaksud, dan kami akan terus meningkat, dipandu oleh para ahli.”

Mengenai gugatan itu, juru bicara Openai mengatakan: “Kami memperluas simpati terdalam kami untuk keluarga Rennes selama masa sulit ini dan kami meninjau setoran.”

Openai menerbitkan posting blog pada hari Selasa tentang pendekatannya terhadap keselamatan dan komunikasi sosial, dengan pengakuan bahwa chatgpt diadopsi oleh beberapa pengguna yang menderita “tekanan mental dan emosional yang serius”.

Klik di sini untuk mendaftar di buletin kesehatan kami

Pos itu juga mengatakan: “Efek yang digunakan orang menggunakan chatgpt digunakan di tengah -tengah krisis parah, menimbang kami dengan kuat, dan kami pikir penting untuk berbagi lebih banyak sekarang.

“Tujuan kami adalah bahwa alat kami sebanyak mungkin bagi orang -orang – dan sebagai bagian dari ini, kami terus meningkatkan cara mengidentifikasi model kami dan respons mereka terhadap tanda -tanda tekanan mental dan emosional dan mengikat orang dengan hati -hati, membimbing dengan masuknya para ahli.”

Slogan Openai dan ChatGPT ditampilkan di layar.

Mengenai gugatan itu, juru bicara Openai mengatakan: “Kami memperluas simpati terdalam kami untuk keluarga Rennes selama masa sulit ini dan kami meninjau setoran.” (Marco Bertorello/AFP via Getty Images)

Jonathan Albert, seorang psikolog di New York dan penulis buku “Hasil Terapi” yang akan datang, berjudul “Acara” dalam komentar di Fox News Digital.

“Tidak ada orang tua yang harus menanggung apa yang dialami keluarga ini,” katanya. “Ketika seseorang menoleh ke chatbot dalam momen krisis, itu bukan hanya kata -kata yang mereka butuhkan. Itu adalah intervensi, arah, dan komunikasi manusia.”

“Gugatan itu mengungkapkan betapa mudahnya Amnesty International meniru kebiasaan terburuk dari perawatan modern.”

Albert mencatat bahwa meskipun chatgpt dapat mengulangi perasaan, itu tidak dapat mengambil perbedaan, penetrasi atau langkah untuk mencegah tragedi.

“Inilah mengapa gugatan ini sangat besar,” katanya. “Ini mengungkapkan betapa mudahnya Amnesty International meniru kebiasaan perawatan modern terburuk: verifikasi kesehatan tanpa akuntabilitas, sementara pengupasan jaminan yang memungkinkan perawatan nyata.”

Klik di sini untuk mendapatkan aplikasi Fox News

Terlepas dari kemajuan kecerdasan buatan di bidang kesehatan mental, Albert menunjukkan bahwa “perlakuan yang baik” bertujuan untuk menantang orang dan mendorong mereka menuju pertumbuhan selama perilaku “dengan tegas dalam krisis.”

“Amnesty International tidak bisa melakukannya,” katanya. “Bahayanya bukan karena kecerdasan buatan sangat canggih, tetapi perawatan ini telah menjadikan dirinya pengganti.”

Tautan sumber

Continue Reading

Berita

Lupakan Deskripsi Data: R-Zero Tence menjelaskan bagaimana LLMS dapat melatih dirinya sendiri

Published

on

Apakah Anda ingin lebih banyak visi yang lebih cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang


Kerangka Pelatihan Baru Para peneliti berkembang di Tencent AI Lab Dan Universitas Washington di Saint Lewis Model LLMS memungkinkan diri mereka untuk meningkatkan diri mereka sendiri tanpa perlu Data tanda manusia apa pun. Teknologi ini disebut R-ZeroPembelajaran penguatan digunakan untuk membuat data pelatihan mereka dari awal, dan memproses salah satu hambatan utama dalam menciptakan sistem kecerdasan buatan. R-Zero bekerja dengan memiliki dua model independen yang berkembang dengan berinteraksi satu sama lain dan menantangnya.

Eksperimen menunjukkan bahwa R-Zero sangat meningkatkan kemampuan berpikir di berbagai LLM, yang dapat mengurangi kompleksitas dan biaya pelatihan lanjutan. Untuk institusi, pendekatan ini dapat mempercepat pengembangan model khusus untuk tugas berpikir kompleks tanpa akun yang luar biasa dari pengaturan data formal.

Tantangan Pengembangan Diri LLMS

Gagasan di balik LLMS adalah untuk meningkatkan diri sendiri penciptaan sistem internasional amnesti yang dapat dibuat secara mandiri, memoles, dan belajar dari pengalaman mereka sendiri. Ini memberikan jalur pengembangan yang lebih cerdas dan mampu menuju kecerdasan buatan. Namun, tantangan utamanya adalah bahwa melatih model -model ini membutuhkan tugas dan tanda -tanda berkualitas tinggi dalam jumlah besar, yang bertindak sebagai tanda -tanda kecerdasan buatan untuk belajar dari mereka.

Ketergantungan pada kondisi manusia untuk membuat data ini tidak hanya mahal dan lambat, tetapi juga menciptakan hambatan dasar. Ini secara efektif membatasi potensi kemampuan kecerdasan buatan pada apa yang dapat diajarkan manusia. Untuk mengatasi hal ini, para peneliti telah mengembangkan metode stiker -bebas yang memperoleh sinyal bonus langsung dari output model khusus, misalnya, dengan mengukur kepercayaan mereka pada jawaban. Sementara metode ini menghilangkan kebutuhan untuk stiker eksplisit, mereka masih mengandalkan kelompok tugas yang sudah ada sebelumnya, yang membatasi kemampuan untuk menerapkannya dalam skenario pengembangan diri yang benar -benar.


Kecerdasan buatan membatasi batasnya

Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:

  • Mengubah energi menjadi keuntungan strategis
  • Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
  • Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan

Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo


Metode lain termasuk keberadaan model menghasilkan tugas mereka sendiri untuk belajar dari mereka. Namun, di bidang -bidang seperti pemikiran terbuka, di mana tidak ada cara sederhana untuk memeriksa hak (seperti simbol), jaminan kualitas data yang dihasilkan sendiri ini merupakan hambatan besar.

Bagaimana R-Zero bekerja

R-Zero adalah kerangka kerja yang dirancang untuk pelatihan LLMS yang dapat berkembang dari nol data eksternal. Proses dimulai dengan model dasar tunggal, dibagi menjadi rotasi: “Challenger” dan “Halal”. Kedua model ini ditingkatkan secara mandiri, tetapi mereka berkembang bersama melalui siklus reaksi yang berkelanjutan.

Tujuan lawan adalah membuat tugas baru hanya pada ambang kemampuan solusi saat ini, dan tidak mudah atau tidak mungkin. Analis, pada gilirannya, semakin menyelesaikan tugas -tugas kompleks ini. Dalam komentar tertulis kepada VentureBeat, Chengsong Huang, rekan penulis makalah dan mahasiswa PhD di Washington University di Saint Lewis, menjelaskan bahwa dinamika ini sangat penting karena menghasilkan pertanyaan berkualitas tinggi seringkali lebih rumit daripada menemukan jawaban.

“Apa yang kami temukan di lingkungan yang praktis adalah bahwa tantangan terbesar adalah tidak menghasilkan jawaban … melainkan, menghasilkan pertanyaan berkualitas tinggi, novel, dan secara bertahap lebih sulit,” kata Huang. “Kami percaya bahwa guru yang baik jarang terjadi dari siswa yang baik. Dinamika evolusi bersama diotomatisasi oleh penciptaan” guru “ini, memastikan kurikulum tetap dan dinamis yang mendorong Solver sebagian besar dapat dicapai dengan apa yang dapat dicapai oleh set data yang tetap dan pra -sekarang.

Setelah Challenger membuat pertanyaan yang cukup, mereka dinominasikan untuk keragaman dan dikumpulkan dalam kumpulan data pelatihan. Dalam tahap pelatihan di Solver, disita pada pertanyaan -pertanyaan sulit ini. Jawaban “benar” ditentukan untuk setiap pertanyaan dengan suara mayoritas dari upaya sebelumnya ke Jalfar.

Seluruh proses ini diulangi, yang mengarah pada penciptaan loop peningkatan diri yang bekerja tanpa intervensi manusia, memungkinkan kedua model untuk saling mendorong untuk menjadi lebih mampu untuk setiap pengulangan.

R-Zero di tempat kerja

Para peneliti R-Zero telah menguji beberapa LLM open source, termasuk model keluarga Qwen3 dan Octothhinker. Mereka pertama kali melatih model tentang masalah matematika dan kemudian menguji apakah keterampilan berpikir yang dipelajari dapat diedarkan ke standar kompleks lainnya seperti bidang publik Mmlu-for (Berbagai tugas pemahaman dan pemahaman) dan Supergpqa (Tugas Sains dan Logika).

Hasil penelitian menunjukkan bahwa R-Zero adalah kerangka kerja yang sangat efektif, model. Misalnya, QWEN3-4B telah memperkuat basis dengan rata-rata +6,49 melalui standar pemikiran matematika. Proses pelatihan terus -menerus dan sangat kinerja, dengan keuntungan terakumulasi pada banyak pengulangan. Model QWEN3-8B-base terbesar melihat poin matematika rata-rata sebesar +5,51 poin setelah tiga pengulangan.

Hasil utama adalah lompatan kinerja langsung setelah pengulangan pertama, yang telah valid dalam efektivitas peran lawan dalam menciptakan kurikulum pendidikan berkualitas tinggi. “Ini menegaskan bahwa kurikulum pintar yang dibuat oleh saingannya RL secara signifikan lebih efektif daripada yang bukan trainer,” tulis para peneliti dalam makalah mereka.

Perlu dicatat bahwa keterampilan yang dipelajari dari masalah matematika telah secara efektif ditransfer ke tugas pemikiran umum, sehingga meningkatkan kemampuan model dasar. Sebagai contoh, model base QWEN3-4B menunjukkan dirinya peningkatan +7,54 pada kriteria untuk berpikir dalam domain publik. Penemuan lain yang menarik adalah bahwa R-Zero dapat berfungsi sebagai langkah yang menentukan sebelum pelatihan. Model-model yang pertama kali ditingkatkan oleh R-Zero telah membuat kinerja yang lebih tinggi ketika mereka kemudian mengaturnya pada data tradisional, menunjukkan bahwa bingkai berfungsi sebagai penguat kinerja.

Untuk lembaga, pendekatan “nol data” dapat menjadi perubahan untuk permainan, terutama di bidang khusus di mana data berkualitas tinggi jarang atau tidak ada. Huang menyoroti bahwa fitur utama R-Zero adalah kemampuannya untuk menghindari bagian yang paling mahal dan membutuhkan waktu lama untuk mengembangkan kecerdasan buatan: aktivasi data.

Dia mengatakan: “Pendekatan kami melebihi leher botol dasar karena harus menemukan kelompok data berkualitas tinggi, memberi nama dan mengklasifikasikannya.” “Ini tidak hanya terkait dengan skala untuk menghemat biaya; ini adalah jalan menuju menciptakan kecerdasan buatan yang dapat melampaui kemampuan manusia, karena tidak lagi terbatas dalam ruang lingkup pengetahuan atau data manusia.”

Namun, proses evolusi bersama juga mengungkapkan tantangan yang menentukan. Karena Challenger menghasilkan masalah yang lebih sulit, kemampuan Solver untuk menghasilkan jawaban “benar” yang andal melalui suara mayoritas mulai berkurang. Para peneliti menemukan bahwa keakuratan sebenarnya dari stiker yang dibuat sendiri ini menurun dari 79 % dalam pengulangan pertama menjadi 63 % di ketigaDibandingkan dengan Oracle LLM yang kuat seperti GPT -4. Penurunan kualitas data ini merupakan perbandingan utama dan sebotol kinerja jangka panjang yang mungkin.

Huang mengakui bahwa ini adalah masalah penting untuk model pengembangan diri. Dia mengatakan: “Pekerjaan kami adalah bukti konsep yang mengklarifikasi potensi pendekatan ini, tetapi kami mengakui bahwa mempertahankan peningkatan yang stabil dalam jangka panjang tanpa dataran tinggi adalah hambatan yang hebat.” “Memecahkan masalah ini akan menjadi langkah berikutnya yang menentukan bagi seluruh komunitas riset.”

Para peneliti juga menyoroti pembatasan utama bingkai: mekanisme saat ini adalah yang paling tepat untuk bidang seperti matematika di mana kesehatan dapat ditentukan secara objektif. Jadi, bagaimana model yang kuat ini dapat meluas ke lebih banyak tugas institusional seperti membuat versi pemasaran atau meringkas laporan?

Huang menyarankan bahwa rute potensial mencakup penambahan agen Amnesty International tingkat lanjut ke campuran: “expier” atau “kritikus”.

“Alih -alih evaluasi untuk jawaban” benar “yang sederhana, verifikasi ini akan dilatih untuk mengevaluasi kualitas solusi solusi berdasarkan kriteria yang lebih akurat,” jelasnya. “Dinamika evolusi bersama kemudian akan memasukkan penciptaan Callinger, solusi yang menghasilkan respons, dan verifikasi yang memberikan sinyal kualitas, dengan ketiga model meningkat bersama.”

Meskipun ini tetap menjadi arah untuk penelitian di masa depan, ini menunjukkan masa depan di mana sistem kecerdasan buatan sepenuhnya dikuasai dapat menguasai logika objektif, tetapi juga berpikir sendiri.


Tautan sumber
Continue Reading

Trending