Connect with us

Berita

Berapa informasi yang benar -benar menghafal LLMS? Sekarang kami tahu, terima kasih kepada Meta, Google, Nvidia dan Cornell

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Kebanyakan orang yang tertarik pada AI sudah tahu bahwa model bahasa besar (LLM) – seperti yang ada di belakang chatgpt, Claude’s Claude, dan Google Gemini – dilatih dalam koleksi data besar: triliun kata yang ditarik dari situs web, buku, pintu kode, semakin, dan mode lain seperti gambar, video dan video. Tapi kenapa?

Dari data ini, LLMS mengembangkan pemahaman statistik dan umum tentang bahasa dan polanya dan dunia – dienkripsi dalam bentuk miliaran parameter, atau “pengaturan”, dalam jaringan neuron buatan (yang merupakan fungsi matematika yang mengubah data input menjadi sinyal output).

Dengan paparan semua data pelatihan ini, LLMS belajar untuk menemukan dan menggeneralisasi pola yang tercermin dalam parameter sel saraf mereka. Misalnya, kata “apel” sering muncul di dekat istilah yang terkait dengan makanan, buah atau pohon, dan kadang -kadang komputer. Model mengambil bahwa apel bisa merah, hijau, atau kuning, atau bahkan kadang -kadang warna lain jika rusak atau langka, “apel” dalam bahasa Inggris, dan dimakan. Pengetahuan statistik ini memengaruhi bagaimana formulir merespons ketika pengguna memasuki seorang mentor – pembentukan output yang membuatnya berdasarkan tautan yang Anda “pelajari” dari data pelatihan.

Tetapi pertanyaan besar tetap ada – bahkan di antara para peneliti kecerdasan buatan -: berapa banyak data pelatihan LLM yang digunakan untuk konstruksi Digeneralisasi Representasi konsep, dan seberapa banyak itu menyimpan Secara harfiah atau dengan cara yang identik atau hampir identik dengan data asli?

Ini penting tidak hanya untuk lebih memahami cara kerja LLMS – dan ketika mereka membuat kesalahan – tetapi juga sebagai model, mereka mempertahankan diri dalam mengklaim hak cipta yang disajikan oleh pencipta data dan pemiliknya, seperti seniman dan tanda -tanda rekaman. Jika ternyata LLMS untuk mereproduksi sebagian besar data pelatihan mereka secara harfiah, pengadilan mungkin lebih cenderung mendukung dengan jaksa penuntut yang membahas bahwa model yang telah disalin secara ilegal dari bahan yang dilindungi. Jika tidak – jika model ditemukan untuk membuat output berdasarkan pola umum alih -alih salinan simetris yang akurat – pengembang mungkin dapat melanjutkan pengikis dan pelatihan data hak cipta sehubungan dengan pertahanan hukum saat ini seperti penggunaan yang adil.

Sekarang, kami akhirnya memiliki jawaban untuk masalah perlindungan LLMS untuk generalisasi: Sebuah studi baru yang dikeluarkan minggu ini Dari para peneliti di Meta, Google DeepMind, Universitas Cornell dan Nvidia menemukannya Model yang mirip dengan GPT memiliki kapasitas hemat tetap sekitar 3,6 bit untuk setiap guru.

Untuk memahami apa arti 3,6 bit dalam praktik:

  • Satu bagian adalah unit data digital terkecil, mewakili 0 atau 1.
  • Penyimpanan 3.6 bit memungkinkan sekitar 12,13 nilai khas, sebagaimana dihitung oleh 2^3.6.
  • Itu datang ke jumlah informasi yang diperlukan untuk memilih salah satu dari 12 opsi seperti memilih sebulan dalam setahun atau sebagai hasil dari gulungan 12 aspek.
  • Dia – dia Tidak cukup untuk menyimpan bahkan satu bahasa Inggris (yang membutuhkan sekitar 4,7 bit), Tetapi cukup untuk menyembuhkan surat dari kelompok yang dikurangi dari 10 bahasa Inggris umum (yang membutuhkan sekitar 3,32 bit).
  • Dalam panel, 3,6 bit adalah 0,45 byte – kurang dari setengah ukuran huruf khas yang disimpan dalam ASCII (yang digunakan 8 bit atau 1 byte).

Jumlah ini tidak tergantung pada model dalam perbedaan arsitektur yang masuk akal: kedalaman yang berbeda, menampilkan, dan akurasi yang menghasilkan hasil yang sama. Perkiraan tetap stabil melalui ukuran model dan bahkan tingkat akurasi, dengan model akurasi penuh mencapai nilai yang sedikit lebih tinggi (hingga 3,83 bit/parameter).

Lebih banyak data pelatihan tidak mengarah pada lebih banyak hafalan – pada kenyataannya, itu akan menjadi formulir Lebih sedikit Untuk menyimpan satu titik data

Salah satu makanan utama pencarian adalah bahwa model tidak menghemat lebih banyak ketika mereka dilatih dalam lebih banyak data. Sebaliknya, kapasitas tetap model didistribusikan melalui kumpulan data, yang berarti bahwa setiap titik data individu kurang mendapat perhatian.

Jack Morris, penulis utama, Penjelasan melalui jejaring sosial x “Pelatihan tentang lebih banyak data akan memaksa model untuk menghemat lebih sedikit untuk setiap sampel.”

Hasil ini dapat membantu mengurangi kekhawatiran tentang model besar yang menjaga konten hak cipta atau sensitif.

Jika pelestarian terbatas dan dikurangi melalui banyak contoh, kemungkinan mengkloning setiap pelatihan spesifik berkurang. Intinya, lebih banyak data pelatihan mengarah pada perilaku generalisasi yang lebih aman, bukan peningkatan risiko.

Bagaimana para peneliti mengidentifikasi hasil ini

Untuk secara akurat menentukan jumlah model bahasa, para peneliti menggunakan pendekatan yang tidak konvensional tetapi kuat: Mereka melatih model transformator pada set data bitstings yang seragam. Sampel diambil dari masing -masing bit ini secara independen, memastikan bahwa tidak ada pola, struktur atau pengulangan melalui contoh.

Karena setiap sampel unik bebas dari fitur umum, yaitu, kemampuan untuk menunjukkan model dalam Mencerminkan rekonstruksi atau identifikasi rantai ini selama evaluasi secara langsung jumlah informasi yang mereka simpan – atau disimpanPelatihan.

Alasan utama untuk pengaturan ini sepenuhnya menghilangkan kemungkinan generalisasi. Berbeda dengan bahasa alami – yang penuh dengan struktur tata bahasa, gangguan semantik, dan konsep yang diulang – data acak tidak mengandung informasi tersebut. Setiap contoh terutama noise, tanpa hubungan statistik dengan hubungan lain. Dalam skenario seperti itu, kinerja apa pun harus datang sesuai dengan formulir pada data pengujian dari menghafal contoh pelatihan, karena kurangnya pola distribusi yang harus diedarkan dari.

Penulis berpendapat bahwa cara mereka mungkin Salah satu satu -satunya cara awal untuk memisahkan menghafal dari pembelajaran Dalam praktiknya, karena ketika LLMS dilatih dalam bahasa nyata, bahkan ketika hasil dihasilkan yang cocok dengan data pelatihan, sulit untuk mengetahui apakah Anda telah menyimpan input atau hanya menyimpulkan struktur dasar dari pola yang mereka perhatikan.

Metode ini memungkinkan para peneliti untuk menetapkan hubungan langsung antara jumlah parameter model dan total informasi yang disimpan. Dengan meningkatkan ukuran model dan melatih setiap variabel ke saturasi, melalui ratusan percobaan pada model mulai dari 500 kilo hingga 1,5 miliar guru, perhatikan hasil yang konsisten: 3.6 bit dicadangkan untuk setiap guruYang mereka laporkan sebagai ukuran dasar kapasitas memori LLM.

Tim menerapkan metodologinya pada model yang dilatih dalam koleksi data dunia nyata juga. Ketika pelatihan dalam teks, model menunjukkan keseimbangan antara menghafal dan generalisasi.

Koleksi data yang lebih kecil mendorong ukuran yang lebih besar, tetapi dengan meningkatkan ukuran kumpulan data, model telah beralih ke pola yang bersirkulasi. Transisi ini ditandai dengan fenomena yang dikenal sebagai “pendaratan ganda”, karena kinerja menurun sementara sebelum perbaikan segera setelah surat edaran ditendang.

Studi ini juga mempelajari bagaimana akurasi khas – pelatihan dalam bfloat16 versus float32 – mengarah pada kemungkinan pelestarian. Perhatikan peningkatan sederhana dari 3,51 menjadi 3,83 bit untuk setiap guru saat beralih ke resolusi 32 -bit penuh. Namun, keuntungan ini jauh lebih rendah daripada dua kali lipat bit yang tersedia yang menunjukkannya, yang berarti mengurangi pengembalian dari akurasi atas.

Data unik kemungkinan akan disimpan

Makalah ini mengusulkan undang -undang pembatasan yang terkait dengan kapasitas model dan ukuran data yang ditetapkan untuk secara efektif.

Serangan -serangan ini mencoba menentukan apakah titik data tertentu adalah bagian dari set pelatihan model. Penelitian menunjukkan bahwa serangan semacam itu menjadi tidak dapat diandalkan dengan pertumbuhan kumpulan data, yang mendukung argumen yang secara luas membantu mengurangi risiko privasi.

Sementara makalah ini berfokus pada perilaku Negara Bagian Tengah, beberapa peneliti telah mengindikasikan bahwa jenis data tertentu-seperti menulis yang sangat unik atau logis-masih lebih mungkin dilestarikan.

Para penulis mengakui pembatasan ini dan menekankan bahwa cara mereka dirancang untuk mengkarakterisasi tren publik alih -alih kasus tepi.

Bergerak menuju pemahaman manusia yang lebih besar tentang pemahaman LLM

Dengan memberikan definisi awal dan terukur, penelitian ini memberi pengembang dan peneliti alat baru untuk menilai perilaku model bahasa. Ini tidak hanya dengan transparansi yang khas, tetapi juga dengan kepatuhan, privasi dan standar moral dalam mengembangkan kecerdasan buatan. Hasilnya menunjukkan bahwa lebih banyak data-tidak kurang mungkin menjadi jalur paling aman ketika model bahasa dilatih secara luas.

Untuk menempatkan total bentuk bentuk dalam perspektif:

  • Model parameter dapat menghemat 500 km sekitar 1,8 juta bit, atau 225 kilo data.
  • Model parameter dapat berisi 1,5 miliar pada sekitar 5,4 miliar bit, atau 675MB informasi awal.
  • Tidak dapat dibandingkan dengan menyimpan file model seperti gambar (misalnya, gambar 3,6MB adalah sekitar 30 juta bit), tetapi penting ketika didistribusikan melalui pola teks yang terpisah.

Saya bukan pengacara atau ahli hukum, tetapi saya berharap penelitian semacam itu disebutkan dalam banyak tuntutan hukum yang berkelanjutan antara penyedia kecerdasan buatan dan pencipta/pemegang hak data.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Barry Morveio mempertahankan paten untuk pembunuhan kelas pertama dari istri: pengacara

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Pengacara Barry Morefio mengatakan kliennya “mempertahankan kepolosannya” setelah Murvio menuduh kematian kelas pertama atas kematian istrinya, Suzanne Morvio.

Dia ditangkap di dekat Veniz, Arizona, pada hari Jumat, setelah juri besar dituduh diduga membunuh istrinya, yang menghilang selama perjalanan sepeda Hari Ibu.

“Dia mempertahankan kepolosannya,” kata pengacara Murvio, David Biller, kepada Fox News Digital Morphew.

“Sekali lagi, pemerintah mengizinkan kesimpulan yang telah ditentukan sebelumnya untuk memimpin pencarian mereka untuk bukti,” kata Biller. “Kasus ini tidak berubah, dan hasilnya juga tidak akan berubah.”

Sisa -sisa Colorado kehilangan ibuku, Susan Morpio, ditemukan setelah tiga tahun menghilang

Suzan Morveio dan Barry Morveio (Kantor Sharif Shafi County dan Kantor Sharif Marikuba County)

Sisa -sisa Suzan Murphyo ditemukan oleh Biro Colorado pada tahun 2023 di provinsi Sagawash di bagian barat daya negara bagian.

Barry Morveio ditahan di penjara di Provinsi Mariakoba, Arizona, sementara ia diharapkan akan dikirim ke Colorado.

“Pengabaian,” kata Murvio di pengadilan ketika dia ditanya apakah dia menginginkan sesi pengiriman.

Menurut salinan peraturan tuduhan dewan juri, banyak tulang Susan Morveio ditemukan “sangat diputihkan” ketika jenazahnya ditemukan pada tahun 2023. Menurut dakwaan, jaksa penuntut mengatakan “tidak mungkin” bahwa tubuhnya akan membusuk menjadi kerangka di lokasi yang ditemukan.

Barry Morveio dituduh oleh dewan juri yang diduga membunuh istri yang menghilang pada Hari Ibu

Pasangan Colorado Barry Susan Morvio

Barry Morefio dituduh membunuh istrinya, Susan Morphyo. (AP)

Jaksa penuntut mengatakan bahwa bahan kimia yang meliputi Potorfanol, Azabiron dan Metomedin (BAM) ditemukan di dalam tubuh Susan Morpio. Menurut dakwaan, Barry Morefio menggunakan “BAM” sebagai ketenangan untuk membius dan mentransfer rusa Rusa.

Membaca Dakwaan

Sepeda Susan Morveio ditemukan pada hari ketika menghilang pada tahun 2020 di sepanjang lembah di sepanjang jalan raya ke -50 dan 225 provinsi di Kabupaten Shafi. Pada waktu itu, Barry Morveio bekerja di Bromfield, Colorado.

Pesan tekstual yang dipertukarkan antara Barry Morveio dan Susan Morphyo menunjukkan hubungan sebelum dia melewatkannya.

Empat hari sebelum dia menghilang, Susan Morveio mengirim pesan teks yang dia katakan “selesai.”

“Saya bisa peduli dengan apa yang Anda jangkau dan apa yang telah saya lakukan selama bertahun -tahun,” katanya, menambahkan bahwa mereka membutuhkan “Kodley” untuk menemukan sesuatu.

Klik di sini untuk mendapatkan aplikasi Fox News

Barry Morveio di pengadilan

Dalam gambar video yang tetap ini, Barry Morveio, sebuah pusat, muncul di pengadilan di Salida, Colorado, 6 Mei. (Kusa via AP, kolam renang)

Barry Morpio mengajukan gugatan $ 15 juta pada tahun 2023 terhadap jaksa penuntut dan penyelidik, mengklaim bahwa mereka telah melanggarnya Hak konstitusional.

“Barry adalah yang paling banyak diperiksa, anatomi, dan otopsi, akurat, sepanjang waktu, menggunakan kamera penegak hukum bahwa rumahnya, tap telepon dan perangkat GPS ditempatkan di mobilnya – semua selama garis waktu lenyap dan tahun -tahun berikutnya,”

Di bawah Konklin di Audrey News berkontribusi pada laporan ini.

Tautan sumber

Continue Reading

Berita

Untuk CEO Replit, masa depan program ini adalah “Agen di sepanjang jalan”

Published

on


Agen repray dapat membantu merancang dan mengkodifikasi aplikasi hanya dalam 15 menit, menunjukkan pengkodean getaran.

Tautan sumber

Continue Reading

Berita

Eksekutif Doordash adalah salah satu dari 8 korban di Danau Tahoe, tragedi kapal kudeta

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Pihak berwenang mengeluarkan identitas para korban Mereka yang kehilangan nyawa mereka Ketika sebuah kapal berbalik dalam liburan terkenal di California.

Salah satu korban adalah Joshua Picks, 37, yang menjabat sebagai kepala kursus global untuk sumber -sumber strategis dan pembelian dalam tim pembiayaan, menurut perusahaan.

“Kami sedih dengan kecelakaan tragis yang mengambil nyawa kolega kami yang tercinta, Josh Bekls,” sebuah pernyataan dari Dordsh yang dikirim ke Fox News Digter Reed.

“Josh mencintai timnya dan merupakan inspirasi bagi semua orang yang memiliki hak istimewa atas pengetahuannya. Selama hampir tujuh tahun di Dordsh, dia membawa semangat menular yang mengangkat orang -orang di sekitarnya. Kehilangan Josh tidak diukur olehnya. Kami sangat merindukannya dan selalu membawa ingatannya bersama kami.”

MIT beberapa orang, 2 hilang setelah kapal lewat di hotline untuk liburan

Eksekutif Josh Pickles, The Center, Center, dan tiga anggota keluarga di antara orang mati setelah badai tiba -tiba di California selama akhir pekan. (Jordan Sugar Carlsgard)

Doordash mengatakan sedang berupaya mendukung keluarga acar “selama masa yang sangat sulit ini.”

“Pikiran dan cinta kami dengan istri, anak perempuan, keluarga dan semua yang dekat dengannya. Kami bekerja untuk mendukung mereka selama masa yang sangat sulit ini,” lanjut pernyataan itu.

Istri acar juga mengkonfirmasi kematian suaminya, bersama dengan banyak anggota keluarga lainnya.

“Kami telah kehilangan kekasih saya, Josh Bekls, orang tuanya, Terry Pixes, Paula Bouznovich, dan paman Peter Baiz, serta teman -teman dalam tragedi ini,” kata Jordan South Carlsard, janda Joshua Piclo, mengatakan dalam sebuah pernyataan.

Lebih dari 20 orang terluka setelah kapal di New York ditangkap; Dia menuduh Kapten dengan DWI

Paula Bouznovich mengatakan piknik itu adalah untuk merayakan ulang tahun ke -71 Joshua Picks.

Paula Bouznovich mengatakan piknik itu adalah untuk merayakan ulang tahun ke -71 Joshua Picks. (CoastGuard)

“Tidak ada kata -kata yang dapat mengungkapkan rasa sakit dan kesedihan bahwa kami merasa bahwa mengetahui hidup mereka telah hilang selama apa yang seharusnya menjadi waktu yang bahagia di danau. Hati kami keluar kepada mereka yang dengan tragis kehilangan nyawa mereka dan selamat dari badai yang tidak terduga dan mematikan di Danau Tahoe,” lanjut pernyataan itu.

Seorang juru bicara keluarga Pickles mengatakan kepada Fox News Digital bahwa piknik perahu adalah merayakan ulang tahunnya yang ketujuh puluh untuk ibuku Joshua Pickles, Paula Bouznovich.

Istri pickup menambahkan bahwa dia “sangat berterima kasih” atas semua bantuan yang dia terima dari responden pertama.

“Kami sangat berterima kasih kepada Penjaga Pantai Amerika, kantor El Doado Sharif County, penegak hukum dan agen pemadam kebakaran regional di Washo dan San Joakin, para penyelamat setempat, dan semua responden pertama dalam tegangan pencarian dan penyelamatan. Kami sangat berterima kasih untuk membantu mereka dalam situasi yang mengganggu,” baca pernyataan itu.

3 tewas, 9 hilang di dekat San Diego setelah mencuci perahu di pantai

Sebuah perahu berbalik di Danau Tahoe

Menurut apa yang dilaporkan, mangkuk emas Chris Kraft, yang panjangnya 27 kaki karena pembengkakan besar. (CoastGuard)

Departemen Hakim Investigasi di Kantor Provinsi Dorado Sharif mengatakan mereka “telah secara positif mengidentifikasi” para korban kecelakaan kapal yang tragis Di Danau Tahoe Ini terjadi pada hari Sabtu, 21 Juni.

Delapan korban diidentifikasi oleh pejabat sebagai berikut:

  • Paula Bouznovich, 71, dari Redwood, California
  • Terry Pickles, 73, dari Redwood City, California
  • Joshua Antony Pickles, 37, dari San Francisco
  • Peter Baise, 72, dari Lincoln, California
  • Timothy Olieri, 71, dari Uborn, California
  • Theresa Giurani, 66, dari Hunwi, New York
  • James Jock, 69, dari Hunwi, New York
  • Stephen Lindsay, 63, dari Spring Water, New York

“Kantor Dorado Sharif County memberikan belasungkawa terdalam kepada keluarga mereka yang tersesat dan semua yang terpengaruh oleh peristiwa tragis ini,” kantor Sharif berpartisipasi dalam pernyataan di halaman Facebook mereka.

Perwakilan mengatakan kepada Fox News Digital bahwa kondisi dua korban lainnya, yang identitasnya tidak ditentukan, tidak diketahui.

Klik di sini untuk mendapatkan aplikasi Fox News

Kecelakaan itu terjadi pada hari Sabtu pukul 3 sore lembaga penegak hukum, menerima laporan bahwa 10 orang ada di dalam air, Bayar Penjaga Pantai Untuk mengirim staf tanggapan ke daerah tersebut.

Menurut apa yang dilaporkan, mangkuk emas Chris Kraft, yang panjangnya 27 kaki karena pembengkakan besar.

Menurut Coast Guard, angin pada waktu itu sedikit lebih dari 34 mil per jam, dengan 6 hingga 8 kaki yang diperbesar.

Adam Sabs berkontribusi pada Fox News untuk laporan ini.

Stepheny Price adalah seorang penulis di Fox News Digital dan Fox Business. Ini mencakup topik termasuk orang hilang, pembunuhan, kasus kejahatan nasional, imigrasi ilegal, dan banyak lagi. Kiat dan ide cerita dapat dikirim ke stepheny.price@fox.com

Tautan sumber

Continue Reading

Trending