Connect with us

Berita

Microsoft meluncurkan phi-4-rasing-plus, model kecil, kuat, terbuka dan terbuka!

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Microsoft Research Itu mengumumkan rilis phi-4-rasing-plusModel bahasa kelas terbuka dirancang untuk tugas yang membutuhkan pemikiran yang mendalam dan terorganisir.

Bergantung pada struktur PHI-4 yang dirilis sebelumnya, model baru menggabungkan subjek pembelajaran untuk pengawasan dan penguatan untuk memberikan peningkatan kinerja pada standar dalam tugas matematika, sains, pengkodean dan logika.

PHI-4-Rasning-plus adalah model konverter yang padat dari 14 miliar pengkodean hanya mengkonfirmasi kualitas pada skala. Pelatihannya termasuk 16 miliar simbol-8,3 miliar dari mereka data buatan yang unik dan kelompok kecerdikan di Internet.

Tahap Pembelajaran Penguatan (RL), menggunakan sekitar 6400 masalah yang berfokus pada matematika, menyempurnakan kemampuan berpikir khas.

Model ini dirilis di bawah a Institut Teknologi Massachusetts -Sables Penggunaan aplikasi komersial dan institusi luas, kontrol atau distilasi, tanpa pembatasan-yang kompatibel dengan kerangka kerja inferensi yang digunakan secara luas termasuk merangkul transformator wajah, VLM, LLAMA.CP, dan Ollama.

Microsoft memberikan rekomendasi terperinci tentang parameter inferensi dan mengoordinasikan permintaan sistem untuk membantu pengembang mendapatkan manfaat maksimal dari model.

Itu melampaui model yang lebih besar

Pengembangan model mencerminkan peningkatan konsentrasi Microsoft pada pelatihan model yang lebih kecil yang mampu bersaing dengan sistem kinerja yang jauh lebih besar.

Meskipun ukurannya yang relatif sederhana, phi-4-rasioning-plus melebihi model yang lebih besar dengan bobot terbuka seperti Deepseek-R1-Distill-70B pada sejumlah standar yang sulit.

Dalam tes matematika AIME 2025, misalnya, akurasi rata-rata yang lebih tinggi ditawarkan untuk lulus semua tiga puluh pertanyaan dalam upaya pertama (pencapaian yang dikenal sebagai “lulus@1”) dari model distilasi pengemudi 70B, dan mendekati kinerja Deepseek-R1 itu sendiri, yang jauh lebih besar dalam parameter 671B.

Pemikiran terorganisir dengan pengaturan

Untuk mencapai hal ini, Microsoft menggunakan strategi pelatihan yang berfokus pada data.

Selama fase kontrol pengawasan, model ini dilatih menggunakan campuran terkoordinasi dari pemikiran sintetis yang luar biasa dan tuntutan berkualitas tinggi.

Ada salah satu inovasi utama dalam pendekatan pelatihan adalah penggunaan output pemikiran terorganisir dengan tanda khusus Dan Simbol.

Ini adalah model untuk memisahkan langkah -langkah berpikir medium dari jawaban akhir, yang meningkatkan transparansi dan kohesi dalam menyelesaikan masalah yang lama.

Belajar penguatan untuk akurasi dan kedalaman

Setelah penyesuaian kinerja, Microsoft telah menggunakan pembelajaran berbasis hasil secara spesifik, RPO Improvement Algorithm (GRPO)-untuk meningkatkan akurasi dan efisiensi output model.

Fungsi hadiah RL dirancang untuk mencapai keseimbangan antara hak dengan realisme, menghukum pengulangan, dan memaksakan konsistensi koordinasi. Hal ini menyebabkan tanggapan yang lebih lama tetapi lebih berpikir, terutama pada pertanyaan di mana model awalnya tidak memiliki kepercayaan diri.

Pembatasan penelitian dan rekayasa yang lebih baik

PHI-4-RASING-PLUS bertujuan untuk digunakan dalam aplikasi yang mendapat manfaat dari pemikiran berkualitas tinggi di bawah batasan memori atau jintan. Ini mendukung konteks konteks 32.000 secara default dan menunjukkan kinerja yang stabil dalam pengalaman 64.000 simbol.

Lebih baik menggunakannya dalam persiapan seperti obrolan dan mengarah secara optimal dengan sistem sistem yang secara eksplisit membimbingnya ke pikiran melalui masalah selangkah demi selangkah sebelum memberikan solusi.

Pedoman Uji dan Penggunaan Keselamatan yang Luas

Microsoft memainkan formulir sebagai pencari dan komponen IQ Insteract alih -alih menyelesaikan proyeksi semua tugas muara.

Pengembang disarankan untuk mengevaluasi dengan cermat kinerja, keamanan dan keadilan sebelum menerbitkan model dalam risiko tinggi atau lingkungan terorganisir.

PHI-4-RASING-PLUS telah mengalami evaluasi keselamatan intensif, termasuk kemenangan merah oleh tim tim merah Microsoft AI dan standar dengan alat-alat seperti Toxigen untuk mengevaluasi tanggapan mereka melalui kategori konten sensitif.

Menurut Microsoft, versi ini menunjukkan bahwa melalui teknologi data dan teknologi pelatihan yang terkoordinasi dengan cermat, model kecil dapat memberikan kinerja logis yang kuat – akses demokratis terbuka ke boot.

Di bawah ini adalah versi revisi dari departemen antik yayasan dengan nada yang lebih teknis yang mirip dengan berita, sejalan dengan pos teknologi bisnis:

Efek dari pembuat keputusan teknis dari lembaga

Versi phi-4-rasing-plus dapat memberikan peluang yang signifikan bagi para pemangku kepentingan teknisi bagi lembaga yang mengelola pengembangan model kecerdasan buatan, kebetulan atau infrastruktur data.

Untuk insinyur intelijen buatan dan model manajer siklus hidup, ukuran parameter 14B model menawarkan kinerja standar kompetitif pilihan yang berlaku untuk pemikiran kinerja tinggi tanpa persyaratan infrastruktur untuk model yang jauh lebih besar. Ini memberikan kompatibilitas dengan kerangka kerja seperti Hugging Facial, VLM, Llama.cpp dan Ollama Adapters melalui cerobong asap dari berbagai lembaga, termasuk lingkungan tanpa alas kaki dan server.

Anda mungkin menemukan tim yang bertanggung jawab untuk menerbitkan model pembelajaran otomatis dan memperluas ruang lingkup dukungan mereka untuk model 32k-Ukeen-Can mencapai 64.000 dalam tes khusus dalam kasus penggunaan berat seperti analisis hukum, jaminan kualitas teknis atau pemodelan keuangan. Struktur terpadu pemisahan rantai berpikir dari jawaban akhir juga dapat menyederhanakan integrasi ke dalam fasad di mana penjelasan atau pengawasan diperlukan.

Untuk tim intelijen yang cerdas, PHI-4-eracting-plus menawarkan struktur khas yang dapat lebih mudah dibakar dalam jaringan pipa dengan pembatasan sumber daya. Ini terkait dengan skenario di mana pemikiran harus terjadi pada waktu yang sebenarnya di bawah pembatasan jintan atau biaya. Kemampuannya untuk menggeneralisasi masalah domain, termasuk NP, seperti 3SAT dan TSP, menunjukkan manfaat dalam perencanaan algoritma dan menggunakan dukungan keputusan dengan cara yang secara eksplisit melebihi yang ditargetkan selama pelatihan.

Utas rekayasa data juga dapat mempertimbangkan koordinasi pemikiran dalam model-desainer untuk mencerminkan langkah-langkah untuk menyelesaikan masalah menengah–mekanisme untuk melacak konsistensi logis melalui urutan panjang data terorganisir. Format output terstruktur dapat digabungkan menjadi lapisan verifikasi kesehatan atau sistem pendaftaran untuk mendukung klarifikasi data yang kaya data.

Dari sudut pandang tata kelola dan keselamatan, phi-4-eracting-plus mencakup beberapa lapisan keselamatan setelah pelatihan dan menjalani tes agresif oleh Microsoft International AI Red. Untuk organisasi yang tunduk pada persyaratan kepatuhan atau pengawasan, ini dapat mengurangi pengeluaran umum untuk mengembangkan fungsi penyelarasan yang dialokasikan dari titik nol.

Secara umum, PHI-4-Plus menjelaskan bagaimana kegilaan logika dimulai oleh serangkaian “O” Openai dan Deepseek R1 terus mempercepat model dan pindah ke model yang lebih kecil dan lebih mudah dan harganya terjangkau dan disesuaikan.

Untuk teknisi yang bertanggung jawab atas manajemen kinerja, ekspansi, biaya, dan risiko, ia memberikan alternatif normatif dan dapat ditafsirkan yang dapat dievaluasi dan diintegrasikan dengan basis yang fleksibel-apakah pada akhir penalaran terisolasi, alat ringkas atau sistem AI generasi penuh.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Pemimpin Keamanan Kehilangan Kejelasan Saat Penasihat Menerbitkan AI Copilots Shades to Stay Workers

Published

on


Karena takut akan operasi demobilisasi yang komprehensif yang dipimpin oleh kecerdasan dan otomatisasi buatan, konsultan elit menggunakan warna AI untuk mendapatkan keunggulan kompetitif. Baca selengkapnya

Tautan sumber

Continue Reading

Berita

Besper mengalahkan Nix untuk mencapai final Liga Profesional Amerika dengan Kitlene Clark di hadapan

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

Indiana Pesrez akan pergi ke final Liga Profesional Amerika setelah kekalahan New York Nix di Final Wilayah Timur, dan mereka memiliki penggemar tenda untuk hadir untuk melihat semuanya turun.

WNBA Phenom Caitlin Clark Courtside duduk selama kemenangan Paces 125-108 6, bersama dengan rekan satu timnya di Indiana Sophie Cunningham dan Aliyah Boston.

Klik di sini untuk lebih banyak liputan olahraga di foxnews.com

Striker New York Nix Michal Bridges (25) sedang mempelajari bola yang dipertahankan oleh Indiana Besterss Teres Haleporton (0) pada kuarter ketiga selama pertandingan keenam Konferensi Timur di kualifikasi untuk tahun 2025 di Liga Profesional Amerika di Genbridge Fieldos. (Imagn)

Clark saat ini terpinggirkan oleh demam karena cedera quad, tetapi mempertahankan atlet yang mantap di kancah bola basket di Indianapolis selama ketidakhadirannya.

Clark adalah tamu yang tidak disengaja di Paces Games sejak dia memulai karirnya di WNBA di Indiana tahun lalu, dan dia telah mengembangkan persahabatan yang kuat dengan Bintang Paces Tyrese Haliburton. Haliburton membantu memimpin tim paces pada kemenangan hari Sabtu dengan kinerja 21 poin dan 13 poin, sementara Pascal Siakam mencetak 31 poin.

Tim Pacers sekarang sempurna 7-0 dalam permainan yang dihadiri Clark sebagai penggemar.

Petir Gelgos-Alexander memenangkan kehidupan profesional pertama di American Professional League MVP

Pusat New York Nix Mitchell Robinson (23) memakai pertempuran sepak bola melawan Indiana Pesrez Pascal Siamie (43) dan Central Miles Turner (33 tahun) pada kuarter ketiga selama pertandingan keenam Wilayah Timur di kualifikasi di Liga Profesional Amerika 2025 di Genbridge Midal.

Pusat New York Nix Mitchell Robinson (23) memakai pertempuran sepak bola melawan Indiana Pesrez Pascal Siamie (43) dan Central Miles Turner (33 tahun) pada kuarter ketiga selama pertandingan keenam Wilayah Timur di kualifikasi di Liga Profesional Amerika 2025 di Genbridge Midal. (Imagn)

Setelah tim Pacers kembali dari 14 poin dalam tiga menit terakhir dari seri pertama dari seri, Clark mengirim posting meriah di buku “Pacers adalah tim Odeh terbesar yang belum pernah terjadi sebelumnya.” Kemudian saya menerbitkan posting yang meriah setelah pertandingan hari Sabtu.

Sekarang, Anda akan menyaksikan tim bersaing melawan Oklahoma City Thunder untuk mendapatkan kesempatan di Kejuaraan Liga Profesional Amerika.

Klik di sini untuk mendapatkan aplikasi Fox News

Striker New York Nix Michal Bridges (25) sedang mempelajari bola yang dipertahankan oleh Indiana Besterss Teres Haleporton (0) pada kuarter ketiga selama pertandingan keenam Konferensi Timur di kualifikasi untuk tahun 2025 di Liga Profesional Amerika di Genbridge Fieldos.

Striker New York Nix Michal Bridges (25) sedang mempelajari bola yang dipertahankan oleh Indiana Besterss Teres Haleporton (0) pada kuarter ketiga selama pertandingan keenam Konferensi Timur di kualifikasi untuk tahun 2025 di Liga Profesional Amerika di Genbridge Fieldos. (Imagn)

Sementara itu, Knicks akan pergi ke musim eksternal dengan daftar panjang “What -ifs” setelah meniup 14 poin di Game 1 dan kehilangan kesempatan untuk mencapai final. Nix mencapai final konferensi untuk pertama kalinya sejak tahun 2000 tahun ini.

Digital Fox News Cakupan Olahraga di X, Dan berlangganan Newsletter Fox News Sport Hold.



Tautan sumber

Continue Reading

Berita

Kurang dari itu: Studi Meta menunjukkan bahwa pemikiran yang lebih pendek meningkatkan keakuratan kecerdasan buatan sebesar 34 %

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Meta Peneliti Tim yang adil Dan Universitas Ibrani Yerusalem Mereka menemukan bahwa memaksa model bahasa besar untuk “berpikir” kurang benar -benar meningkatkan kinerja mereka dalam tugas berpikir yang kompleks.

itu Tiket Hari ini saya menemukan bahwa proses berpikir yang lebih pendek dalam sistem kecerdasan buatan menghasilkan hasil yang lebih akurat sementara secara signifikan mengurangi perhitungan.

“Dalam pekerjaan ini, kami menantang asumsi bahwa rantai berpikir panjang mengarah pada kemampuan berpikir yang lebih baik,” tulis penulis dalam makalah mereka yang berjudul.Jangan memikirkannya. Rantai favorit pemikiran pendek untuk meningkatkan pemikiran di llm

Penelitian ini kontras dengan tren yang berlaku dalam mengembangkan kecerdasan buatan, karena perusahaan telah berinvestasi secara luas dalam meningkatkan sumber daya komputasi untuk memungkinkan bahan melakukan pemikiran luas melalui panjang.Rantai berpikir-Tep langkah demi langkah jalur yang digunakan oleh sistem kecerdasan buatan untuk memecahkan masalah yang kompleks.

Resolusi kecerdasan buatan melonjak sebesar 34 % ketika model menggunakan rantai berpikir yang lebih pendek

Para peneliti menemukan bahwa dalam tugas berpikir yang sama, “Luxor Thinking Chains cenderung menghasilkan jawaban yang tepat – hingga 34,5 % lebih akurat daripada serangkaian sampel terpanjang dari mereka untuk pertanyaan yang sama.” Penemuan ini benar melalui beberapa model perintis dan standar Amnesty International.

“Sambil menunjukkan hasil yang mengesankan, (pemikiran luas) memiliki biaya matematika yang luar biasa dan waktu penalaran,” kata penulis, mencatat inefisiensi hebat dalam bagaimana sistem ini sedang diterbitkan.

Berdasarkan hasil ini, tim mengembangkan pendekatan baru yang disebut “Pendek m@k“Siapa yang melakukan beberapa upaya pemikiran secara paralel, tetapi menghentikan akun segera setelah beberapa operasi pertama selesai. Kemudian jawaban akhir dipilih melalui suara mayoritas antara rantai yang lebih pendek ini.

Metode baru ‘Short-M@K’ mengirimkan biaya komputasi sebesar 40 % dengan peningkatan kinerja

Untuk institusi yang menerbitkan sistem berpikir pria besar, efeknya bisa besar. Para peneliti menemukan bahwa metode mereka dapat mengurangi sumber daya aritmatika hingga 40 % sambil mempertahankan tingkat yang sama dengan metode standar.

“Pendek 3@K, meskipun sedikit kurang efisien daripada pendek 1@K, pemungutan suara mayoritas terus -menerus melebihi semua anggaran matematika, sementara itu sebagian besar masih lebih cepat (hingga 33 % dari waktu dinding),” kata kertas itu.

Michael Hasid, penulis utama makalah ini, dan timnya menemukan bahwa melatih model kecerdasan buatan pada contoh -contoh pemikiran yang lebih pendek meningkatkan kinerjanya – tantangan asumsi dasar lainnya dalam mengembangkan kecerdasan buatan.

Para peneliti menulis: “Pelatihan Luxor mengarah pada kinerja yang lebih baik,” tulis para peneliti. “Sebaliknya, tiroiditis pada S1 meningkatkan waktu berpikir dengan kurangnya keuntungan yang signifikan dalam kinerja.”

Raksasa teknologi dapat menghemat jutaan orang dengan menerapkan pendekatan “jangan pikirkan tentang itu”

Hasilnya datang dalam waktu yang penting bagi industri kecerdasan buatan, karena perusahaan berlomba untuk menyebarkan model kuat yang mengkonsumsi sumber daya matematika yang sangat besar.

“Hasil yang telah kami capai merujuk untuk memikirkan kembali metode menghitung waktu tes dalam memikirkan LLM, sambil menekankan bahwa semakin lama” pemikiran “tidak selalu diterjemahkan menjadi peningkatan kinerja dan dapat, secara tidak tepat, mengarah pada hasil yang memburuk.

Penelitian ini bertentangan dengan kebalikan dari metode terkemuka lainnya. Studi berpengaruh sebelumnya, termasuk karya Openai tentang “Thought Series” dan “Konsistensi diri“Metode, umumnya menyerukan pemikiran yang paling komprehensif. Itu juga tergantung pada pekerjaan terakhir seperti Princeton dan Google Deebind.”Ide“Frame dan Carnegie Mellon”Self -ReverseMetodologi, yang mengeksplorasi berbagai pendekatan terhadap logika kecerdasan buatan.

Untuk pembuat keputusan teknis yang mengevaluasi investasi kecerdasan buatan, penelitian ini menunjukkan bahwa perhitungan terbesar dan lebih banyak tidak selalu lebih baik. Studi ini menunjukkan kemungkinan penghematan biaya dan meningkatkan kinerja dengan meningkatkan efisiensi daripada kekuatan komputasi mentah.

Dalam industri yang diperluas, ternyata mengajar kecerdasan buatan lebih singkat tidak hanya untuk memberikan kekuatan komputasi – itu membuat mesin lebih cerdas. Terkadang, bahkan kecerdasan buatan mendapat manfaat dari kebijaksanaan kuno: jangan memikirkannya.


Tautan sumber
Continue Reading

Trending