Berita

Deepsek R1-0528 Mencapai tantangan open source yang kuat untuk Openai O3 dan Google Gemini 2.5 Pro

Published

4 minggu ago

Mei 29, 2025

Wadi Wibowo

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut

Paus itu kembali.

Setelah mengguncang kecerdasan buatan global dan komunitas bisnis awal tahun ini dengan versi awal pada 20 Januari dari sumber terbuka sumber logis AI Model R1, perusahaan startup China Deepseek Company-yang merupakan bulat dari perusahaan Hong Kong yang dikenal di masa lalu, hanyalah pembaruan besar dari manajer Canmantive Hong Kong Gemini 2.5 Pro.

Pembaruan ini dirancang untuk memberikan kinerja yang lebih kuat dalam tugas -tugas berpikir kompleks dalam matematika, sains, bisnis dan pemrograman, serta fitur -fitur yang lebih baik dari pengembang dan peneliti.

Seperti pendahulunya, Deepseek-R1-0528 tersedia di bawah Lisensi Institut Massachusetts untuk Biaya dan BukaMendukung penggunaan komersial dan memungkinkan pengembang untuk mengalokasikan model untuk kebutuhan mereka.

Bobot sumber terbuka Tersedia melalui Masyarakat Kode Kode Kecerdasan Buatan Kode WajahDokumen terperinci diberikan kepada mereka yang diterbitkan secara lokal atau berintegrasi melalui API Deepsek.

Pengguna API Deepsek saat ini akan secara otomatis memperbarui kesimpulan model mereka ke R1-0528 tanpa biaya tambahan. Biaya saat ini untuk melawan aplikasi Deepseek

Bagi mereka yang ingin menjalankan model secara lokal, Deepseek memposting instruksi terperinci di gudang GitHub -nya. Perusahaan juga mendorong masyarakat untuk membuat catatan dan pertanyaan melalui layanan emailnya.

Pengguna individu dapat mencobanya secara gratis melalui Deepseek di web di sini, meskipun Anda perlu menyimpan nomor telepon atau mengakses akun Google untuk masuk.

Promosikan pemikiran dan kinerja standar

Di jantung pembaruan, ada peningkatan yang signifikan dalam kemampuan model untuk menangani tugas -tugas pemikiran yang sulit.

Depsek menjelaskan dalam kartu model barunya di Lugingface bahwa perbaikan ini berasal dari manfaat meningkatkan sumber daya matematika dan menerapkan algoritma pasca -pelatihan. Pendekatan ini telah menyebabkan perbaikan nyata melalui berbagai standar.

Dalam uji AIME 2025, misalnya, resolusi Deepsek-R1-0528 melonjak dari 70 % menjadi 87,5 %, menunjukkan proses berpikir yang lebih dalam sekarang rata-rata 23.000 ikon per pertanyaan dibandingkan dengan 12.000 pada versi sebelumnya.

Kinerja pengkodean juga telah melihat dorongan, dengan resolusi pada set data LiveCodebench dari 63,5 % menjadi 73,3 %. Dalam ujian “Humanity Last”, kinerja meningkat lebih dari dua kali, mencapai 17,7 % dari 8,5 %.

Perkembangan ini menempatkan Deepseek-R1-0528 lebih dekat dengan kinerja model yang berlaku seperti O3 Openai dan Gemini 2.5 Pro, menurut penilaian internal dan yang memiliki batasan rata-rata dan/atau memerlukan langganan berbayar untuk dicapai.

Promosi UX dan fitur baru

Selain peningkatan kinerja, Deepseek-R1-0528 memperkenalkan banyak fitur baru yang bertujuan untuk meningkatkan pengalaman pengguna.

Pembaruan ini menambah dukungan pada output JSON dan undangan pekerjaan, dan fitur yang seharusnya memudahkan pengembang untuk mengintegrasikan kemampuan model ke dalam aplikasi dan alur kerja mereka.

Kemampuan depan juga telah ditingkatkan, dan Deepseek mengatakan perubahan ini akan menciptakan reaksi yang lebih halus dan lebih efisien bagi pengguna.

Selain itu, tingkat halusinasi model telah berkurang, yang berkontribusi pada produksi yang lebih andal dan konsisten.

Salah satu pembaruan terkemuka adalah memasukkan klaim sistem. Berbeda dengan versi sebelumnya, yang membutuhkan simbol khusus di awal penyutradaraan untuk mengaktifkan mode “berpikir”, pembaruan ini menghilangkan kebutuhan ini, dan menyederhanakan publikasi pengembang.

Variabel yang lebih kecil dari mereka yang memiliki anggaran matematika terbatas

Selain versi ini, Deepseek mendistorsi logika pemikirannya dalam variabel yang lebih kecil, Deepseek-R1-0528-SWEN3-8B, yang akan membantu pembuat keputusan dan pengembang yang tidak memiliki perangkat yang diperlukan untuk berjalan penuh

Versi suling ini dikatakan memiliki kinerja baru-baru ini di antara model open source dalam tugas-tugas seperti AIME 2024, mengungguli QWEN3-8B sebesar 10 % dan pertandingan QWEN3-235B.

menurut penengahPengoperasian model bahasa besar adalah 8 miliar llm dalam setengah resolusi (FP16) sekitar 16 GB GPU, setara dengan sekitar 2 GB per miliar guru.

Oleh karena itu, unit pemrosesan grafis tunggal tinggi dengan setidaknya 16 GB VRAM, seperti NVIDIA RTX 3090 atau 4090, cukup untuk menjalankan 8b LLM dalam resolusi FP16. Untuk model yang lebih kuantitatif, unit pemrosesan grafis dapat digunakan dengan 8-12 GB VRAM, seperti RTX 3060.

Deepseek percaya bahwa model suling ini akan membuktikan bahwa ini berguna untuk aplikasi akademik dan aplikasi industri yang membutuhkan model yang lebih kecil.

Pengembang kecerdasan buatan pertama dan reaksi yang efektif

Pembaruan ini telah menarik perhatian dan pujian dari pengembang dan kekasih di media sosial.

Haydar, dijuluki “slow_developer“Umum untuk X bahwa Deepseek-R1-0528” luar biasa dalam pengkodean, “menggambarkan bagaimana saya membuat kode bersih dan tes kerja untuk menantang sistem perekaman kata, yang keduanya berada pada upaya pertama. Menurutnya, O3 hanya berhasil mencocokkan kinerja ini.

Selama, Publikasi lisan -Magic “Deepseek bertujuan pada King: O3 dan Gemini 2.5 Pro”, yang mencerminkan konsensus bahwa pembaruan baru mencoba model Deepseek lebih dekat dengan para seniman ini.

Berita lain tentang kecerdasan dan desas -desus buatan, berpengaruh, gemukDia berkomentar bahwa “Deepseek sedang memasak!” Yang paling menonjol dari bagaimana versi baru sama dengan O3 dan Gemini 2.5 Pro.

Bahkan Thuvena berspekulasi bahwa pembaruan R1 terakhir dapat mengindikasikan bahwa Deepseek sedang bersiap untuk melepaskan model perbatasan yang lama dan diasumsikan juga.

Kami melihat ke depan

Rilis Deepseek-R1-0528 menekankan komitmen Deepseek untuk menyediakan model kinerja tinggi sumber yang sangat terbuka yang memberikan prioritas pada inferensi dan kemudahan penggunaan. Dengan menggabungkan keuntungan standar dengan fitur-fitur praktis dan lisensi pemegang saham open source, Deepseek-R1-0528 ditempatkan sebagai alat yang berharga bagi pengembang, peneliti, dan penggemar yang ingin memanfaatkan kemampuan model bahasa terbaru.

Izinkan saya untuk mengetahui jika Anda ingin menambahkan lebih banyak kutipan, nada lebih banyak, atau menyorot elemen tambahan!

Visi harian tentang kasus penggunaan bisnis dengan VB setiap hari

Jika Anda ingin membujuk bos Anda di tempat kerja, Anda telah membahas VB setiap hari. Kami memberi Anda prioritas jurnalistik internal atas apa yang dilakukan perusahaan dengan kecerdasan buatan kebidanan, dari transformasi organisasi hingga operasi penerbitan praktis, sehingga Anda dapat berbagi visi pengembalian investasi maksimum.

Baca Kebijakan Privasi Kami

Terima kasih telah berlangganan. Periksa lebih banyak buletin VB di sini.

Terjadi kesalahan.

Tautan sumber

ridlwan.com

Berita

Deepsek R1-0528 Mencapai tantangan open source yang kuat untuk Openai O3 dan Google Gemini 2.5 Pro

Promosikan pemikiran dan kinerja standar

Promosi UX dan fitur baru

Variabel yang lebih kecil dari mereka yang memiliki anggaran matematika terbatas

Pengembang kecerdasan buatan pertama dan reaksi yang efektif

Leave a Reply

Leave a Reply

Trending

Promosikan pemikiran dan kinerja standar

Promosi UX dan fitur baru

Variabel yang lebih kecil dari mereka yang memiliki anggaran matematika terbatas

Pengembang kecerdasan buatan pertama dan reaksi yang efektif

Leave a Reply Batalkan balasan

Leave a Reply

Trending

Leave a Reply