Connect with us

Berita

Deepsek R1-0528 Mencapai tantangan open source yang kuat untuk Openai O3 dan Google Gemini 2.5 Pro

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Paus itu kembali.

Setelah mengguncang kecerdasan buatan global dan komunitas bisnis awal tahun ini dengan versi awal pada 20 Januari dari sumber terbuka sumber logis AI Model R1, perusahaan startup China Deepseek Company-yang merupakan bulat dari perusahaan Hong Kong yang dikenal di masa lalu, hanyalah pembaruan besar dari manajer Canmantive Hong Kong Gemini 2.5 Pro.

Pembaruan ini dirancang untuk memberikan kinerja yang lebih kuat dalam tugas -tugas berpikir kompleks dalam matematika, sains, bisnis dan pemrograman, serta fitur -fitur yang lebih baik dari pengembang dan peneliti.

Seperti pendahulunya, Deepseek-R1-0528 tersedia di bawah Lisensi Institut Massachusetts untuk Biaya dan BukaMendukung penggunaan komersial dan memungkinkan pengembang untuk mengalokasikan model untuk kebutuhan mereka.

Bobot sumber terbuka Tersedia melalui Masyarakat Kode Kode Kecerdasan Buatan Kode WajahDokumen terperinci diberikan kepada mereka yang diterbitkan secara lokal atau berintegrasi melalui API Deepsek.

Pengguna API Deepsek saat ini akan secara otomatis memperbarui kesimpulan model mereka ke R1-0528 tanpa biaya tambahan. Biaya saat ini untuk melawan aplikasi Deepseek

Bagi mereka yang ingin menjalankan model secara lokal, Deepseek memposting instruksi terperinci di gudang GitHub -nya. Perusahaan juga mendorong masyarakat untuk membuat catatan dan pertanyaan melalui layanan emailnya.

Pengguna individu dapat mencobanya secara gratis melalui Deepseek di web di sini, meskipun Anda perlu menyimpan nomor telepon atau mengakses akun Google untuk masuk.

Promosikan pemikiran dan kinerja standar

Di jantung pembaruan, ada peningkatan yang signifikan dalam kemampuan model untuk menangani tugas -tugas pemikiran yang sulit.

Depsek menjelaskan dalam kartu model barunya di Lugingface bahwa perbaikan ini berasal dari manfaat meningkatkan sumber daya matematika dan menerapkan algoritma pasca -pelatihan. Pendekatan ini telah menyebabkan perbaikan nyata melalui berbagai standar.

Dalam uji AIME 2025, misalnya, resolusi Deepsek-R1-0528 melonjak dari 70 % menjadi 87,5 %, menunjukkan proses berpikir yang lebih dalam sekarang rata-rata 23.000 ikon per pertanyaan dibandingkan dengan 12.000 pada versi sebelumnya.

Kinerja pengkodean juga telah melihat dorongan, dengan resolusi pada set data LiveCodebench dari 63,5 % menjadi 73,3 %. Dalam ujian “Humanity Last”, kinerja meningkat lebih dari dua kali, mencapai 17,7 % dari 8,5 %.

Perkembangan ini menempatkan Deepseek-R1-0528 lebih dekat dengan kinerja model yang berlaku seperti O3 Openai dan Gemini 2.5 Pro, menurut penilaian internal dan yang memiliki batasan rata-rata dan/atau memerlukan langganan berbayar untuk dicapai.

Promosi UX dan fitur baru

Selain peningkatan kinerja, Deepseek-R1-0528 memperkenalkan banyak fitur baru yang bertujuan untuk meningkatkan pengalaman pengguna.

Pembaruan ini menambah dukungan pada output JSON dan undangan pekerjaan, dan fitur yang seharusnya memudahkan pengembang untuk mengintegrasikan kemampuan model ke dalam aplikasi dan alur kerja mereka.

Kemampuan depan juga telah ditingkatkan, dan Deepseek mengatakan perubahan ini akan menciptakan reaksi yang lebih halus dan lebih efisien bagi pengguna.

Selain itu, tingkat halusinasi model telah berkurang, yang berkontribusi pada produksi yang lebih andal dan konsisten.

Salah satu pembaruan terkemuka adalah memasukkan klaim sistem. Berbeda dengan versi sebelumnya, yang membutuhkan simbol khusus di awal penyutradaraan untuk mengaktifkan mode “berpikir”, pembaruan ini menghilangkan kebutuhan ini, dan menyederhanakan publikasi pengembang.

Variabel yang lebih kecil dari mereka yang memiliki anggaran matematika terbatas

Selain versi ini, Deepseek mendistorsi logika pemikirannya dalam variabel yang lebih kecil, Deepseek-R1-0528-SWEN3-8B, yang akan membantu pembuat keputusan dan pengembang yang tidak memiliki perangkat yang diperlukan untuk berjalan penuh

Versi suling ini dikatakan memiliki kinerja baru-baru ini di antara model open source dalam tugas-tugas seperti AIME 2024, mengungguli QWEN3-8B ​​sebesar 10 % dan pertandingan QWEN3-235B.

menurut penengahPengoperasian model bahasa besar adalah 8 miliar llm dalam setengah resolusi (FP16) sekitar 16 GB GPU, setara dengan sekitar 2 GB per miliar guru.

Oleh karena itu, unit pemrosesan grafis tunggal tinggi dengan setidaknya 16 GB VRAM, seperti NVIDIA RTX 3090 atau 4090, cukup untuk menjalankan 8b LLM dalam resolusi FP16. Untuk model yang lebih kuantitatif, unit pemrosesan grafis dapat digunakan dengan 8-12 GB VRAM, seperti RTX 3060.

Deepseek percaya bahwa model suling ini akan membuktikan bahwa ini berguna untuk aplikasi akademik dan aplikasi industri yang membutuhkan model yang lebih kecil.

Pengembang kecerdasan buatan pertama dan reaksi yang efektif

Pembaruan ini telah menarik perhatian dan pujian dari pengembang dan kekasih di media sosial.

Haydar, dijuluki “slow_developer“Umum untuk X bahwa Deepseek-R1-0528” luar biasa dalam pengkodean, “menggambarkan bagaimana saya membuat kode bersih dan tes kerja untuk menantang sistem perekaman kata, yang keduanya berada pada upaya pertama. Menurutnya, O3 hanya berhasil mencocokkan kinerja ini.

Selama, Publikasi lisan -Magic “Deepseek bertujuan pada King: O3 dan Gemini 2.5 Pro”, yang mencerminkan konsensus bahwa pembaruan baru mencoba model Deepseek lebih dekat dengan para seniman ini.

Berita lain tentang kecerdasan dan desas -desus buatan, berpengaruh, gemukDia berkomentar bahwa “Deepseek sedang memasak!” Yang paling menonjol dari bagaimana versi baru sama dengan O3 dan Gemini 2.5 Pro.

Bahkan Thuvena berspekulasi bahwa pembaruan R1 terakhir dapat mengindikasikan bahwa Deepseek sedang bersiap untuk melepaskan model perbatasan yang lama dan diasumsikan juga.

Kami melihat ke depan

Rilis Deepseek-R1-0528 menekankan komitmen Deepseek untuk menyediakan model kinerja tinggi sumber yang sangat terbuka yang memberikan prioritas pada inferensi dan kemudahan penggunaan. Dengan menggabungkan keuntungan standar dengan fitur-fitur praktis dan lisensi pemegang saham open source, Deepseek-R1-0528 ditempatkan sebagai alat yang berharga bagi pengembang, peneliti, dan penggemar yang ingin memanfaatkan kemampuan model bahasa terbaru.

Izinkan saya untuk mengetahui jika Anda ingin menambahkan lebih banyak kutipan, nada lebih banyak, atau menyorot elemen tambahan!


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Trump dan Xi bertemu dalam upaya untuk menyelesaikan ketegangan perdagangan yang disebabkan oleh tarif AS

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Presiden AS Donald Trump bertemu langsung dengan pemimpin Tiongkok Xi Jinping pada hari Kamis, hari terakhir perjalanan Trump ke Asia yang mencakup kunjungan ke Malaysia, Jepang dan Korea Selatan, dalam upaya untuk menyelesaikan perselisihan perdagangan yang sedang berlangsung antara kedua belah pihak.

Trump telah mengenakan tarif yang signifikan terhadap Tiongkok sejak kembali menjabat di Gedung Putih pada bulan Januari, dan Beijing telah meresponsnya dengan memberlakukan pembatasan ekspor unsur tanah jarang. Kedua belah pihak ingin menghindari risiko meledaknya perekonomian global yang dapat merugikan negara mereka.

Para pemimpin dua negara dengan perekonomian terbesar di dunia berbicara kepada pers dalam pernyataan pengantar singkat sebelum bertemu secara tertutup dengan para pejabat senior mereka.

Presiden Donald Trump, kiri, dan Presiden Tiongkok Xi Jinping, kanan, berjabat tangan sebelum pertemuan mereka di Bandara Internasional Gimhae di Busan, Korea Selatan, Kamis, 30 Oktober 2025. (Foto AP/Mark Schiefelbein)

“Sungguh hangat rasanya bertemu Anda lagi karena sudah bertahun-tahun berlalu,” kata Xi dalam pidato pembukaannya.

“Kami tidak selalu sepakat satu sama lain,” kata Xi, sambil menekankan bahwa “adalah hal yang normal jika terjadi perselisihan antara dua negara dengan ekonomi terkemuka di dunia dari waktu ke waktu.”

Presiden Donald Trump, kanan, bersama Menteri Luar Negeri Marco Rubio, kedua dari kanan, dan Menteri Perdagangan Howard Lutnick

Presiden Donald Trump, kanan, bersama Menteri Luar Negeri Marco Rubio, kedua dari kanan, dan Menteri Perdagangan Howard Lutnick, ketiga dari kanan, bertemu dengan Presiden Tiongkok Xi Jinping di Bandara Internasional Gimhae di Busan, Korea Selatan, Kamis, 30 Oktober 2025. (Foto AP/Mark Schiefelbein)

Klik di sini untuk mengunduh aplikasi FOX NEWS

Pemimpin Tiongkok tersebut menambahkan bahwa kedua negara “sepenuhnya mampu membantu satu sama lain untuk mencapai kesuksesan dan kesejahteraan bersama.”

Associated Press berkontribusi pada laporan ini.

Ini adalah kisah yang berkembang. Periksa kembali untuk mengetahui pembaruan.

Tautan sumber

Continue Reading

Berita

Dari pengklasifikasi statis hingga mesin penalaran: Paradigma OpenAI baru memikirkan kembali moderasi konten

Published

on

Perusahaan sangat ingin memastikan model AI apa pun yang mereka gunakan Komitmen terhadap keselamatan dan penggunaan yang aman kebijakan, dan menyesuaikan LLM sehingga tidak menanggapi pertanyaan yang tidak diminta.

Namun, sebagian besar keamanan dan tim merah terjadi sebelum penerapan, dan kebijakan “penggabungan” terjadi sebelum pengguna sepenuhnya merasakan kemampuan model dalam produksi. OpenAI Dia yakin hal ini dapat menawarkan pilihan yang lebih fleksibel bagi organisasi dan mendorong lebih banyak perusahaan untuk menerapkan kebijakan keselamatan.

Perusahaan telah merilis dua model open-weight dalam tinjauan penelitian yang diyakini akan membuat institusi dan model lebih fleksibel dalam hal agunan. gpt-oss-safeguard-120b dan gpt-oss-safeguard-20b akan tersedia pada lisensi Apache 2.0 yang permisif. Model-model tersebut merupakan versi open source OpenAI yang telah disempurnakan gpt-oss, dirilis pada bulan Agustusmenandai rilis pertama dalam keluarga OSS sejak musim panas.

Di sebuah Entri blogoss-safeguard menggunakan logika untuk “menafsirkan kebijakan pengembang dan penyedia secara langsung pada waktu inferensi – mengklasifikasikan pesan pengguna, penyelesaian, dan percakapan penuh sesuai dengan kebutuhan pengembang,” kata OpenAI.

Perusahaan menjelaskan bahwa karena model menggunakan Chain of Thought (CoT), pengembang dapat memperoleh penjelasan tentang keputusan model untuk ditinjau.

“Selain itu, kebijakan diberikan selama inferensi, bukan pelatihan model, sehingga lebih mudah bagi pengembang untuk sering meninjau kebijakan guna meningkatkan kinerja.”" OpenAI mengatakan dalam postingannya. "Pendekatan ini, yang awalnya kami kembangkan untuk penggunaan internal, jauh lebih fleksibel dibandingkan metode tradisional dalam melatih pengklasifikasi untuk secara tidak langsung menyimpulkan batasan keputusan dari sejumlah besar contoh yang diberi label."

Pengembang dapat mengunduh kedua templat dari Pelukan wajah.

Elastisitas versus roti

Awalnya, model AI tidak akan mengetahui faktor keselamatan pilihan perusahaan. Sedangkan model pengirim tim merah Model dan platform,Jaminan ini ditujukan untuk penggunaan yang lebih luas. Perusahaan seperti Microsoft Dan Layanan Web Amazon sampai Platform tampilan Untuk membawa Pagar pembatas untuk aplikasi kecerdasan buatan Dan para agen.

Perusahaan menggunakan pengklasifikasi keselamatan untuk membantu melatih model mengenali pola masukan yang baik atau buruk. Ini membantu model mengetahui pertanyaan mana yang tidak boleh mereka jawab. Hal ini juga membantu memastikan bahwa model tidak menyimpang dan jawabannya akurat.

“Pengklasifikasi tradisional dapat memiliki kinerja tinggi, latensi rendah, dan biaya pengoperasian rendah," kata OpenAI. "Namun mengumpulkan contoh pelatihan dalam jumlah yang cukup dapat memakan waktu dan mahal, dan memperbarui atau mengubah kebijakan memerlukan pelatihan ulang pengklasifikasi."

Model mengambil dua masukan sekaligus sebelum mengambil kesimpulan tentang kegagalan konten. Dibutuhkan kebijakan dan konten untuk menentukan peringkat sesuai dengan pedomannya. OpenAI mengatakan model tersebut bekerja paling baik dalam situasi di mana:

  • Potensi kerugian sedang muncul atau berkembang, dan kebijakan harus beradaptasi dengan cepat.

  • Domain ini sangat bagus dan sulit ditangani oleh pengklasifikasi yang lebih kecil.

  • Pengembang tidak memiliki cukup sampel untuk melatih pengklasifikasi berkualitas tinggi untuk setiap risiko di platform mereka.

  • Latensi tidak sepenting menghasilkan label berkualitas tinggi dan dapat ditafsirkan.

Perusahaan mengatakan gpt-oss-safeguard “berbeda karena kemampuan logikanya memungkinkan pengembang untuk menegakkan kebijakan apa pun,” bahkan kebijakan yang mereka tulis selama inferensi.

Model ini didasarkan pada alat internal OpenAI, Safety Reasoner, yang memungkinkan timnya lebih sering memasang pagar pembatas. Mereka sering kali memulai dengan kebijakan keamanan yang sangat ketat, “menggunakan komputasi dalam jumlah yang relatif besar bila diperlukan,” dan kemudian menyesuaikan kebijakan tersebut saat mereka menggerakkan model melalui perubahan produksi dan penilaian risiko.

Kinerja keselamatan

OpenAI mengatakan model perlindungan gpt-oss-nya mengungguli GPT-5 Thinking dan model gpt-oss asli dalam hal akurasi multi-kebijakan berdasarkan pengujian benchmark. Model tersebut juga dijalankan pada benchmark ToxicChat secara keseluruhan, dan performanya baik, meskipun pertimbangan GPT-5 dan alasan keselamatan sedikit mengungguli model tersebut.

Namun ada kekhawatiran bahwa pendekatan ini dapat mengarah pada sentralisasi standar keselamatan.

“Keselamatan bukanlah konsep yang didefinisikan dengan baik,” kata John Theakston, asisten profesor ilmu komputer di Cornell University. “Setiap penerapan standar keselamatan akan mencerminkan nilai dan prioritas organisasi yang menciptakannya, serta keterbatasan dan kekurangan modelnya.” “Jika industri secara keseluruhan mengadopsi standar yang dikembangkan oleh OpenAI, kita berisiko melembagakan perspektif tertentu mengenai keselamatan dan menghalangi penyelidikan yang lebih luas mengenai kebutuhan keselamatan dalam penerapan AI di banyak sektor masyarakat.”

Perlu juga dicatat bahwa OpenAI belum merilis model dasar untuk rangkaian model oss, sehingga pengembang tidak dapat mereplikasinya sepenuhnya.

Namun, OpenAI yakin bahwa komunitas pengembang dapat membantu meningkatkan perlindungan gpt-oss. Ini akan menjadi tuan rumah hackathon pada 8 Desember di San Francisco.

Tautan sumber

Continue Reading

Berita

Pertemuan Trump-Xi menempatkan kedelai sebagai pusat ketegangan perdagangan AS-Tiongkok

Published

on

baruAnda sekarang dapat mendengarkan artikel Fox News!

Sebagai presiden Donald Trump Saat Presiden Tiongkok Xi Jinping mempersiapkan pertemuan pada hari Kamis, bintang ekspor Amerika yang bersuara lembut akan menjadi pusat perhatian: kedelai. Hasil panen sederhana, andalan senilai $30 miliar Ekspor pertanianHal ini telah menjadi simbol kuat dari saling ketergantungan ekonomi dan ketegangan politik antara Washington dan Beijing.

Singkatnya, kedelai telah menjadi perwujudan dari perubahan perang dagang AS-Tiongkok. Beijing menghentikan pembelian kedelai AS setelah adanya tarif balasan terhadap produk tersebut, sebagai respons terhadap bea masuk yang sebelumnya dikenakan oleh Trump terhadap barang-barang Tiongkok.

Tiongkok berfokus pada pemasok di Brasil dan Argentina, sebuah langkah yang menyoroti betapa cepatnya perubahan pola perdagangan global dan betapa rentannya Amerika Serikat. Petani Karena perselisihan diplomatik antara Washington dan Beijing.

Pembekuan perdagangan dengan Tiongkok memberikan tekanan pada petani kedelai AS karena biaya meningkat dan keuntungan hilang

Apa yang awalnya merupakan saling balas dendam antara dua negara dengan ekonomi terbesar di dunia telah berubah menjadi pukulan simbolis dan ekonomi terhadap basis Trump di pedesaan, yang mata pencahariannya bergantung pada hubungan perdagangan yang sama yang kini berada di garis bidik.

Menurut American Soybean Association, Amerika Serikat secara tradisional menjadi sumber utama kedelai bagi Tiongkok. Sebelum sengketa perdagangan tahun 2018, sekitar 28% produksi kedelai AS diekspor ke Tiongkok. Itu Ekspor tanaman Angka tersebut turun tajam menjadi 11% pada tahun 2018 dan 2019, kemudian kembali meningkat menjadi 31% pada tahun 2021 di tengah permintaan di era pandemi, kemudian turun lagi menjadi 22% pada tahun 2024.

Namun beberapa pakar kebijakan mengklaim bahwa peralihan Tiongkok dari kedelai AS sudah berlangsung.

Beijing diam-diam mendikte langkah perang dagang selanjutnya ketika Trump dan Xi bersiap untuk bertemu

Beijing telah menghentikan pembelian kedelai AS di tengah perang dagang yang sedang berlangsung dengan Amerika Serikat. (Jan Sonnenmeier/Getty Images)

“Tiongkok akan selalu mengurangi ketergantungannya pada Amerika Serikat dalam hal ketahanan pangan,” Brian Burak, penasihat kebijakan senior untuk Tiongkok dan Indo-Pasifik di Heritage Foundation, mengatakan kepada Fox News Digital. “Tiongkok mulai menandatangani perjanjian pembelian kedelai dengan negara-negara lain jauh sebelum Presiden Trump menjabat,” katanya, seraya menambahkan bahwa Beijing telah “terpisah dari Amerika Serikat untuk waktu yang lama.”

“Sayangnya, satu-satunya cara bagi kami untuk merespons adalah dengan melakukan hal yang sama, dan proses itu sangat menyakitkan,” kata Burak.

Namun bagi petani yang tinggal ribuan mil dari Washington dan Beijing, perubahan kebijakan ini berarti menyusutnya pasar dan menurunkan margin keuntungan.

“Kami mengandalkan perdagangan dengan negara lain, khususnya Tiongkok, untuk membeli kedelai kami,” Brad Arnold, petani kedelai multigenerasi di barat daya Missouri, mengatakan kepada FOX Business. Keputusan Tiongkok untuk memboikot pembelian kedelai dari AS “memiliki dampak yang luar biasa terhadap bisnis dan hasil kami,” katanya.

Petani kedelai AS menghadapi krisis keuangan karena perselisihan dagang dengan Tiongkok mengancam mata pencaharian mereka

Pemandangan seorang petani memanen kedelai di Illinois

Presiden Donald Trump dan Presiden Tiongkok Xi Jinping diperkirakan akan membahas ekspor kedelai Korea Selatan. (Christopher Dilts/Bloomberg/Getty Images)

“Ada pemanfaatan kedelai dalam negeri, seperti solar terbarukan dan biodiesel yang diproduksi khusus dari kedelai,” kata Arnold. “Dalam skema besar, persentasenya sangat kecil saat ini, Anda tahu bahwa dibutuhkan pelanggan seperti Tiongkok untuk membeli pil tersebut agar dapat memberikan dampak yang nyata. Anda tidak dapat mengambil pelanggan pertama kami lalu menutupnya dan mencari penggantinya dalam semalam.”

Ketergantungan pada Tiongkok menambah bobot baru pada tahap diplomatik minggu ini, ketika Trump dan Xi bersiap untuk bertemu di Korea Selatan. Kedua pemimpin akan bertemu di sela-sela KTT Kerja Sama Ekonomi Asia-Pasifik di Busan, Korea Selatan, dalam pembicaraan tatap muka pertama mereka sejak Trump kembali menjabat.

Pertemuan tersebut diterima oleh Menteri Keuangan Scott Besant Dia memperkirakan Tiongkok akan menunda pembatasan elemen jejak dan melanjutkan pembelian kedelai dari Amerika Serikat, dan menyebutnya sebagai bagian dari “kerangka besar” yang ingin dipertahankan oleh kedua belah pihak. Besant juga mengatakan negosiasi perdagangan bergerak menuju penghindaran tarif baru AS sebesar 100% terhadap barang-barang Tiongkok.

KLIK DI SINI UNTUK MENDAPATKAN APLIKASI FOX NEWS

Presiden Tiongkok Xi Jinping di Serbia

Presiden Tiongkok Xi Jinping telah menghentikan pembelian kedelai di tengah perang dagang dengan Amerika Serikat. (Oliver Bonnick/Bloomberg melalui Getty Images)

Sebagai upaya untuk meredakan ketegangan, Reuters melaporkan bahwa Tiongkok telah membeli sekitar 180.000 metrik ton minyak Amerika. kedelai Menjelang pertemuan Trump-Xi.

Apakah ini merupakan pencairan nyata dalam hubungan perdagangan AS-Tiongkok atau hanya penangguhan hukuman sementara, pembelian ini menggarisbawahi betapa eratnya hubungan antara diplomasi dan pertanian.

Eric Revell dari Fox Business berkontribusi pada laporan ini.

Tautan sumber

Continue Reading

Trending