Connect with us

Berita

Anda sekarang dapat menyesuaikan versi organisasi Anda sendiri dari pemikiran O4-mini Openai dengan pembelajaran penguatan

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Openai Hari ini saya mengumumkan Akun yang berfokus pada pengembang di jejaring sosial x Pengembang pihak ketiga di luar perusahaan sekarang dapat mengakses penguatan (RFT) dari model pemikiran linguistik O4-Mini yang baru. Ini memungkinkan mereka untuk mengalokasikan versi khusus baru berdasarkan pada produk -produk dari lembaga unik mereka, istilah internal, tujuan, karyawan, operasi, dan banyak lagi.

Pada dasarnya, kemampuan ini memungkinkan pengembang untuk mengambil model yang tersedia untuk publik dan memodifikasinya agar lebih sesuai dengan kebutuhan mereka Panel Informasi Platform Openai.

Selanjutnya, mereka dapat mempostingnya melalui antarmuka aplikasi OpenAI (API), bagian lain dari platform pengembangnya, dan menghubungkannya ke komputer internal, basis data, dan aplikasi.

Setelah diterbitkan, jika seorang karyawan atau pemimpin perusahaan ingin menggunakannya melalui ruang khusus yang didedikasikan atau Openai GPT Didedikasikan Untuk memulihkan pengetahuan perusahaan khusus, menjawab pertanyaan spesifik tentang produk dan kebijakan perusahaan, atau membuat kontak dan asosiasi baru dalam suara perusahaan, mereka dapat melakukan ini dengan lebih mudah dengan versi RFT dari formulir.

Namun, satu catatan peringatan: Penelitian telah menunjukkan bahwa model yang disita mungkin lebih cenderung pecah dan halusinasi, jadi lanjutkan dengan hati -hati!

Peluncuran ini memperluas alat peningkatan model perusahaan bersama dengan kontrol SFT dan kontrol yang lebih fleksibel dari tugas -tugas kompleks lapangan.

Selain itu, Openai mengumumkan bahwa kontrol pengawasan sekarang didukung oleh model Nano GPT-4.1, yang merupakan harga perusahaan yang paling terjangkau dan lebih cepat.

Bagaimana cara membantu organisasi dan institusi instalasi augmented (RFT)?

RFT membuat versi baru dari model Thinking Openai OniI, yang secara otomatis disesuaikan dengan tujuan atau institusi/institusi pengguna.

Ini melakukan ini dengan menerapkan cincin umpan balik selama pelatihan, pengembang di perusahaan besar (atau bahkan pengembang independen yang bekerja secara mandiri) dapat dimulai dengan sederhana, mudah dan terjangkau melalui Platform Pengembang Openai melalui Internet.

Alih -alih melatih serangkaian pertanyaan dengan jawaban tetap yang benar – yang merupakan apa yang dilakukan oleh pembelajaran untuk pengawasan tradisional – RFT menggunakan model untuk merekam beberapa tanggapan untuk setiap mentor.

Algoritma pelatihan kemudian menyesuaikan bobot bobot untuk membuat output -grade tinggi lebih mungkin.

Struktur ini memungkinkan pelanggan untuk menyelaraskan model dengan target yang akurat seperti “gaya rumah” dari lembaga untuk komunikasi dan ketentuan, aturan keselamatan, akurasi realistis, atau kepatuhan dengan kebijakan internal.

Untuk melakukan RFT, pengguna perlu:

  1. Tentukan fungsi nilai atau penggunaan siswa kelas berbasis openai.
  2. Unduh satu set data dengan klaim verifikasi kesehatan.
  3. Buat pelatihan API atau micro -dashboard.
  4. Pantau kemajuan, tinjau pos pemeriksaan dan pengulangan data atau logika.

RFT saat ini mendukung model berpikir hanya dalam seri O dan tersedia untuk model O4-Mini.

Lembaga awal menggunakan kasus

Di platformnya, Openai yang paling menonjol banyak pelanggan pertama Mereka yang mengadopsi RFT melalui berbagai industri:

  • Perjanjian Kecerdasan Buatan Gunakan RFT untuk menyesuaikan bentuk tugas analisis pajak yang kompleks, tingkatkan akurasi 39 % dan melebihi semua model terkemuka pada standar pemikiran pajak.
  • Suasana Perawatan Kesehatan RFT diterapkan pada kode kode ICD-10, meningkatkan kinerja model sebesar 12 poin pada jalur dokter di set data panel.
  • Harvey RFT digunakan untuk menganalisis dokumen hukum, meningkatkan nilai F1 untuk mengekstraksi kutipan sebesar 20 % dan mencocokkan akurasi GPT-4O sambil mencapai inferensi lebih cepat.
  • Runloop Model yang diatur untuk membuat memo ikon strip API, menggunakan siswa kelas penting dalam kalimat dan logika validasi AST, yang mencapai peningkatan 12 %.
  • Milo RFT telah diterapkan pada tugas penjadwalan, yang meningkatkan hak dalam situasi yang sangat kompleks sebesar 25 poin.
  • Safykit RFT digunakan untuk memaksakan kebijakan moderat konten mikro dan meningkatkan model F1 dari 86 % menjadi 90 % dalam produksi.
  • ChipstackDan Reuters ThompsonMitra lain juga menunjukkan keuntungan dalam kinerja dalam menghasilkan data, tugas perbandingan hukum dan fungsi verifikasi.

Kasus-kasus ini seringkali merupakan karakteristik umum: definisi tugas yang jelas, format output terorganisir dan kriteria evaluasi yang andal-yang semuanya diperlukan untuk meningkatkan pemberantasan yang efektif.

RFT sekarang tersedia untuk organisasi terverifikasi. Untuk membantu meningkatkan model masa depan, OpenAI menawarkan tim yang berbagi grup data pelatihan mereka dengan diskon 50 %. Pengembang yang tertarik dapat mulai menggunakan Dokumen RFT dari Openai Dan Dasbor.

Struktur dan pengisian harga

Tidak seperti kontrol atau kontrol yang disukai, yang merupakan tagihan untuk setiap simbol, RFT dijelaskan berdasarkan waktu pelatihan dihabiskan secara aktif. khususnya:

  • $ 100 per jam waktu pelatihan dasar (waktu dinding selama model, gelar, pembaruan dan verifikasi kesehatan).
  • Waktu dikencangkan oleh yang kedua, hampir menjadi dua puluh tempat (jadi 1,8 jam pelatihan akan menelan biaya $ 180).
  • Biaya hanya berlaku untuk pekerjaan yang memodifikasi formulir. Daftar tunggu, pemeriksaan keselamatan, dan tahap tidak aktif tidak dilakukan.
  • Jika pengguna menggunakan model OpenAI sebagai pilot (misalnya, GPT-4.1), tagihan yang dikonsumsi selama nilai dilepaskan secara terpisah pada tingkat API standar di OpenAI. Jika tidak, perusahaan dapat menggunakan model eksternal, termasuk model open source, sebagai siswa di kelas.

Di bawah ini adalah contoh keruntuhan biaya:

skenarioWaktu pahitMenetapkan
4 jam pelatihan4 jam400 dolar
1,75 jam (konsistensi)1,75 jam175 dolar
Pelatihan selama dua jam + satu jam (karena kegagalan)Dua jam$ 200

Model penetapan harga memberikan transparansi ini dan hadiah desain fungsional yang efektif. Untuk mengontrol biaya, Openai mendorong perbedaan pada:

  • Gunakan siswa kelas ringan atau efektif jika memungkinkan.
  • Hindari validasi yang berlebihan kecuali itu perlu.
  • Mulailah dengan koleksi data yang lebih kecil atau jalankan ekspektasi singkat untuk mengkalibrasi.
  • Pantau pelatihan menggunakan API atau dasbor sementara dan berhenti sementara sesuai kebutuhan.

Openai menggunakan metode persiapan tagihan yang disebut “kemajuan progresif”, yang berarti bahwa pengguna hanya tagihan untuk langkah -langkah pelatihan model yang telah diselesaikan dan berhasil disimpan.

Haruskah Anda menginvestasikan organisasi Anda dalam menerbitkan versi khusus O4-Mini Openai atau tidak?

Peningkatan kontrol memberikan cara yang lebih ekspresif dan terkontrol untuk mengadaptasi model bahasa untuk kasus penggunaan di dunia nyata.

Dengan dukungan output terorganisir, siswa kelas berbasis kode, dan kontrol penuh API, RFT menawarkan tingkat kustomisasi baru dalam menerbitkan formulir. Startup Openai menekankan desain tugas yang dipelajari dan evaluasi yang kuat sebagai kunci untuk sukses.

Pengembang yang tertarik untuk mengeksplorasi metode ini dapat mengakses dokumen dan contoh melalui dasbor OpenAI.

Untuk lembaga yang memiliki masalah yang jelas spesifik dan jawaban yang diverifikasi, RFT menyediakan metode yang meyakinkan untuk menyelaraskan model dengan tujuan operasi atau kepatuhan – tanpa membangun infrastruktur RL dari awal.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Mistral API diluncurkan untuk membangun agen kecerdasan buatan yang menjalankan ular python, membuat gambar, kain dan banyak lagi

Published

on


Untuk para profesional seperti insinyur AI utama atau insinyur kecerdasan buatan, itu mewakili antarmuka aplikasi agen mistral.

Tautan sumber

Continue Reading

Berita

Walz mendesak Demokrat untuk “menjadi lebih terpotong”, “bulllying bulllying” Trump: “beberapa tahun sulit” bertahun -tahun.

Published

on

Pada hari Sabtu, gubernur Minnesota Tim Walz meminta rekan -rekannya yang Demokrat pada hari Sabtu untuk “menjadi lebih banyak bercerita” dan melawan Presiden Donald Trump, yang menggambarkannya sebagai “intimidasi”.

Walzz, seorang kandidat presiden pada tahun 2024, adalah juru bicara utama di Konferensi Negara Demokrat di Kolombia, Carolina Selatan, di mana ia mengambil jabis di presiden Republik dan berusaha merangsang aktivis partainya.

“Mungkin sudah waktunya untuk menjadi sedikit lebih terkenal, sedikit lebih, karena kita harus menanggapi ini,” kata Walz kepada orang banyak di negara bagian Palmo.

Komentar itu muncul setelah dia mengatakan bahwa dia “berarti” ketika dia dikritik dalam beberapa bulan terakhir di pejabat administrasi Trump, termasuk miliarder Elon Musk, yang telah meninggalkan perannya dalam pemerintahan federal sejak saat itu.

Manajer es agensi Tim dan Al -zouz meminta maaf karena telah menghubungi agen “agen” agen “Gestapo”

Gubernur Minnesota Tim dan Alzalm menyerukan rekan -rekannya untuk “menjadi lebih banyak bercerita” dan “buletin pengganggu dalam” Presiden Donald Trump “. (AP)

“Hal yang mengganggu guru lebih dari apa pun adalah menonton Fatwa,” kata Walz, seorang mantan guru. “Dan ketika dia masih kecil, kamu berbicara dengan mereka dan memberi tahu mereka mengapa intimidasi salah.”

“Tapi ketika orang dewasa seperti Donald Trump, kamu bullying dari luar … ini adalah pria yang keras.”

Dia juga mengkritik Demokrat di Minnesota Trump sebagai “diktator yang berharap” dan “ancaman eksistensial saya”.

“Donald Trump adalah ancaman eksistensial yang kami tahu bahwa ia akan datang,” kata Walz, mencatat bahwa bagi Demokrat, “itu akan menjadi beberapa tahun yang sulit di sini.”

“Kami memiliki keberanian dan kami perlu mundur dari fatwa dan keserakahan,” katanya.

Walz juga muncul pada Jumat malam, bersama dengan gubernur Maryland Wes Moore, pada makan malam koleksi pesta dan upaya ikan setelah pesta yang diselenggarakan oleh anggota parlemen Demokrat South Carolina Jim Kleiborne. Walz dan Moore berada dalam daftar panjang calon presiden potensial untuk tahun 2028 yang bepergian ke negara -negara awal, meskipun gubernur Maryland mengatakan dia tidak akan mencalonkan diri untuk Gedung Putih dalam sesi pemilihan mendatang.

Walz dan Trump

Gubernur Negara mengkritik Tim dan Alzal Trump sebagai “diktator yang berharap” dan “ancaman eksistensial”. (Gambar Getty)

Moore mengatakan dalam pernyataannya: “Saya ingin lebih jelas: kita bisa dan kita harus mengutuk perilaku sembrono Donald Trump. Tapi kita akan bodoh untuk tidak belajar dari ketidaksabaran kesabarannya.”

“Donald Trump tidak memerlukan studi untuk membongkar demokrasi atau penggunaan konstitusi seperti kotak saran. Donald Trump tidak memerlukan buku putih untuk memulai perang komersial sewenang -wenang yang meningkatkan biaya hampir semua hal dalam hidup kita,” tambahnya.

Peristiwa konservatif memberikan kesempatan untuk menguji pesan mereka kepada ratusan Demokrat di negara bagian yang telah lama mengadakan pemilihan awal untuk kepresidenan Demokrat Selatan, dan tahun lalu, ortodontik mulai mencalonkan partai secara penuh.

Kepala Partai Negara, Crystal Spanyol, mengatakan bahwa mereka akan memperbarui argumen untuk mempertahankan posisi pertama negara di sesi berikutnya, meskipun organisasi nasional partai belum menyelesaikan kalender mereka untuk tahun 2028 sampai sekarang, dan pejabat partai di Iowa, New Hampsheer dan Nevada mencari untuk pergi terlebih dahulu.

Republik Minnesota mengumumkan kampanye penguasa, berjanji untuk “mereformasi” apa yang dipecahkan Tim dan Lazs “

Trump di Oval Office

Gubernur Negara Tim dan Al -zabi di Trump dan berusaha untuk merangsang para aktivis Partai Demokrat. (Win McNamee/Getty Images)

Klik di sini untuk mendapatkan aplikasi Fox News

Tepat seperti yang dia lakukan pada Jumat malam, Walza memuji rekan -rekannya yang Demokrat dalam pidatonya pada hari Sabtu karena kehadiran “keberanian” untuk terus bertempur di negara bagian Republik sebagian besar, karena Demokrat tidak memenangkan pemilihan negara bagian sekitar dua dekade lalu dan hanya bekerja di satu kursi di Kongres.

Walz berkata: “Sial, kita harus dapat menikmati kesenangan dan kegembiraan.” “Kami memiliki keberanian dan kami harus mendapatkan lagi fatwa dan keserakahan.”

Dompet tidak secara resmi dikatakan jika dia akan mencari masa jabatan ketiga sebagai penguasa pada tahun 2026, tetapi dia mengakui bahwa dia sedang memikirkannya. Ini juga memberikan sinyal campuran pada kemungkinan Tur Presiden 2028.

Associated Press berkontribusi pada laporan ini.

Tautan sumber

Continue Reading

Berita

Pemimpin Keamanan Kehilangan Kejelasan Saat Penasihat Menerbitkan AI Copilots Shades to Stay Workers

Published

on


Karena takut akan operasi demobilisasi yang komprehensif yang dipimpin oleh kecerdasan dan otomatisasi buatan, konsultan elit menggunakan warna AI untuk mendapatkan keunggulan kompetitif. Baca selengkapnya

Tautan sumber

Continue Reading

Trending