Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut
Openai sekarang menampilkan lebih banyak detail tentang pemikiran O3-Mini, model terbarunya. Perubahan telah diumumkan X Akun Openai Muncul pada saat laboratorium intelijen buatan terpapar pada peningkatan tekanan oleh Deepseek-R1, model terbuka kompetitif yang sepenuhnya menampilkan simbol logisnya.

Model seperti O3 dan R1 tunduk pada proses “rantai pemikiran” yang panjang (COT) di mana simbol tambahan dihasilkan untuk memecahkan masalah dan penyebab jawaban yang berbeda, menguji mereka dan mencapai solusi akhir. Sebelumnya, model pemikiran di OpenAi menyembunyikan serangkaian gagasannya dan hanya mengeluarkan ikhtisar tingkat tinggi dari langkah -langkah pemikiran. Ini menyulitkan pengguna dan pengembang untuk memahami logika pemikiran tentang model dan mengubah instruksi mereka dan menuntut agar itu diarahkan ke arah yang benar.
Dalam serangkaian pemikiran, Openai melihat keunggulan kompetitif dan menyembunyikannya untuk mencegah para pesaingnya menyalin untuk melatih model mereka. Tetapi dengan adanya R1 dan model terbuka lainnya yang menunjukkan pelacakan pemikiran penuh, kurangnya transparansi menjadi cacat pada OpenAi.
Versi baru O3-Mini menampilkan salinan COT yang lebih rinci. Meskipun kami masih belum melihat simbol mentah, mereka memberikan lebih banyak kejelasan tentang proses berpikir.

Mengapa permintaannya?
Dalam pengalaman kami sebelumnya pada O1 dan R1, kami menemukan bahwa O1 sedikit lebih baik dalam menyelesaikan analisis data dan masalah berpikir. Namun, salah satu pembatasan utama adalah bahwa tidak ada cara untuk mengetahui mengapa model tersebut melakukan kesalahan-ia melakukan kesalahan ketika menghadapi data dunia nyata yang kacau yang diperoleh dari web. Di sisi lain, seri pemikiran R1 R1 memungkinkan kami untuk mengeksplorasi masalah dan mengubah klaim kami untuk meningkatkan pemikiran.
Misalnya, dalam salah satu pengalaman kami, kedua model gagal memberikan jawaban yang benar. Tetapi berkat serangkaian pemikiran terperinci dari R1, kami dapat menemukan bahwa masalahnya bukan dengan model itu sendiri tetapi dengan tahap pengambilan yang mengumpulkan informasi dari web. Dalam pengalaman lain, Seri Ide R1 berhasil memberi kami petunjuk ketika gagal menganalisis informasi yang kami berikan, sementara O1 hanya memberi kami gambaran umum tentang cara merumuskan responsnya.
Kami telah mengalami model O3-Mini baru pada variabel pengalaman sebelumnya yang telah kami mainkan dengan O1. Kami telah memberikan model file teks yang berisi harga berbeda dari Januari 2024 hingga Januari 2025. File itu berisik dan tidak diproses, campuran dari teks normal dan elemen HTML. Kemudian kami meminta formulir untuk menghitung nilai portofolio yang menginvestasikan 140 dolar dalam saham indah 7 pada hari pertama setiap bulan Januari 2024 hingga Januari 2025, dan mendistribusikannya secara merata di semua saham (kami menggunakan istilah “mag 7 “Dalam router untuk membuatnya lebih menantang).
Tempat tidur O3-mini sangat berguna kali ini. Pertama, model ini dinominasikan tentang apa itu Mag 7, data untuk menyimpan saham saja, dan itu membuat akun akhir untuk memberikan jawaban yang benar (nilai portofolio adalah sekitar 2200 dolar pada terakhir kali dicatat dalam data kami memberikan kepada model).

Dibutuhkan lebih banyak tes untuk mengetahui batas -batas rantai berpikir baru, karena Openai masih menyembunyikan banyak detail. Namun dalam cek cek, koordinasi baru tampaknya lebih berguna.
Apa artinya ini bagi openai
Ketika Deepseek-R1 dirilis, ia memiliki tiga keunggulan yang jelas pada model berpikir di Openai: itu terbuka, murah dan transparan.
Sejak itu, Openai telah berhasil mempersingkat kesenjangan. Sementara O1 harganya $ 60 per juta simbol output, O3-Mini hanya berharga $ 4,40, sementara O mengalahkan banyak kriteria berpikir. Biaya R1 sekitar $ 7 dan $ 8 per juta simbol untuk penyedia layanan Amerika. (Deepseek R1 menawarkan $ 2,19 per juta simbol di server mereka sendiri, tetapi banyak organisasi tidak akan dapat menggunakannya karena mereka menjadi tuan rumah di Cina.)
Dengan perubahan baru dalam output COT, OpenAI memungkinkan tindakan yang agak tentang masalah transparansi.
Masih akan melihat apa yang akan dilakukan Openai tentang sumber terbuka. Sejak dirilis, R1 telah diadaptasi, serupa dan di -host oleh banyak laboratorium dan perusahaan yang mungkin membuat model pemikiran yang disukai untuk lembaga. CEO Openai Sam Altman baru -baru ini mengakui bahwa ia “berada di sisi sejarah yang salah” dalam diskusi open source. Kita harus melihat bagaimana persepsi ini akan muncul di versi terbuka di masa depan.
Tautan sumber