Berita

Openai memperbarui operator ke O3, yang membuat godaan bulanan bulanan bulanannya

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Itu adalah minggu yang besar untuk iklan kecerdasan buatan setelah acara dari Microsoft, Google dan Anthropic. Tapi Openai berakhir dengan berita sendiri. Tidak, kami tidak hanya berbicara Sekitar 6,5 miliar dolar, akuisisi tim desain Jony Ive Untuk memimpin a Upaya baru untuk perangkat, “io” di openai.

Hari ini , Perusahaan mempromosikan operatornya Jelajahi web independen dan agen kontrol indeks di dalam chatgpt dari penggunaan model bahasa multimedia GPT-4O sebelumnya untuk model pemikiran O3 yang paling modern dan lebih kuat.

Pembaruan, yang telah dirilis di seluruh dunia hari ini, 23 Mei 2025, sebagai “inspeksi penelitian” untuk membayar pelanggan dalam rencana chatgpt pro, yang harganya $ 200.

Pada dasarnya, ini adalah cara Openai untuk mengatakan itu bukan “pasir” yang sepenuhnya produktif atau sempurna – mungkin masih memiliki reservoir dan masalah.

Tetapi dengan Google Competitor menawarkan paket berlangganan AI yang lebih tinggi sekitar $ 250 USD secara teratur ;

Apa itu Openai dan apa itu?

Operator pertama kali muncul pada Januari 2025 sebagai langkah awal untuk OpenAI dalam faktor semi -independen, terutama komputer menggunakan agen (CUA). Idenya adalah untuk mem -bypass antarmuka chatbt chatbot dan memungkinkan model AI yang kuat dari OpenAi untuk mulai mengambil lebih banyak tindakan pada pengguna.

Dengan demikian, operator dirancang untuk mengarahkan secara mandiri, mengklik, melewati dan menulis untuk menyelesaikan tugas web, seperti memesan reservasi makan malam, mengumpulkan daftar belanja, atau memesan tiket untuk acara. Ini memungkinkan kemampuan untuk menyelesaikan tugas pengguna secara langsung melalui antarmuka browser, dari reservasi hingga pengumpulan data secara online.

Untuk tujuan keselamatan, privasi dan keselamatan, operator tidak menggunakan browser web apa pun di komputer atau Mac pengguna. Sebagai gantinya, itu dijalankan di browser default yang dihosting oleh cloud yang dapat diakses melalui situs web independen-operator.chatgpt.com-shere pengguna dapat memasukkan permintaan dan memantau tugas untuk melakukan agen dalam waktu yang sebenarnya.

Ini telah mengumpulkan kemampuan penglihatan, pemikiran dan interaksi berdasarkan GPT-4O, yang mewakili arah baru untuk OpenAi dalam AIgnic AI.

Produk ini telah diluncurkan sebagai inspeksi penelitian pelanggan ChatGPT Pro dan langkah -langkah keselamatan terintegrasi seperti jaminan pengguna, mode pemantauan, dan pembatasan pada platform web risiko tinggi.

Itu juga diuji dalam konteks lembaga, termasuk perencanaan perjalanan dan layanan sipil, yang menunjukkan kemampuannya di seluruh konsumen dan lingkungan komersial.

O3 memberikan peningkatan akurasi, struktur dan tingkat keberhasilan

Dengan pembaruan ini, OpenAI bertujuan untuk meningkatkan kinerja di beberapa dimensi utama. Operator berbasis O3 baru menjelaskan peningkatan stabilitas dan akurasi selama reaksi browser.

Dalam praktiknya, ini berarti bahwa itu kemungkinan akan berhasil menyelesaikan tugas pengguna dan dengan yang paling tidak perlu diperbaiki atau diulang. Selain itu, pengguna dapat menandatangani tanggapan yang lebih jelas, lebih terorganisir dan lebih komprehensif.

Dalam penilaian komparatif, model baru ini menampilkan preferensi khas untuk pendahulunya. Studi preferensi manusia mengungkapkan bahwa pengguna lebih suka model O3 untuk gaya, pemahaman, dan kejelasannya. Ini juga mengarah dengan kuat pada instruksi berikut dan efisien, meskipun hasil hak realistis lebih seimbang di antara versi.

Kinerja kriteria evaluasi pihak ketiga mencerminkan perbaikan ini. pada Standar Osworld Ini mengukur penyelesaian tugas berbasis browser, dan mencatat model O3 42.9 dibandingkan dengan 38.1 untuk versi sebelumnya.

Namun, OpenAI mencatat bahwa karena pembatasan dalam sistem nilai otomatis, perolehan kinerja aktual dapat lebih dekat ke 20 poin persentase!

Di Webarena, model baru ini mencetak 62,9, ketinggian 48.1. Peningkatan paling dramatis muncul pada kriteria GAIA, di mana O3 62.2 mencapai, sangat melebihi 12,3 model sebelumnya.

Perbandingan tugas ditampilkan di samping keuntungan ini. Dalam salah satu contoh yang mencakup permintaan reservasi restoran, model baru ini menyajikan daftar pemesanan yang lebih jelas dan lebih rinci yang tersedia, termasuk situs, klasifikasi Michelin, dan catatan duduk yang disajikan di meja yang dikoordinasi dengan baik. Versi sebelumnya, meskipun fungsional, memberikan lebih sedikit informasi dengan cara yang lebih rendah, menurut gambar yang disertakan dengan Catatan Catatan Pemain O3 Baru:

Jaminan tetap ada, seperti halnya catatan peringatan umum tentang penggunaan transaksi keuangan yang sensitif dan akses ke akun

Model O3 juga mewarisi langkah -langkah keamanan yang disajikan dengan versi sebelumnya, dengan kontrol lebih lanjut atas perannya sebagai sistem agen.

Openai telah menggabungkan pelatihan augmented terhadap implementasi tugas berbahaya, injeksi yang lemah, dan kesalahan yang melibatkan niat pengguna.

Penilaian menunjukkan bahwa model sekarang mengkonfirmasi 94 % prosedur sensitif sebelum mengimplementasikannya, dengan konfirmasi 100 % transaksi keuangan. Kapasitas injeksi segera juga menurun dari 23 % menjadi 20 %.

Perlu dicatat bahwa operator O3 mempertahankan batasan hati -hati pada interaksi web risiko tinggi, seperti platform e -mail atau keuangan, seperti yang mungkin diperlukan oleh pengawasan pengguna dengan menempatkan arloji atau menolak untuk menindaklanjuti secara eksplisit. Langkah -langkah ini adalah bagian dari pendekatan kelas keselamatan yang menggabungkan daya tahan pada tingkat model dan pemantauan waktu aktual.

Sementara promosi ke operator adalah peningkatan teknis, itu juga mencerminkan komitmen berkelanjutan Openai untuk menyebarkan kecerdasan buatan yang bertanggung jawab.

Kemampuan sistem untuk mengambil tindakan di dunia nyata memberikan risiko baru, dan tim pengembangan terus meningkatkan protokol keselamatannya.

menurut O3 -upModel ini tetap kurang dari ambang pintu berisiko tinggi dalam kategori -kategori seperti penyalahgunaan biologis dan kimia dan tidak memiliki lingkungan pengkodean lokal atau akses penghancuran, yang mengurangi potensi vektor penyalahgunaan.

Operator tetap menjadi inspeksi penelitian dan hanya dapat diakses untuk pengguna ChatGPT Pro. Versi API dari operator akan melanjutkan model GPT-4O, setidaknya saat ini.

Efek dari pembuat keputusan teknis dari lembaga

Operator promosi berdiri untuk meningkatkan fungsi para profesional dalam rekayasa kecerdasan buatan, koordinasi, manajemen data, dan keamanan teknologi informasi.

Bagi mereka yang membangun atau memelihara model pembelajaran otomatis, keakuratan model yang ditingkatkan dan output terstruktur mengurangi biaya umum untuk memverifikasi pengujian tes dan mengeksplorasi dan memperbaiki kesalahan.

Dalam konteks sinkronisasi, ini menyediakan alat yang praktis dan andal untuk mengotomatisasi bahan berdasarkan browser untuk jaringan pipa yang kompleks.

Insinyur data dapat mendelegasikan interaksi web manual-seperti verifikasi data dan mengabaikan dengan lebih banyak kepercayaan diri, dan waktu luang untuk meningkatkan peningkatan di tingkat yang lebih tinggi.

Sementara itu, para profesional keamanan mendapatkan cara yang lebih aman untuk mensimulasikan perilaku pengguna dalam cek dan kecelakaan latihan respons, berkat mekanisme keselamatan dengan lapisan khas.

Melalui jurusan -jurusan ini, pemain O yang berdasarkan O3 memberikan kemampuan untuk meningkatkan daya dan kerangka kerja bantuan risiko, yang menjadikannya tambahan praktis untuk kumpulan alat teknis modern.


Tautan sumber

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Trending

Exit mobile version