Connect with us

Berita

Openai memperbarui operator ke O3, yang membuat godaan bulanan bulanan bulanannya

Published

on

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


Itu adalah minggu yang besar untuk iklan kecerdasan buatan setelah acara dari Microsoft, Google dan Anthropic. Tapi Openai berakhir dengan berita sendiri. Tidak, kami tidak hanya berbicara Sekitar 6,5 miliar dolar, akuisisi tim desain Jony Ive Untuk memimpin a Upaya baru untuk perangkat, “io” di openai.

Hari ini , Perusahaan mempromosikan operatornya Jelajahi web independen dan agen kontrol indeks di dalam chatgpt dari penggunaan model bahasa multimedia GPT-4O sebelumnya untuk model pemikiran O3 yang paling modern dan lebih kuat.

Pembaruan, yang telah dirilis di seluruh dunia hari ini, 23 Mei 2025, sebagai “inspeksi penelitian” untuk membayar pelanggan dalam rencana chatgpt pro, yang harganya $ 200.

Pada dasarnya, ini adalah cara Openai untuk mengatakan itu bukan “pasir” yang sepenuhnya produktif atau sempurna – mungkin masih memiliki reservoir dan masalah.

Tetapi dengan Google Competitor menawarkan paket berlangganan AI yang lebih tinggi sekitar $ 250 USD secara teratur ;

Apa itu Openai dan apa itu?

Operator pertama kali muncul pada Januari 2025 sebagai langkah awal untuk OpenAI dalam faktor semi -independen, terutama komputer menggunakan agen (CUA). Idenya adalah untuk mem -bypass antarmuka chatbt chatbot dan memungkinkan model AI yang kuat dari OpenAi untuk mulai mengambil lebih banyak tindakan pada pengguna.

Dengan demikian, operator dirancang untuk mengarahkan secara mandiri, mengklik, melewati dan menulis untuk menyelesaikan tugas web, seperti memesan reservasi makan malam, mengumpulkan daftar belanja, atau memesan tiket untuk acara. Ini memungkinkan kemampuan untuk menyelesaikan tugas pengguna secara langsung melalui antarmuka browser, dari reservasi hingga pengumpulan data secara online.

Untuk tujuan keselamatan, privasi dan keselamatan, operator tidak menggunakan browser web apa pun di komputer atau Mac pengguna. Sebagai gantinya, itu dijalankan di browser default yang dihosting oleh cloud yang dapat diakses melalui situs web independen-operator.chatgpt.com-shere pengguna dapat memasukkan permintaan dan memantau tugas untuk melakukan agen dalam waktu yang sebenarnya.

Ini telah mengumpulkan kemampuan penglihatan, pemikiran dan interaksi berdasarkan GPT-4O, yang mewakili arah baru untuk OpenAi dalam AIgnic AI.

Produk ini telah diluncurkan sebagai inspeksi penelitian pelanggan ChatGPT Pro dan langkah -langkah keselamatan terintegrasi seperti jaminan pengguna, mode pemantauan, dan pembatasan pada platform web risiko tinggi.

Itu juga diuji dalam konteks lembaga, termasuk perencanaan perjalanan dan layanan sipil, yang menunjukkan kemampuannya di seluruh konsumen dan lingkungan komersial.

O3 memberikan peningkatan akurasi, struktur dan tingkat keberhasilan

Dengan pembaruan ini, OpenAI bertujuan untuk meningkatkan kinerja di beberapa dimensi utama. Operator berbasis O3 baru menjelaskan peningkatan stabilitas dan akurasi selama reaksi browser.

Dalam praktiknya, ini berarti bahwa itu kemungkinan akan berhasil menyelesaikan tugas pengguna dan dengan yang paling tidak perlu diperbaiki atau diulang. Selain itu, pengguna dapat menandatangani tanggapan yang lebih jelas, lebih terorganisir dan lebih komprehensif.

Dalam penilaian komparatif, model baru ini menampilkan preferensi khas untuk pendahulunya. Studi preferensi manusia mengungkapkan bahwa pengguna lebih suka model O3 untuk gaya, pemahaman, dan kejelasannya. Ini juga mengarah dengan kuat pada instruksi berikut dan efisien, meskipun hasil hak realistis lebih seimbang di antara versi.

Kinerja kriteria evaluasi pihak ketiga mencerminkan perbaikan ini. pada Standar Osworld Ini mengukur penyelesaian tugas berbasis browser, dan mencatat model O3 42.9 dibandingkan dengan 38.1 untuk versi sebelumnya.

Namun, OpenAI mencatat bahwa karena pembatasan dalam sistem nilai otomatis, perolehan kinerja aktual dapat lebih dekat ke 20 poin persentase!

Di Webarena, model baru ini mencetak 62,9, ketinggian 48.1. Peningkatan paling dramatis muncul pada kriteria GAIA, di mana O3 62.2 mencapai, sangat melebihi 12,3 model sebelumnya.

Perbandingan tugas ditampilkan di samping keuntungan ini. Dalam salah satu contoh yang mencakup permintaan reservasi restoran, model baru ini menyajikan daftar pemesanan yang lebih jelas dan lebih rinci yang tersedia, termasuk situs, klasifikasi Michelin, dan catatan duduk yang disajikan di meja yang dikoordinasi dengan baik. Versi sebelumnya, meskipun fungsional, memberikan lebih sedikit informasi dengan cara yang lebih rendah, menurut gambar yang disertakan dengan Catatan Catatan Pemain O3 Baru:

Jaminan tetap ada, seperti halnya catatan peringatan umum tentang penggunaan transaksi keuangan yang sensitif dan akses ke akun

Model O3 juga mewarisi langkah -langkah keamanan yang disajikan dengan versi sebelumnya, dengan kontrol lebih lanjut atas perannya sebagai sistem agen.

Openai telah menggabungkan pelatihan augmented terhadap implementasi tugas berbahaya, injeksi yang lemah, dan kesalahan yang melibatkan niat pengguna.

Penilaian menunjukkan bahwa model sekarang mengkonfirmasi 94 % prosedur sensitif sebelum mengimplementasikannya, dengan konfirmasi 100 % transaksi keuangan. Kapasitas injeksi segera juga menurun dari 23 % menjadi 20 %.

Perlu dicatat bahwa operator O3 mempertahankan batasan hati -hati pada interaksi web risiko tinggi, seperti platform e -mail atau keuangan, seperti yang mungkin diperlukan oleh pengawasan pengguna dengan menempatkan arloji atau menolak untuk menindaklanjuti secara eksplisit. Langkah -langkah ini adalah bagian dari pendekatan kelas keselamatan yang menggabungkan daya tahan pada tingkat model dan pemantauan waktu aktual.

Sementara promosi ke operator adalah peningkatan teknis, itu juga mencerminkan komitmen berkelanjutan Openai untuk menyebarkan kecerdasan buatan yang bertanggung jawab.

Kemampuan sistem untuk mengambil tindakan di dunia nyata memberikan risiko baru, dan tim pengembangan terus meningkatkan protokol keselamatannya.

menurut O3 -upModel ini tetap kurang dari ambang pintu berisiko tinggi dalam kategori -kategori seperti penyalahgunaan biologis dan kimia dan tidak memiliki lingkungan pengkodean lokal atau akses penghancuran, yang mengurangi potensi vektor penyalahgunaan.

Operator tetap menjadi inspeksi penelitian dan hanya dapat diakses untuk pengguna ChatGPT Pro. Versi API dari operator akan melanjutkan model GPT-4O, setidaknya saat ini.

Efek dari pembuat keputusan teknis dari lembaga

Operator promosi berdiri untuk meningkatkan fungsi para profesional dalam rekayasa kecerdasan buatan, koordinasi, manajemen data, dan keamanan teknologi informasi.

Bagi mereka yang membangun atau memelihara model pembelajaran otomatis, keakuratan model yang ditingkatkan dan output terstruktur mengurangi biaya umum untuk memverifikasi pengujian tes dan mengeksplorasi dan memperbaiki kesalahan.

Dalam konteks sinkronisasi, ini menyediakan alat yang praktis dan andal untuk mengotomatisasi bahan berdasarkan browser untuk jaringan pipa yang kompleks.

Insinyur data dapat mendelegasikan interaksi web manual-seperti verifikasi data dan mengabaikan dengan lebih banyak kepercayaan diri, dan waktu luang untuk meningkatkan peningkatan di tingkat yang lebih tinggi.

Sementara itu, para profesional keamanan mendapatkan cara yang lebih aman untuk mensimulasikan perilaku pengguna dalam cek dan kecelakaan latihan respons, berkat mekanisme keselamatan dengan lapisan khas.

Melalui jurusan -jurusan ini, pemain O yang berdasarkan O3 memberikan kemampuan untuk meningkatkan daya dan kerangka kerja bantuan risiko, yang menjadikannya tambahan praktis untuk kumpulan alat teknis modern.


Tautan sumber
Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Berita

Apa itu di dalam ginsbark? Pendekatan kerja baru yang memberikan alur kerja yang kaku untuk faktor independen

Published

on


Agen Genspark membuktikan bahwa lebih sedikit kontrol atas jalannya pekerjaan yang kaku, memaksa para pemimpin AI yayasan untuk memikirkan kembali

Tautan sumber

Continue Reading

Berita

Trump bertemu dengan para pemimpin NATO setelah kebiasaan “pekerjaannya di Iran”

Published

on

baruAnda sekarang dapat mendengarkan Fox News!

presiden Donald Trump Dijadwalkan untuk naik panggung utama pada hari kedua KTT NATO di Den Haag, Belanda – yang memberikan nada ramah yang luar biasa terhadap koalisi yang telah lama mengkritiknya.

Presiden dijadwalkan untuk bertemu dengan Sekretaris NATO -General Mark Root dan para pemimpin dunia lainnya sebelum konferensi pers.

Trump juga mengatakan bahwa ia akan memberi hormat kepada Presiden Ukraina Folodimir Zellinski, yang menghadiri KTT di tengah dorongan terus -menerus ke Ukraina Bergabunglah dengan NATO.

Dalam pesan teks Trump, roti memberi selamat kepadanya tentang “membuat Eropa membayar sangat” melalui tujuan pengeluaran pertahanan baru sebesar 5 % – dan pada mediasi dalam konflik baru -baru ini antara Israel dan Iran.

Trump sedang menuju ke KTT NATO, sementara Eropa setuju untuk memperhatikan tuntutan pengeluaran pertahanan

Trump pergi ke KTT NATO, di mana para pemimpin dunia akan mencapai kesepakatan untuk meningkatkan pengeluaran defensif mereka hingga 5 % dari PDB. (Gambar Andrew Harnik/Getty)

“Selamat dan terima kasih atas pekerjaan Anda yang menentukan di Iran. Itu benar -benar tidak biasa, dan sesuatu yang tidak ada yang berani lakukan,” tulis Root, sementara Trump terbang menuju puncak. “Semuanya membuat kita lebih aman.”

Israel dan Iran memasuki gencatan senjata di Amerika Serikat pada hari Selasa-meskipun Israel membatalkan serangan baliknya berdasarkan urgensi Trump.

“Anda terbang ke kesuksesan besar lain di Den Haag malam ini,” tambah Roti, merujuk pada perjanjian baru bagi anggota NATO untuk meningkatkan pengeluaran pertahanan hingga 5 % dari PDB.

Allies NATO pertama kali setuju pada tahun 2006 untuk menghabiskan 2 % dari PDB untuk pertahanan – tujuan banyak orang gagal bertemu selama bertahun -tahun. Sekarang, setelah undangan berulang -ulang Trump ke Eropa “untuk mengumpulkan bobotnya”, aliansi sepakat untuk lebih banyak Target 5 % ambisiusDengan pengecualian Spanyol, yang telah lama berjuang untuk memenuhi standar asli.

Jumlah baru dibagi menjadi 3,5 % untuk pengeluaran pertahanan dasar, 1,5 % untuk infrastruktur yang relevan, termasuk cyberwarfare dan intelijen. Duta Besar NATO menyetujui teks penyelesaian pada hari Minggu.

Apa yang bisa diharapkan di KTT NATO mendatang: Trump, pengeluaran, Ukraina, Iran

Sekretaris NATO -General Mark Retty membahas selama pernyataan bergabung.

Sekretaris NATO -Mark Mark Roty Trump memberi selamat gencatan senjata atas Iran dan membujuk Eropa untuk meningkatkan pengeluaran pertahanannya (Nicholas Tokat/Reuters)

Bagi sebagian besar sekutu, target mewakili lompatan besar. Polandia saat ini mengarahkan semua negara anggota sebesar 4,1 % dari PDB ke pertahanan. Amerika Serikat berdiri di 3,4 %.

Trump mengatakan dia tidak percaya bahwa Amerika Serikat perlu mencapai ambang batas 5 % penuh – sikap yang didukung oleh Root.

“Amerika Serikat sudah menghabiskan sekitar 3,5 % untuk pertahanan dasar, dan tidak ada keraguan bahwa itu akan menghabiskan 1,5 % untuk hal -hal pertahanan,” kata Root. “Negara -negara seperti Estonia dan Polandia sangat dekat. Bagi banyak orang lain, itu akan tetap jauh ke depan, tetapi sangat penting untuk melakukan itu.”

Presiden Ukraina Voludmir Zelinski tiba saat makan malam untuk para kepala NATO dan pemerintah yang diselenggarakan oleh Raja Belanda William Alexander dan Ratu Belanda Maxima, di sela -sela KTT NATO, di House Tin Bush Palace di Den Haag, Belanda 24 Juni.

Trump juga mengatakan bahwa ia akan memberi hormat kepada Presiden Ukraina Folodimir Zelinsky, yang menghadiri KTT di tengah kumpulan Ukraina yang berkelanjutan untuk bergabung dengan NATO. (Christian Hartmann/Reuters)

Dia juga meminta industri pertahanan “di kedua sisi Samudra Atlantik” untuk meningkatkan produksi.

Routy mengatakan pada hari Selasa: “Tidak masuk akal bahwa Rusia, dengan ekonomi 25 kali, mampu memiliki keunggulan dan keunggulan kita,” kata Roti pada hari Selasa. Dan Eropa mendesak: “Buat pertahanan Anda begitu kuat sehingga tidak ada yang berani menyerang Anda.”

Terlepas dari kemajuan yang dibuat, keraguan Trump yang sekecil apa pun adalah apakah Amerika Serikat akan berkomitmen untuk menyebarkan pertahanan bersama di NATO – Pasal 5 – yang mewajibkan anggota untuk saling membela jika terjadi serangan.

“Ini tergantung pada definisi Anda,” kata Trump ketika ditanya apakah dia akan menghormati komitmen. “Ada banyak definisi Pasal 5, Anda tahu, kan? Tapi saya berkomitmen untuk menjadi teman mereka. Saya telah menjadi teman dari banyak pemimpin ini, dan saya berkomitmen untuk membantu mereka.”

Klik di sini untuk mendapatkan aplikasi Fox News

Namun, Duta Besar AS untuk NATO Matthew Whitaker berusaha meyakinkan sekutu, dan mengatakan kepada wartawan, “Amerika Serikat tidak pergi ke mana pun.”

Dia menceritakan pesan ini, dan saya meminta para mitra untuk “berhenti mengkhawatirkan” dan fokus pada memperkuat pertahanan mereka.

Tautan sumber

Continue Reading

Berita

Chatehr dari Stanford memungkinkan dokter untuk menanyakan tentang catatan medis pasien menggunakan bahasa alami, tanpa mengorbankan data pasien

Published

on

Bergabunglah dengan acara bahwa para pemimpin lembaga telah dipercaya selama hampir dua dekade. VB Transform menggabungkan orang yang membangun strategi AI untuk institusi nyata. Pelajari lebih lanjut


Bagaimana cara mengobrol dengan catatan kesehatan dengan cara yang dengan chatgpt?

Awalnya, seorang mahasiswa kedokteran mengajukannya, pertanyaan ini mengangkat perkembangan Chatehr Stanford Healthcare. Sekarang dalam produksi, alat ini mempercepat ulasan rencana untuk masuk ke ruang gawat darurat, menyederhanakan ringkasan transfer pasien dan mengumpulkan informasi dari tanggal medis yang kompleks.

Dalam hasil eksperimen awal, pengguna klinis telah melihat pengambilan informasi secara signifikan; Perlu dicatat bahwa dokter darurat menyaksikan 40 % dari waktu untuk meninjau rencana selama operasi pengiriman kritis, kata Michael A. VB mengonversi.

Ini membantu mengurangi kelelahan dokter Anda saat meningkatkan perawatan pasien, dan membangun kontrak fasilitas medis yang Anda lakukan untuk mengumpulkan data dan otomatisasi penting.

“Ini adalah waktu yang menyenangkan di bidang perawatan kesehatan karena kami menghabiskan dua puluh tahun terakhir dalam penomoran data perawatan kesehatan dan menempatkan mereka dalam catatan kesehatan elektronik, tetapi kami tidak benar -benar mengubahnya,” kata Bouver dalam obrolan dengan editor VB -in -dalam -chief. “Dengan teknik model bahasa besar baru, kami sudah mulai melakukan transformasi digital ini.”

Bagaimana Chatehr membantu mengurangi “waktu piyama”, kembali ke reaksi wajah nyata

Dokter menghabiskan hingga 60 % dari waktu mereka dalam tugas administrasi alih -alih merawat pasien langsung. Mereka sering mengenakan misi “Waktu piyama“Pengorbanan Jam pribadi dan keluarga untuk menyelesaikan tugas administrasi di luar jam kerja normal.

Salah satu tujuan Pfeffer yang besar adalah menyederhanakan alur kerja dan mengurangi jam tambahan ini sehingga dokter dan karyawan administrasi dapat fokus pada pekerjaan yang lebih penting.

Misalnya, banyak informasi datang melalui gerbang online pasien. Kecerdasan buatan sekarang memiliki kemampuan untuk membaca pesan dari pasien dan menyusun respons yang dapat ditinjau dan disetujui seseorang.

“Ini adalah jenis titik awal,” jelasnya. “Meskipun tidak harus menghemat waktu, yang menarik, itu benar -benar mengurangi kelelahan kognitif.” Dia menunjukkan bahwa pesan cenderung lebih ramah untuk pasien, karena pengguna dapat mengarahkan model untuk menggunakan bahasa tertentu.

Dengan pindah ke agen, Pfeffer mengatakan mereka adalah konsep “baru” di bidang perawatan kesehatan tetapi memberikan peluang yang menjanjikan.

Misalnya, pasien dengan diagnosis kanker biasanya memiliki tim spesialis yang meninjau catatan mereka dan menentukan langkah -langkah pengobatan berikut. Namun, persiapannya banyak pekerjaan. Dokter dan karyawan harus lulus catatan seluruh pasien, tidak hanya EHR tetapi juga penyakit fotografi, kadang -kadang data genetik, dan informasi tentang uji klinis yang mungkin merupakan pasien yang cocok dengan baik. Pfeffer menjelaskan bahwa semua ini harus berkumpul dengan tim untuk membuat jadwal dan rekomendasi.

“Hal terpenting yang dapat kami lakukan untuk pasien kami adalah memastikan bahwa mereka memiliki perawatan yang tepat, dan dibutuhkan pendekatan multidisiplin,” kata Bajar.

Tujuannya adalah untuk membangun agen di Chatehr yang dapat menghasilkan ringkasan, jadwal waktu dan mengirimkan rekomendasi untuk meninjau dokter. Pfeffer menekankan bahwa itu tidak diganti, karena sedang mempersiapkan “hanya rekomendasi ringkasan yang luar biasa.”

Hal ini memungkinkan tim medis untuk melakukan “perawatan aktual pasien” sekarang, yang sangat penting di dokter dan kekurangan keperawatan.

“Teknologi ini akan mengubah waktu yang dihabiskan dokter dan perawat dalam melakukan tugas administrasi,” katanya. Dan ketika dikombinasikan dengan petugas AI di sekitarnya yang mengambil kendali atas tugas, staf medis lebih memfokuskan waktu pada pasien.

“Reaksi ini adalah wajah wajah yang sangat berharga.” “Kita akan melihat Amnesty International lebih beralih ke interaksi dokter dan pasien.”

Teknik “Luar biasa” bersama tim multidisiplin

Sebelum Catehr, tim Pfeffer telah meluncurkan SecureGpt ke semua Stanford Medicine; Gerbang aman memiliki 15 model berbeda yang dapat dirusak oleh siapa pun. “Yang benar -benar kuat dalam teknologi ini adalah Anda benar -benar dapat membukanya bagi banyak orang untuk pengalaman,” kata Bajar.

Stanford mengikuti pendekatan yang beragam untuk mengembangkan kecerdasan buatan, membangun modelnya sendiri dan menggunakan campuran rak yang aman dan pribadi (seperti Microsoft Azure) dan model open source bila diperlukan. Pfeffer menjelaskan bahwa timnya “tidak cukup spesifik” untuk satu atau yang lain, tetapi lebih lanjut melanjutkan apa yang akan lebih baik untuk keadaan penggunaan tertentu.

Dia berkata: “Ada begitu banyak jenis teknologi luar biasa sekarang sehingga jika Anda dapat mengumpulkannya bersama dengan cara yang benar, Anda bisa mendapatkan solusi seperti yang telah kami bangun.”

Kredit lain untuk Stanford adalah tim multidisiplinnya; Berbeda dengan karyawan intelijen buatan yang hebat atau kelompok amnesti internasional, Pfeffer mengumpulkan kepala data, dua ilmuwan informasi, seorang pejabat utama informasi medis, seorang petugas informasi keperawatan, CTO dan CISO.

Dia berkata: “Kami menggabungkan informatika, ilmu data dan tradisional, dan membungkusnya dalam arsitektur; yang Anda dapatkan adalah grup ajaib ini yang memungkinkan Anda melakukan proyek yang sangat kompleks ini.”

Pada akhirnya, Stanford melihat Amnesty International sebagai alat yang harus diketahui setiap orang, seperti yang dikonfirmasi Pfeffer. Berbagai tim perlu memahami bagaimana kecerdasan buatan digunakan ketika mereka bertemu dengan pemilik bisnis dan menemukan cara untuk menyelesaikan masalah, “Kecerdasan buatan hanyalah bagian dari cara berpikir mereka.”


Tautan sumber
Continue Reading

Trending