Antropik menjanjikan model AI Clode baru cenderung mencoba menipu Anda

Published

on

Antropik mengatakan model terbarunya lebih baik untuk membangkitkan banyak tugas.

Kredit: Antropologis


Meskipun tidak memiliki presisi yang cukup seperti Chatzpt atau Google Jemini, bot AI yang dikembangkan oleh para antropolog terus meningkat dan berinovasi. Model Claud 4 baru sekarang menjanjikan peningkatan terkait dengan tugas yang tersedia, pengkodean, logika, akurasi, dan lama.

Ada dua model baru, Claud Opus 4 dan Clock Sonnet 4, dan para antropolog mengatakan bahwa mereka berdua “telah menetapkan nilai baru” untuk apa yang dapat mereka harapkan dari AI. Pengkodean adalah fokus besar, dan model diketahui telah mencapai skor tertinggi sampai saat ini di dua peralatan pembandingan pengkodean AI yang paling banyak digunakan, kebutuhan, dan bangku terminal. Model Clod 4 sebenarnya dapat mengerjakan proyek pada proyek tanpa input pengguna, EtnografiItu

Model yang diperbarui lebih baik untuk menangani lebih banyak langkah di seluruh tugas yang kompleks, untuk men -debug pekerjaan mereka sendiri dan memecahkan masalah kompleks di jalan. Instruksi pengguna mereka harus diikuti lebih lanjut dan hasil akhirnya harus dibuat yang terlihat lebih baik dan bekerja lebih andal. Etnografi Kutipan Mitra Seperti GitHub, kursor dan Rakuten dalam menjelaskan bagaimana langkah -langkah model ini.

Jauh dari pembuatan kode dan analisis, model menghasilkan pemikiran yang ditingkatkan, kemampuan untuk bekerja secara parallelly beberapa tugas dan memori canggih. Mereka lebih baik mengintegrasikan pencarian web sesuai persyaratan dan untuk menguji informasi pendukung dan untuk memastikan bahwa mereka berada di arah yang benar dengan jawaban mereka.

Peluncuran model AI baru biasanya menunjukkan peningkatan dengan bagan tolok ukur – dan itu tidak berbeda.
Kredit: Antropologis

Juga “pemikiran pemikiran” yang baru yang diluncurkan Clod 4 mencapai kesimpulannya dan fitur “pemikiran yang diperluas” yang diluncurkan di Bita memberi Anda lebih banyak wawasan yang memaksa Anda untuk mengambil lebih banyak waktu ke AI bot.

Antropik sekarang lebih umum tersedia untuk peralatan setelan kode berpakaiannya, agen adalah langkah lain menuju AI yang dapat bekerja secara otomatis tanpa bantuan terus menerus dari pengguna daging dan darah. Dalam video demo, model Claud 4 ditampilkan dari web untuk menyusun makalah penelitian, menggabungkan sistem pemesanan online, dan informasi dari dokumen untuk membuat tugas fungsional.

Clod 4 sekarang tersedia (tetapi Anda perlu membayar model yang lebih canggih)

Model Claud Sonnet 4, yang tidak memiliki kapasitas yang cukup untuk pemikiran, pengkodean dan memori, sekarang tersedia untuk semua pengguna yang berpakaian. Claud Oppus 4 yang lebih maju, juga mencakup peralatan tambahan dan integrasi, tersedia untuk setiap pengguna berlangganan yang diberikan etnografi.

Mode moder Clod 4 ini bukan seseorang seseorang: antropolog mengatakan mitra dalam konsultasi perlindungannya Peringatan Versi model sebelumnya diekspresikan karena “skema” mereka dan kecenderungan untuk menipu. Topik -topik ini sekarang jelas berfungsi, tetapi merupakan pengingat bahwa model AI harus melampirkan fitur pemeliharaan dan perlindungan canggih mereka sebagai semakin kuat.

Menurut Anda, bagaimana sejauh ini?

Model baru sekarang ditemukan di dalam Claud.
Kredit: Lifhoker

Saya tidak benar -benar seorang pembuat kode, jadi saya tidak dapat berkomentar dengan otoritas sejati dalam peningkatan awal yang disertakan dengan Claud 4, tetapi saya telah dapat menguji argumen yang diperluas dan pemikiran Claud Sonnet 4 dan Cloud Opus 4. Tidak mudah untuk menentukan atau mengukur jumlah kemampuan ini, tetapi semua reaksi yang saya terima ditulis secara tertulis dan seperti informasi yang dapat diberikan, saya dapat memberikan informasi tersebut.

Terus terang, saya selalu sedikit terjebak ketika saya dapat sepenuhnya menggunakan AI Chattabot dan peningkatan terbaru mereka. Mereka pasti dapat menghemat waktu saat mencari dan meneliti web online tertentu, tetapi saya tidak sepenuhnya mempercayai hasilnya, atau apa yang relevan dan apa yang bukan kemampuan AI untuk memutuskan – meskipun saya masih lambat membaca dan detail singkat, saya masih ingin melakukan lebih banyak lagi.

Ada mode berpikir baru yang dapat Anda gunakan.
Kredit: Lifhoker

Mungkin saya harus memulai proyek pengkodean dan melihat seberapa jauh saya bisa pergi ke saudara kandung sendirian. Saya meminta Claud Opus 4 untuk menjadikan saya pelacak waktu HTML sederhana yang dapat saya jalankan pada tab browser untuk memastikan bahwa saya bingung di siang hari. Itu telah melakukan pekerjaan dalam beberapa menit dan menciptakan sesuatu yang telah dilakukan dengan baik, cocok dengan instruksi yang saya berikan. Saat bekerja dengan baik, Claud mengatakan sejumlah kekurangan pada 4 cara, yang tentu saja saya tidak mengerti – saya kira saya bisa bertanya kepada mereka tentang AI tentang mereka.

Antropik bukan satu -satunya perusahaan AI yang menggembar -gemborkan model baru. Awal pekan ini, di Google I/O 2025, agensi tersebut meluncurkan beberapa minggu yang lalu dari pengumuman model AI terbaiknya. Openai, sudah, telah memeriksa model GPT -4.5 dari Februari, meningkatkan pengkodean dan pemecahan masalah.



Tautan sumber

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Trending

Exit mobile version