Pendapat
Model AI terbaru Google menggunakan browser web seperti Anda
Google melihat model Gemini baru AI, yang dirancang untuk menavigasi dan berinteraksi dengan web melalui browser, yang memungkinkan agen AI melakukan hal -hal dalam antarmuka yang dirancang untuk digunakan oleh orang dan bukan robot. Modelnya, Disebut Gemini 2.5 Penggunaan KomputerGunakan “pemahaman visual dan sumber daya penalaran” untuk menganalisis permintaan pengguna dan melakukan tugas, seperti mengisi dan mengirim formulir.
Ini dapat digunakan untuk pengujian antarmuka pengguna atau menavigasi antarmuka yang dibuat untuk orang yang tidak memiliki API atau koneksi langsung lainnya yang tersedia. Versi lain dari model ini telah digunakan untuk AI dan Project Mariner Mode, prototipe pencarian yang menggunakan agen AI untuk melakukan tugas pada browser, seperti menambahkan item ke keranjang Anda berdasarkan daftar bahan.
Pengumuman Google terjadi hanya sehari setelah OpenAI telah mengungkapkan aplikasi baru untuk ChatGPT sebagai bagian dari hari dev dev Anda dan terus memusatkan perhatian Anda pada fitur agen chatgpt, yang dapat menyelesaikan tugas rumit atas nama Anda. Sementara itu, antropik telah merilis versi model AI Claude -nya dengan “Penggunaan Komputer” tahun lalu.
Google memposting beberapa video demo yang menunjukkan alat penggunaan komputer dalam tindakan dan catatan bahwa mereka mempercepat 3x.
Google mengatakan model penggunaan komputer Anda “melampaui alternatif utama dalam berbagai tolok ukur dan furnitur web.” Tidak seperti ChatGPT Agent dan alat penggunaan komputer Anthropic, model AI baru Google hanya memiliki akses ke browser – bukan seluruh lingkungan komputer. Google mencatat bahwa itu menunjukkan “belum dioptimalkan untuk mengendalikan tingkat area kerja” dan saat ini mendukung 13 TindakanTermasuk pembukaan browser web, teks mengetik dan menyeretnya dan melonggarkan elemen.
Gemini 2.5 Penggunaan komputer tersedia untuk pengembang melalui Google AI Studio dan Vertex AI, tetapi ada juga Demonstrasi di browserDi mana Anda menonton ketika Anda menyelesaikan tugas -tugas seperti “Mainkan Game 2048” atau “Cari Berita Berita Berita Berita untuk Debat Trending.”