Berita

Di dalam Google: Gemini 2.5 Jump lebih dalam, pembicaraan lebih cerdas dan kode lebih cepat

Published

5 bulan ago

Mei 21, 2025

Wadi Wibowo

Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut

Google Lebih dari tujuannya “AI Global Assistant” dekat dengan pemahaman konteks, perencanaan dan pengambilan langkah.

Hari ini di Google I/O.Raksasa teknologi telah mengumumkan peningkatannya di Gemini 2.5 Flash – sekarang lebih baik di hampir setiap dimensi, termasuk standar untuk berpikir, simbol dan konteks panjang – dan 2.5 Pro, termasuk mode pemikiran yang ditingkatkan eksperimental “, yang memungkinkan para profesional untuk mempertimbangkan beberapa hipotesis sebelum menanggapi.

“Ini adalah tujuan akhir kami dari aplikasi Gemini: Amnesty International, yang merupakan kepribadian, pre -emptive dan kuat,” kata Dimis Hasabis, CEO Google DeepMind, mengatakan dalam formulasi pra -perkampungan.

“Pemikiran mendalam” sangat mengesankan dalam standar yang lebih tinggi

Google telah mengumumkan Gemini 2.5 pro-apa yang dianggap sebagai model yang paling cerdas sejauh ini, dengan jendela jutaan orang- Di bulan MaretDan mengeluarkan versi pengkodean “I/O” awal bulan ini (dengan Hassabis Anda menyebutnya “Model pengkodean terbaik yang pernah kami bangun!”.

“Kami benar -benar terpengaruh oleh orang -orang yang diciptakan oleh orang -orang, dari mengubah grafik menjadi aplikasi interaktif hingga mensimulasikan seluruh kota,” kata akun.

Dia menunjukkan bahwa berdasarkan pengalaman Google dengan Alphao, respons model kecerdasan buatan meningkat saat memberikannya Lebih banyak waktu untuk berpikir. Hal ini menyebabkan para ilmuwan DeepMind mengembangkan Deep Think, yang menggunakan penelitian canggih terbaru di Google untuk berpikir dan berpikir, termasuk teknik paralel.

Deep Think menunjukkan gelar yang mengesankan tentang standar maksimum matematika dan pengkodean, termasuk Olimpiade Amerika Serikat untuk tahun 2025 (TIDAK). Itu juga mengarah LiveCooooObenchStandar yang sulit untuk pengkodean di tingkat persaingan, dan mencatat 84,0 % di GerejaYang menguji pemahaman dan pemikiran multimedia.

“Kami meluangkan waktu ekstra untuk membuat lebih banyak penilaian keselamatan perbatasan dan mendapatkan lebih banyak input dari para ahli keselamatan,” tambah Hassabis. (Artinya: dan saat ini, laboratorium tepercaya tersedia melalui antarmuka pemrograman antarmuka untuk umpan balik sebelum kemampuan tersedia secara luas.)

Secara umum, leadorboard coding prop populer baru yang baru dipimpin Webdev ArenaDengan gelar elo yang mengukur tingkat keterampilan relatif untuk pemain dalam permainan pemain seperti catur-dari 1420 (menengah ke efisiensi). Itu juga mengarah di semua kategori Lana Topik, yang mengevaluasi kecerdasan buatan berdasarkan preferensi manusia.

Sejak diluncurkan, “kami benar -benar terpengaruh oleh apa yang dibuat (pengguna), dari mengubah grafik menjadi aplikasi interaktif hingga mensimulasikan seluruh kota,” kata Hassabis.

Pembaruan penting untuk Gemini 2.5 Pro, Flash

Hari ini, Google telah mengumumkan peningkatan 2,5 flash, model untuk pekerjaan yang dirancang untuk kecepatan, efisiensi, dan biaya rendah. 2.5 Flash telah ditingkatkan di semua bidang dalam kriteria untuk berpikir, simbol, simbol, dan konteks panjang – Hassabis menunjukkan bahwa itu adalah “hanya kedua” menjadi 2.5 Pro di panel lmarna. Model ini juga lebih efisien, menggunakan 20 hingga 30 % dari simbol khas.

Google membuat penyesuaian akhir ke 2,5 flash berdasarkan catatan pengembang; Sekarang tersedia untuk diperiksa di Google AI Studio dan Vertex AI dan di aplikasi Gemini. Secara umum akan tersedia untuk diproduksi pada awal Juni.

Google membawa kemampuan tambahan ke Gueini 2.5 Pro dan 2.5 Flash, termasuk mengeluarkan suara asli untuk menciptakan lebih banyak pengalaman percakapan alami, menetapkan rencana untuk mendukung banyak pembicara, ringkasan berpikir dan anggaran berpikir.

Dengan penyisipan suara asli (dalam inspeksi), pengguna dapat mengarahkan nada Gemini, denyut nadi dan gaya berbicaranya (pikirkan: mengarahkan model menjadi microrami atau modelin saat menceritakan kisahnya). Seperti Project Mariner, model ini juga dilengkapi dengan alat, yang memungkinkannya mencari atas nama pengguna.

Fitur suara eksperimental awal lainnya termasuk dialog emosional, yang memberikan model kemampuan untuk menemukan perasaan dalam suara pengguna dan merespons dengan tepat; Suara pre -emptive yang memungkinkannya untuk menyesuaikan percakapan latar belakang; Memikirkan antarmuka pemrograman aplikasi langsung untuk mendukung tugas yang paling kompleks.

Beberapa fitur baru di kedua Pro dan Flash mendukung lebih dari 24 bahasa, dan model dapat dengan cepat berpaling dari satu nada ke nada lainnya. Koraay Kavukcuoglu, CTO, ditulis oleh Google DeepMind, dan Tulsee Doshi, Direktur Pertama untuk Manajemen Produk di Google DeepMind, di Google Deep Mend, Tolsi, Direktur Senior Manajemen Produk di Google DeepMind, di A. Blog itu diterbitkan hari ini.

Selain itu, 2.5 Pro dan Flash sekarang termasuk ringkasan berpikir dalam API Gemini dan Vertex AI. Ini “mengambil ide -ide mentah dari model dan mengaturnya dengan jelas dengan kepala, detail utama dan informasi tentang tindakan khas, seperti saat alat bekas”, jelas Kavukcuoglu dan Doshi. Tujuannya adalah untuk memberikan format yang lebih terorganisir dan menyederhanakan untuk pemikiran model dan memberikan interaksi kepada pengguna dengan Gemini lebih sederhana untuk dipahami dan dikoreksi.

Seperti 2.5 Flash, Pro sekarang dilengkapi dengan “anggaran berpikir”, yang memberi pengembang kemampuan untuk mengontrol jumlah simbol yang digunakan model untuk berpikir sebelum merespons, atau jika mereka lebih suka, potensi pemikirannya sepenuhnya. Kemampuan ini secara umum akan tersedia dalam beberapa minggu mendatang.

Akhirnya, Google menambahkan dukungan SDK asli ke definisi protokol MCP -Context di antarmuka aplikasi Gemini sehingga model dapat lebih mudah menggabungkannya dengan alat sumber terbuka.

Hassan berkata: “Kita hidup dalam momen yang indah dalam sejarah karena membuat kecerdasan buatan menjadi masa depan baru yang indah. Sudah tidak nyaman.”

Visi harian tentang kasus penggunaan bisnis dengan VB setiap hari

Jika Anda ingin membujuk bos Anda di tempat kerja, Anda telah membahas VB setiap hari. Kami memberi Anda prioritas jurnalistik internal atas apa yang dilakukan perusahaan dengan kecerdasan buatan kebidanan, dari transformasi organisasi hingga operasi penerbitan praktis, sehingga Anda dapat berbagi visi pengembalian investasi maksimum.

Baca Kebijakan Privasi Kami

Terima kasih telah berlangganan. Periksa lebih banyak buletin VB di sini.

Terjadi kesalahan.

Tautan sumber

ridlwan.com

Berita

Di dalam Google: Gemini 2.5 Jump lebih dalam, pembicaraan lebih cerdas dan kode lebih cepat

“Pemikiran mendalam” sangat mengesankan dalam standar yang lebih tinggi

Pembaruan penting untuk Gemini 2.5 Pro, Flash

Leave a Reply

Leave a Reply

Trending

“Pemikiran mendalam” sangat mengesankan dalam standar yang lebih tinggi

Pembaruan penting untuk Gemini 2.5 Pro, Flash

Leave a Reply Batalkan balasan

Leave a Reply

Trending

Leave a Reply