Berita
Google Gemini Gemini 2.5 “AI” diluncurkan secara publik-tetapi ada penangkapan ikan …
Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang
Google Secara resmi diluncurkan Gemini 2.5 Think Deep Perbedaan baru dalam model kecerdasan buatan yang dirancang untuk pemikiran yang lebih dalam dan masalah kompleks, yang menjadi berita utama surat kabar bulan lalu untuk memenangkan medali emas di Olimpiade Matematika Internasional (IMO)-pertama kali model kecerdasan buatan telah mencapai prestasi ini.
Tetapi, Sayangnya TIDAK Model pencocokan untuk medali emas. Faktanya, rilis “Bron” kurang kuat menurut publikasi blog Google dan Logan Kilpatric, yang menjadi dasar produk Google AI Studio.
menyukai Kilpatrick telah diterbitkan di jejaring sosial X: “Ini adalah variasi dalam model IMO Gold kami, yang lebih cepat dan lebih baik untuk penggunaan sehari -hari. Kami juga menawarkan model penuh IMO untuk sekelompok ahli matematika untuk menguji nilai kemampuan penuh.”
Tersedia sekarang melalui aplikasi seluler GeminiModel perunggu ini tersedia untuk pelanggan Rencana Amnesty International lebih mahal daripada AI di Google, AI UltraYang harganya $ 249,99 per bulan dengan promosi mulai 3 bulan dengan tarif berkurang $ 124,99 per bulan untuk pelanggan baru.
AI Impact Series kembali ke San Francisco – 5 Agustus
Tahap selanjutnya dari kecerdasan buatan di sini – apakah Anda siap? Bergabunglah dengan para pemimpin dari Block, GSK dan SAP untuk mengambil tampilan eksklusif tentang cara memulai kembali agen independen dari tugas alur kerja yayasan-dari keputusan dalam waktu yang sebenarnya untuk otomatisasi komprehensif.
Mengamankan tempat Anda sekarang – ruang terbatas: https://bit.ly/3guPlf
Google juga mengatakan dalam publikasi publikasi blog bahwa itu akan membawa pemikiran mendalam dengan dan tanpa integrasi alat untuk “laboratorium tepercaya” melalui antarmuka aplikasi API dalam beberapa minggu mendatang.
Mengapa “berpikir mendalam” sangat kuat
Gemini 2.5 Pikiran dalam tergantung pada keluarga Gemini dari model LLMS besar, menambahkan kemampuan baru yang bertujuan memikirkan masalah -masalah lanjutan.
Dia – dia Ini menggunakan teknik “pemikiran paralel” untuk mengeksplorasi banyak ide secara bersamaan dan termasuk belajar untuk meningkatkan kemampuan mereka untuk menyelesaikan masalah selangkah demi selangkah.
Modelnya Dirancang untuk kasus penggunaan yang mendapat manfaat dari pertimbangan yang diperluas, seperti pengujian tebakan, penelitian ilmiah, dan desain algoritma, Tugas pengulangan kreatif seperti instruksi perangkat lunak dan penyempurnaan desain.
Laboratorium pertama, termasuk matematikawan seperti Michelle Van Jarrel, yang digunakan untuk menyelidiki masalah yang belum diselesaikan dan menghasilkan bukti yang mungkin.
Pengguna dan Pakar Kekuatan dari Kecerdasan Buatan, Ethan Malik, Profesor Bisnis Warton di University of Pennsylvania, Itu juga diterbitkan di x Dia dapat mengambil klaim bahwa dia sering digunakan untuk menguji kemungkinan model baru – “Buat sesuatu yang dapat saya tempel di P5JS, yang akan membuat saya takjub dengan kecerdasannya dalam menciptakan sesuatu yang membutuhkan panel kontrol bintang di masa depan yang jauh” – dan dan Saya mengubahnya menjadi gambar tiga dimensi, pertama kali model apa pun melakukannya.
Standar Kinerja dan Kasus Penggunaan
Google menyoroti banyak area aplikasi utama untuk pemikiran yang mendalam:
- Matematika dan Sains: Model dapat mensimulasikan pemikiran tentang bukti kompleks, mengeksplorasi tebakan, dan interpretasi literatur ilmiah yang berat
- Desain pengkodean dan algoritma: Ini bekerja dengan baik pada tugas yang melibatkan badan kinerja, kompleksitas waktu, dan logika multi -langkah
- Pengembangan Kreatif: Dalam skenario desain seperti seni rubah atau antarmuka pengguna, pemikiran mendalam menunjukkan kekambuhan yang lebih kuat dan peningkatan detail
Model juga Melakukan penilaian standar seperti LiveCodebeench V6 (Untuk kemampuan pengkodean) Dan ujian terakhir untuk kemanusiaan (Cakupan matematika, sains dan pemikiran).
Dia – dia Gimini 2.5 Pro dan model yang bersaing seperti Openai’s GPT-4 dan Xai’s Grok 4 dilampaui Melalui margin bilangan ganda dalam beberapa kategori (pemikiran dan pengetahuan, menghasilkan kode, dan matematika IMO 2025).
Gemini 2.5 Think Deep versus Gemini 2.5 Pro
Sementara The Deep Think dan Gemini 2.5 Pro adalah bagian dari formulir Gemini 2.5, Google menempatkan Google Think Variabel dan analitik yang lebih mampuTerutama ketika datang ke pemikiran yang kompleks dan memecahkan banyak masalah.
Peningkatan ini berasal dari penggunaan Pemikiran paralel Dan Memperkuat teknik pembelajaranYang memungkinkan model untuk mensimulasikan musyawarah kognitif terdalam.
Dalam kontak resminya, Google menggambarkan pemikiran mendalam sebagai yang terbaik Berurusan dengan klaim yang akurat, mengeksplorasi banyak hipotesis, dan menghasilkan output yang lebih akurat. Ini didukung oleh perbandingan berdampingan dalam seni rubah, di mana pemikiran yang mendalam menambah lebih banyak tekstur, kesetiaan struktural, dan keragaman sintetis 2.5 Pro.
Perbaikan tidak hanya visual atau anekdotal. Google menyebutkan pemikiran yang dalam itu Gimini 2.5 Pro mengungguli beberapa standar teknis Tentang, menghasilkan kode, dan pengalaman domain di seluruh lapangan. Namun, keuntungan ini datang dengan gejala respons dan penerimaan langsung.
Ini adalah keruntuhan:
Kemampuan / fitur | Gemini 2.5 Pro | Gemini 2.5 Pikiran mendalam |
---|---|---|
Kecepatan KESIMPULAN | Waktu transisi yang lebih cepat dan rendah | Perlambat, “waktu berpikir” yang diperpanjang |
Kompleksitas pemikiran | sedang | Tinggi – menggunakan pemikiran paralel |
Kedalaman dan kreativitas langsung | Bagus | Lebih detail dan akurat |
Kinerja standar | kuat | canggih |
Keamanan konten dan obyektivitas nada | Itu meningkatkan model lama | Meningkatkan lebih banyak peningkatan |
Tingkat penolakan (klaim jinak) | minimum | lebih tinggi |
Panjang output | standar | Mendukung tanggapan yang lebih lama |
Seni / Desain Faksel adalah ketulusan | Struktur adegan dasar | Detail dan kekayaan yang ditingkatkan |
Google Perhatikan itu Tingkat penolakan yang tinggi dalam pemikiran mendalam Ini adalah bidang investigasi aktif. Ini dapat membatasi fleksibilitasnya dalam menangani pertanyaan misterius atau informal dibandingkan dengan 2,5 Pro. Sebaliknya, 2.5 Pro masih lebih cocok untuk pengguna yang memberikan prioritas Kecepatan dan responsTerutama untuk tugas yang lebih ringan untuk tujuan umum.
Perbedaan ini memungkinkan pengguna untuk memilih berdasarkan prioritas mereka: 2.5 pro untuk kecepatan dan likuiditasAtau Pikiran yang mendalam tentang kekakuan dan pemikiran.
Ini bukan model memenangkan medali emas, hanya perunggu
Pada bulan Juli, Google Deepmind menduduki puncak berita utama ketika ia mencapai versi yang lebih maju dari model Gemini Deep Think sebagai status resmi emas di sekolah menengah dunia-kompetisi matematika paling terkenal di dunia untuk siswa sekolah menengah.
memesan Lima dari enam masalah sulit dan menjadi Amnesty International pertama yang menerima tingkat emas dari IMO.
Demis Hassabis, CEO Google DeepMind, telah mengumumkan pencapaian X, dengan mengatakan bahwa model tersebut telah memecahkan masalah dari satu sisi tanpa kebutuhan untuk terjemahan untuk membangun kalimat pemrograman total.
Dewan IMO mengkonfirmasi bahwa model tersebut mencetak 35 poin dari 42 poin potensial, jauh lebih tinggi dari ambang emas. Gemini 2.5 Solusi Think Deep Think Deskripsi Kepala Kompetisi, Gregor Dolinear Jelas dan akurat dan dalam banyak kasus, Yang paling mudah ditindaklanjuti pada pesaing manusia.
Namun, Gueini 2.5 Deep Think, yang dirilis kepada pengguna tidak sama dengan model kompetisi, sebaliknya, tampaknya kurang kinerja tetapi tampaknya lebih cepat.
Bagaimana cara berpikir dalam sekarang
Gemini 2.5 Berpikir Mendalam Tersedia secara eksklusif di aplikasi seluler Google Gemini untuk iOS dan Android saat ini untuk pengguna di Paket Google AI UltraBagian dari koleksi langganan Google One, dengan harga sebagai berikut.
- Penawaran Promosi: 124,99 dolar per bulan selama 3 bulan, lalu mulai …
- Tingkat Standar: 249,99 dolar/bulan
- Fitur Termasuk: 30 TB Penyimpanan, Akses ke Gemini dengan Deep Think dan Veo 3, serta alat -alat seperti Flow, Westerk dan 12.500 kredit bulanan kecerdasan buatan
Pelanggan dapat mengaktifkan pemikiran mendalam di aplikasi Gemini dengan memilih model 2.5 Pro dan beralih opsi “Berpikir Deep”.
Ini mendukung sejumlah klaim yang tetap setiap hari dan dikombinasikan dengan kemampuan seperti mengimplementasikan perangkat lunak dan penelitian di Google. Model ini juga menghasilkan output yang lebih lama dan lebih rinci dibandingkan dengan versi standar.
Paket Google AI Pro tingkat rendah, dengan harga $ 19,99 per bulan (dengan pengalaman bebas), tidak termasuk pemikiran yang mendalam, atau Gemini AI gratis.
Mengapa para pembuat keputusan teknis dari lembaga -lembaga itu menjadi perhatian?
Gemini 2.5 Think Deep mewakili aplikasi praktis untuk guru pencarian utama.
Dia – dia Lembaga dan lembaga diizinkan untuk memanfaatkan model Olympiad media dan membuat mereka bergabung dengan karyawan mereka, Dan jika hanya melalui akun pengguna individual sekarang.
Bagi para peneliti yang menerima model IMO penuh, ia menawarkan sekilas masa depan kecerdasan buatan kooperatif dalam matematika. Untuk pelanggan yang unggul, Deep Think memberikan langkah kuat menuju bantuan kecerdasan buatan, yang sekarang Anda jalankan di tangan mereka.
Tautan sumber