Berita
Google Cloud menargetkan CoreWeave dan AWS dengan Slurm terkelola untuk pelatihan AI tingkat perusahaan
Beberapa perusahaan mendapatkan layanan terbaik dengan menyesuaikan model yang lebih besar dengan kebutuhan mereka, namun sejumlah perusahaan berencana untuk melakukannya Membangun model mereka sendirisebuah proyek yang memerlukan akses ke unit pemrosesan grafis.
Google Cloud ingin memainkan peran yang lebih besar dalam perjalanan pemodelan perusahaan dengan layanan barunya. Pelatihan Vertex AI. Layanan ini memberi organisasi yang ingin melatih model mereka sendiri akses ke lingkungan terkelola Slurm, alat ilmu data, dan chipset apa pun yang mampu melatih model dalam skala besar.
Dengan layanan baru ini, Google Cloud berharap dapat menjauhkan lebih banyak organisasi dari penyedia lain dan mendorong pengembangan lebih banyak model AI perusahaan.
Meskipun Google Cloud selalu menawarkan kemampuan untuk menyesuaikan model Gemini, layanan baru ini memungkinkan pelanggan untuk membawa model mereka sendiri atau menyesuaikan model sumber terbuka apa pun ke host Google Cloud.
Pelatihan Vertex AI mengadu Google Cloud secara langsung dengan perusahaan sejenis IntiWeave Dan Laboratorium Lambdaselain pesaing cloud-nya Os Dan MicrosoftAzure.
Jaime de Guerre, direktur senior manajemen produk di Gloogle Cloud, mengatakan kepada VentureBeat bahwa perusahaan mendengar dari banyak organisasi dengan berbagai ukuran bahwa mereka memerlukan cara untuk mengoptimalkan komputasi dengan lebih baik tetapi dalam lingkungan yang lebih andal.
“Apa yang kami lihat adalah semakin banyak perusahaan yang membangun atau menyesuaikan model AI besar untuk memberikan penawaran produk berdasarkan model tersebut, atau untuk membantu meningkatkan bisnis mereka dengan cara tertentu,” kata De Guerre. “Hal ini mencakup startup AI, perusahaan teknologi, organisasi berdaulat yang sedang membangun model untuk wilayah, budaya atau bahasa tertentu, dan beberapa perusahaan besar yang mungkin sedang membangun operasi internal.”
De Guerre mencatat bahwa meskipun secara teknis siapa pun dapat menggunakan layanan ini, Google menargetkan perusahaan yang merencanakan pelatihan model skala besar daripada pengguna LoRA atau penyempurnaan sederhana. Vertex AI Services akan fokus pada pekerjaan pelatihan jangka panjang yang melibatkan ratusan atau bahkan ribuan chip. Penetapan harga akan bergantung pada seberapa banyak komputasi yang dibutuhkan suatu organisasi.
“Melatih Vertex AI bukan tentang menambahkan lebih banyak informasi ke dalam konteks atau menggunakan RAG; ini tentang melatih model di mana Anda dapat memulai dari bobot yang sepenuhnya acak,” katanya.
Kustomisasi formulir sedang meningkat
Perusahaan menyadari nilai membangun model khusus yang lebih dari sekadar menyempurnakan LLM mereka melalui recall augmented generation (RAG). Formulir khusus akan mengetahui informasi lebih rinci tentang perusahaan dan merespons dengan jawaban khusus organisasi. Perusahaan seperti Arcee.ai saya mulai Kirimkan model mereka Dapat disesuaikan untuk pelanggan. Adobe Baru-baru ini mengumumkan layanan baru yang memungkinkan bisnis Firefly dilatih ulang untuk memenuhi kebutuhannya sendiri. Organisasi seperti FicoYang menciptakan model linguistik kecil Khusus untuk industri keuangan,Mereka sering membeli GPU untuk pelatihan dengan harga mahal.
Google Cloud mengatakan Vertex AI Training membedakan dirinya dengan menyediakan akses ke rangkaian chip dan layanan yang lebih luas untuk memantau dan mengelola pelatihan serta keahlian yang dipelajari dari pelatihan model Gemini.
Beberapa pelanggan awal Vertex AI Training meliputi: Amnesty Internasional Singapurasebuah konsorsium lembaga penelitian dan startup Singapura yang membangun SEA-LION versi 4 dengan 27 miliar parameter, dan Tenaga penjualanTim Peneliti Kecerdasan Buatan.
Perusahaan sering kali harus memilih antara mengambil LLM yang sudah dibangun dan menyempurnakan atau membangun model mereka sendiri. Namun membuat LLM dari awal biasanya tidak dapat dicapai oleh usaha kecil, atau tidak masuk akal untuk beberapa kasus penggunaan. Namun, bagi organisasi yang menginginkan model kustom atau model awal, masalahnya adalah akses ke GPU yang diperlukan untuk menjalankan pelatihan.
Pelatihan model bisa mahal
Melatih modelnya bisa seperti itu, kata De Guerre Sulit dan mahalterutama ketika perusahaan bersaing dengan banyak perusahaan lain untuk mendapatkan ruang GPU.
Perusahaan-perusahaan berskala besar seperti AWS dan Microsoft – dan ya, Google – telah menunjukkan bahwa pusat data besar mereka serta rak-rak chip mutakhir memberikan nilai tertinggi bagi perusahaan. Mereka tidak hanya memiliki akses ke GPU yang mahal, tetapi penyedia cloud sering kali menawarkan layanan terintegrasi untuk membantu organisasi beralih ke produksi.
Layanan seperti CoreWeave menjadi terkenal dalam menyediakan akses sesuai permintaan ke… Nvidia H100s, memberikan pelanggan fleksibilitas dalam daya komputasi saat membuat model atau aplikasi. Hal ini juga memunculkan model bisnis di mana perusahaan pemilik GPU menyewa ruang server.
De Guerre mengatakan Pelatihan Vertex AI bukan hanya tentang menyediakan akses ke model pelatihan komputasi telanjang, di mana organisasi menyewa server GPU; Mereka juga harus membawa program pelatihan mereka sendiri dan mengatur waktu dan kegagalan.
“Ini adalah lingkungan Slurm terkelola yang akan membantu penjadwalan pekerjaan penuh dan pemulihan otomatis pekerjaan yang gagal,” kata De Guerre. “Jadi, jika misi pelatihan melambat atau berhenti karena kegagalan perangkat keras, pelatihan akan dimulai ulang secara otomatis dengan sangat cepat, berdasarkan proses verifikasi otomatis yang kami lakukan dalam manajemen pos pemeriksaan untuk melanjutkan dengan waktu henti yang sangat sedikit.”
Hal ini memberikan throughput yang lebih tinggi dan pelatihan yang lebih efisien untuk cluster komputasi yang lebih luas, tambahnya.
Layanan seperti Pelatihan Vertex AI dapat memudahkan organisasi untuk membangun model khusus atau menyesuaikan sepenuhnya model yang ada. Namun, hanya karena ada suatu pilihan tidak berarti pilihan tersebut tepat untuk setiap organisasi.