Berita

Groq hanya menimbun wajah yang lebih cepat – itu akan datang ke AWS dan Google

Published

5 hari ago

Juni 17, 2025

Wadi Wibowo

Bergabunglah dengan acara bahwa para pemimpin lembaga telah dipercaya selama hampir dua dekade. VB Transform menggabungkan orang yang membangun strategi AI untuk institusi nyata. Pelajari lebih lanjut

jernihAwal dari kesimpulan buatan kecerdasan, dan memainkan peran agresif untuk tantangan penyedia layanan cloud yang terkenal seperti Layanan Web Amazon Dan Google Dengan dua iklan utama dapat membentuk kembali bagaimana pengembang mencapai model AI kinerja tinggi.

Perusahaan mengumumkan pada hari Senin bahwa sekarang mendukung Model Bahasa QWEN3 QWEN3 32B Melalui jendela konteks penuh dari kapasitas 131.000-teknis yang tidak mengklaim bahwa penyedia penalaran cepat lainnya dapat cocok. Pada saat yang sama, Groq menjadi penyedia resmi untuk menyimpulkan Merangkul platform wajahTekniknya cenderung menampilkan jutaan pengembang di seluruh dunia.

Langkah ini adalah Groq yang paling berani di pangsa pasar di pasar inferensi buatan Bedrock AWSDan Google Vertex AIDan Microsoft Azure Ini telah mengendalikan akses nyaman ke model bahasa terkemuka.

“Integrasi pelukan ekosistem Groq yang menyediakan pemilihan pengembang dan mengurangi hambatan yang mencegah masuk ke dalam adopsi kesimpulan AI yang cepat dan efektif untuk GROQ,” kata juru bicara Groq kepada VentureBeat. “Groq adalah satu -satunya penyedia inferensi yang memungkinkan konteks penuh konteks 131k, yang memungkinkan pengembang untuk membangun aplikasi skala besar.”

Bagaimana mengumpulkan jendela konteks groq 131k terhadap daya saing menyimpulkan kecerdasan buatan

Konfirmasi Windows Konteks GROQ – Jumlah teks yang dapat diperlakukan oleh model kecerdasan buatan secara bersamaan – dalam pembatasan dasar yang menderita aplikasi kecerdasan buatan. Sebagian besar penyedia inferensi berjuang untuk mempertahankan kecepatan dan efektivitas biaya ketika berhadapan dengan jendela konteks besar, yang diperlukan untuk tugas -tugas seperti menganalisis seluruh dokumen atau memelihara percakapan yang lama.

Perusahaan pengukuran independen Analisis buatan QWEN3 32B diukur dengan GROQ dalam sekitar 535 simbol per detik, kecepatan yang akan memungkinkan untuk dokumen panjang atau tugas berpikir yang kompleks. Perusahaan harga layanan sebesar 0,29 dolar per juta kode input dan $ 0,59 per juta simbol yang dihasilkan – harga yang merusak banyak penyedia layanan yang diketahui.

Cloud Groq dan Alibaba adalah satu -satunya penyedia yang mendukung jendela konteks QWEN3 32B 131.000, menurut standar independen analisis buatan. Sebagian besar pesaing menawarkan perbatasan yang jauh lebih kecil. (Kredit: Groq)

“Groq menyediakan bahan pokok yang sepenuhnya terintegrasi, karena menyediakan akun inferensi yang dirancang untuk skala, yang berarti bahwa kami dapat terus meningkatkan biaya penalaran sambil memastikan kinerja yang dibutuhkan pengembang untuk membangun solusi AI nyata,” juru bicara itu menjelaskan ketika ditanya tentang kelayakan ekonomi untuk mendukung jendela besar.

Fitur teknis berasal dari groq khusus Unit Pemrosesan Bahasa (LPU)Dirancang khusus untuk inferensi kecerdasan buatan alih -alih unit grafis GPU (GPU) di mana sebagian besar pesaing bergantung. Pendekatan perangkat khusus ini memungkinkan GROQ ini untuk menangani operasi memori yang tebal seperti Windows secara lebih efisien.

Mengapa integrasi Groq dapat menghadapi jutaan pengembang kecerdasan buatan baru

itu Integrasi dengan pelukan wajah Ini mungkin merupakan langkah strategis dari istilah yang paling penting. Huging Face telah menjadi platform aktual untuk pengembangan kecerdasan buatan open source, menjadi tuan rumah ratusan ribu model dan jutaan pengembang per bulan. Dengan menjadi penyedia penalaran resmi, GROQ memungkinkan GROQ untuk mengakses ekosistem yang dikembangkan ini dengan tagihan yang disederhanakan dan akses seragam.

Pengembang sekarang dapat memilih Groq sebagai penyedia langsung di dalam Stadion wajah dipeluk atau APIDengan penggunaan yang dijelaskan pada akun wajah mereka yang merangkul. Integrasi mendukung berbagai model populer termasuk meta Seri komunikasiGoogle Model GemmaDia menambahkan baru -baru ini QWEN3 32B.

“Kerjasama antara memeluk wajah dan GROQ ini merupakan langkah maju yang penting dalam membuat penalaran pria berkinerja tinggi lebih mudah dan efektif,” menurut pernyataan bersama.

Kemitraan ini dapat secara signifikan meningkatkan basis pengguna GROQ dan ukuran transaksi, tetapi juga menimbulkan pertanyaan tentang kemampuan perusahaan untuk mempertahankan kinerja dalam skala besar.

Infrastruktur Groq dapat bersaing dengan AWS Bedrock dan Google Vertex AI dalam skala besar

Saat Anda mengklik rencana ekspansi infrastruktur untuk menangani kemungkinan lalu lintas baru SulamanJuru bicara GROQ GROQ mengungkapkan cetakan global perusahaan saat ini: “Untuk saat ini, infrastruktur global GROQ mencakup situs database di seluruh Amerika Serikat, Kanada dan Timur Tengah, yang melayani lebih dari 20 juta simbol per detik.”

Rencana ekspansi internasional perusahaan terus berlanjut, meskipun tidak ada rincian khusus yang disediakan. Upaya global ini akan sangat penting karena GROQ menghadapi peningkatan tekanan dari pesaing yang didanai dengan baik dengan sumber daya infrastruktur yang lebih dalam.

Amazon DasarMisalnya, ini meningkatkan infrastruktur cloud global yang besar, sementara Google ‘ Kepala ai Ini memanfaatkan jaringan pusat data raksasa di dunia. Microsoft Layanan Openai Azure Demikian juga, ia memiliki dukungan infrastruktur yang mendalam.

Namun, juru bicara GROQ menyatakan kepercayaannya pada pendekatan perusahaan: “Sebagai sebuah industri, kami baru saja memulai pada awal permintaan nyata dengan mengorbankan penalaran. Bahkan jika Groq menerbitkan dua kali jumlah infrastruktur yang direncanakan tahun ini, tidak akan ada kemampuan yang cukup untuk memenuhi permintaan hari ini.”

Bagaimana harga inferensi agresif dapat mempengaruhi model bisnis GROQ

Pasar inferensi ditandai dengan harga agresif dan margin tinggi, karena penyedia layanan bersaing untuk pangsa pasar. Harga kompetitif GROQ menimbulkan pertanyaan tentang profitabilitas jangka panjang, terutama mengingat modal modal yang kuat untuk mengembangkan dan menerbitkan perangkat khusus.

Juru bicara itu mengatakan ketika ditanya tentang jalan menuju profitabilitas: “Seperti yang kita lihat lebih banyak, dan solusi dari kecerdasan buatan baru datang ke pasar dan diadopsi, permintaan untuk menyimpulkan pertumbuhan akan berlanjut pada tingkat yang keras.” “Tujuan utama kami adalah untuk memperluas ruang lingkup permintaan ini, dan untuk mendapatkan manfaat dari infrastruktur kami untuk membayar biaya perhitungan kesimpulan sebanyak mungkin dan memungkinkan ekonomi kecerdasan buatan di masa depan.”

Strategi ini – taruhan pada pertumbuhan besar -besaran dalam ukuran untuk mencapai profitabilitas meskipun margin rendah – mencerminkan kurikulum yang diambil oleh penyedia layanan infrastruktur lainnya, meskipun keberhasilan tidak dijamin.

Apa arti adopsi AI terhadap pasar inferensi 154 miliar dolar?

Iklan datang pada saat pasar AI menghadapi pertumbuhan eksplosif. Grand View Research memperkirakan bahwa pasar inferensi global AI akan mencapai $ 154,9 miliar pada tahun 2030, didorong dengan meningkatkan penyebaran permintaan intelijen buatan di seluruh industri.

Untuk pembuat keputusan di institusi, GROQ menggerakkan peluang dan risiko. Klaim kinerja perusahaan, jika sehat diverifikasi secara luas, dapat secara signifikan mengurangi biaya aplikasi kecerdasan buatan yang berat. Namun, mengandalkan penyedia yang lebih kecil juga menyediakan rantai pasokan dan kontinuitas potensial dibandingkan dengan raksasa cloud perusahaan.

Kemampuan teknis untuk menangani Windows dapat membuktikan konteks penuh sepenuhnya khususnya untuk aplikasi lembaga yang mencakup analisis dokumen, penelitian hukum, atau tugas pemikiran kompleks di mana mempertahankan konteks melalui interaksi panjang sangat penting.

Deklarasi ganda GROQ adalah perjudian yang dihitung yang perangkat khusus dan harga agresif dapat mengatasi keuntungan dari infrastruktur raksasa teknologi. Apakah strategi ini mungkin akan bergantung pada kemampuan perusahaan untuk mempertahankan keunggulan kinerja dengan penskalaan di seluruh dunia – tantangan yang menyulitkan banyak perusahaan infrastruktur yang muncul.

Saat ini, pengembang mendapatkan opsi kinerja tinggi lainnya di pasar kompetitif yang berkembang, sementara Anda melihat perusahaan untuk melihat apakah janji teknis GROQ diterjemahkan ke dalam layanan produksi yang dapat diandalkan secara luas.

Visi harian tentang kasus penggunaan bisnis dengan VB setiap hari

Jika Anda ingin membujuk bos Anda di tempat kerja, Anda telah membahas VB setiap hari. Kami memberi Anda prioritas jurnalistik internal atas apa yang dilakukan perusahaan dengan kecerdasan buatan kebidanan, dari transformasi organisasi hingga operasi penerbitan praktis, sehingga Anda dapat berbagi visi pengembalian investasi maksimum.

Baca Kebijakan Privasi Kami

Terima kasih telah berlangganan. Periksa lebih banyak buletin VB di sini.

Terjadi kesalahan.

Tautan sumber

ridlwan.com

Berita

Groq hanya menimbun wajah yang lebih cepat – itu akan datang ke AWS dan Google

Bagaimana mengumpulkan jendela konteks groq 131k terhadap daya saing menyimpulkan kecerdasan buatan

Mengapa integrasi Groq dapat menghadapi jutaan pengembang kecerdasan buatan baru

Infrastruktur Groq dapat bersaing dengan AWS Bedrock dan Google Vertex AI dalam skala besar

Bagaimana harga inferensi agresif dapat mempengaruhi model bisnis GROQ

Apa arti adopsi AI terhadap pasar inferensi 154 miliar dolar?

Leave a Reply

Leave a Reply

Trending

Bagaimana mengumpulkan jendela konteks groq 131k terhadap daya saing menyimpulkan kecerdasan buatan

Mengapa integrasi Groq dapat menghadapi jutaan pengembang kecerdasan buatan baru

Infrastruktur Groq dapat bersaing dengan AWS Bedrock dan Google Vertex AI dalam skala besar

Bagaimana harga inferensi agresif dapat mempengaruhi model bisnis GROQ

Apa arti adopsi AI terhadap pasar inferensi 154 miliar dolar?

Leave a Reply Batalkan balasan

Leave a Reply

Trending

Leave a Reply