Berita
“Pabrik AI” dari Nvidia menghadapi kenyataan dalam mengkonversi 2025
Bergabunglah dengan acara bahwa para pemimpin lembaga telah dipercaya selama hampir dua dekade. VB Transform menggabungkan orang yang membangun strategi AI untuk institusi nyata. Pelajari lebih lanjut
Sarung tangan berhenti di Selasa di VB Transfer 2025 Pembuat chip alternatif secara langsung menikam dominasi nvidia selama komite penalaran, dan mengungkapkan kontradiksi dasar: bagaimana kesimpulan dapat menjadi kecerdasan buatan. “Pabrik” dari 70 % dari total margin?
Jonathan Ross, CEO perusahaan jernihKata -kata itu tidak hati -hati dimatikan dengan hati -hati. “Pabrik Intelijen Buatan hanyalah cara pemasaran untuk membuat Amnesty International kurang menakutkan,” kata Ross selama komite. Shawn Lie, CTO dari OtakSeorang pesaing, dia sama langsungnya: “Saya tidak berpikir pikiran Nvidia memiliki semua penyedia layanan yang melawan mereka untuk setiap sen terakhir sambil duduk di sana dengan nyaman dengan 70 poin.”
Ratusan miliar investasi dalam infrastruktur dan arsitektur masa depan AI dipertaruhkan. Untuk CISO dan para pemimpin intelijen buatan yang saat ini ditahan dalam negosiasi mingguan dengan Openai dan penyedia layanan lainnya untuk kapasitas yang lebih besar, komite mengungkapkan fakta -fakta tidak nyaman tentang alasan inisiatif intelijen buatan yang berkelanjutan untuk mencapai hambatan jalan.
>> Tonton setiap liputan konversi kami 2025 di sini <Krisis kapasitas tidak membicarakannya
“Siapa pun sebenarnya adalah pengguna yang hebat dari model AI Gen yang tahu bahwa Anda dapat pergi ke Openai, atau apa pun, dan mereka tidak akan cukup melayani Anda.” Setengah -solusi. Ada pertemuan mingguan antara beberapa pengguna kecerdasan buatan terbesar dan penyedia layanan model untuk mencoba membujuk mereka untuk mengalokasikan kemampuan yang lebih besar. Lalu ada pertemuan mingguan antara penyedia model dan peralatan mereka. “
Peserta tim juga menunjuk kekurangan simbolik sebagai cacat dasar dalam analogi pabrik. Manufaktur tradisional menanggapi sinyal meminta dengan menambah kapasitas. Namun, ketika institusi memerlukan kesimpulan 10 kali lipat, mereka menemukan bahwa rantai pasokan tidak dapat menekuk. Unit pemrosesan grafis membutuhkan waktu waktu selama dua tahun. Pusat data membutuhkan izin dan perjanjian energi. Infrastruktur tidak dirancang untuk memperluas ruang lingkup ASI, memaksa penyedia layanan untuk mengakses kelas melalui perbatasan API.
Menurut Patille, pria Dia melonjak dari $ 2 miliar menjadi $ 3 miliar hanya dalam enam bulan. Indikator Dia beralih dari awal menjadi $ 500 juta. Openai Hingga 10 miliar dolar. Namun, perusahaan masih tidak bisa mendapatkan simbol yang mereka butuhkan.
Menurut Anda mengapa “pabrik” merusak ekonomi Amnesty International
Jensen Huang “Pabrik Kecerdasan BuatanKonsep ini mengacu pada monoteisme, barang dan keuntungan efisiensi yang mengurangi biaya. Namun, komite mengungkapkan tiga cara dasar untuk runtuhnya metafora ini:
Pertama, penalaran bukanlah seragam. “Sampai hari ini, misalnya, misalnya, DIBSIC, ada sejumlah penyedia layanan di sepanjang kurva semacam tingkat kecepatan mereka dengan biaya berapa pun,” Pateel menunjukkan. Deepseek menawarkan gaya biaya terendah sendiri tetapi hanya menyediakan 20 ikon per detik. “Tidak ada yang ingin menggunakan model dalam 20 kode per detik. Saya berbicara lebih cepat dari 20 ikon per detik.”
Kedua, kualitasnya bervariasi dengan keras. Menggambar Ross secara historis untuk minyak standar: “Ketika minyak standar dimulai, minyak memiliki kualitas yang bervariasi. Anda dapat membeli minyak dari satu penjual dan dapat membakar rumah Anda.” Saat ini, pasar penalaran kecerdasan buatan menghadapi perbedaan kualitas yang sama, karena penyedia layanan menggunakan banyak teknologi untuk mengurangi biaya yang menawarkan kualitas produksi secara tidak sengaja.
Ketiga, dan yang paling penting, ekonomi terbalik. “Salah satu hal yang tidak biasa dalam kecerdasan buatan adalah Anda tidak dapat menghabiskan lebih banyak untuk hasil yang lebih baik,” Ross menjelaskan. “Anda tidak hanya bisa mendapatkan aplikasi perangkat lunak, misalnya, saya akan menghabiskan dua kali lipat apa yang dapat ditingkatkan oleh perangkat lunak saya, dan aplikasi.”
Ketika Ross menyatakan bahwa Mark Zuckerberg memuji hutan karena menjadi “satu -satunya yang meluncurkannya dengan kualitas penuh”, secara tidak sengaja mengungkapkan krisis kualitas dalam industri ini. Ini bukan hanya pengakuan. Itu adalah dakwaan untuk semua ketentuan lainnya.
Ross menjelaskan mekanika: “Banyak orang membuat banyak trik untuk mengurangi kualitas, tidak sengaja, tetapi untuk mengurangi biaya mereka, meningkatkan kecepatan mereka.” Teknik tampak teknis, tetapi efeknya jelas dan langsung. Kuantitas mengurangi akurasi. Pemangkasan menghapus parameter. Semua peningkatan menurunkan model dengan cara yang mungkin tidak ditemukan lembaga sampai produksi gagal.
Ross Ross sejajar dengan minyak paralel menyoroti risiko. Saat ini, pasar inferensi menghadapi masalah yang sama dengan berbagai kualitas. Penyedia layanan bertaruh bahwa lembaga tidak akan melihat perbedaan antara 95 % dan 100 % dari akurasi, bertaruh pada perusahaan seperti meta yang memiliki pengembangan untuk mengukur kerusakan.
Ini menciptakan kebutuhan langsung bagi pembeli lembaga.
- Buat standar kualitas sebelum memilih penyedia layanan.
- Periksa mitra inferensi saat ini untuk perbaikan yang tidak diumumkan.
- Terimalah bahwa harga yang sangat baik dari Model Fidelity sekarang menjadi fitur pasar permanen. Era asumsi paritas fungsional telah berakhir melalui penyedia inferensi ketika Zuckerberg memanggil perbedaannya.
Paradoks simbolik satu juta dolar
Momen yang paling diluncurkan datang ketika komite membahas harga. Berbohong menyoroti fakta yang tidak nyaman dari industri ini: “Jika simbol -simbol ini penuh dengan jutaan orang berharga karena kami pikir mereka bisa, kan? Ini tidak terkait dengan kata -kata. Anda tidak mengenakan biaya satu dolar untuk mentransfer kata -kata. Saya membayar $ 800 selama satu jam untuk menulis catatan dua halaman.”
Catatan ini memotong masalah masalah mendeteksi harga kecerdasan buatan. Industri ini berlomba untuk membayar biaya simbol khas menjadi kurang dari $ 1,50 per juta sementara mengklaim simbol -simbol ini akan mengubah setiap aspek bisnis. Komite secara implisit sepakat satu sama lain bahwa matematika tidak bertambah.
“Semua orang sebagian besar dihabiskan, seperti semua startup yang tumbuh cepat ini, dan jumlah yang mereka habiskan untuk simbol sebagai layanan yang hampir cocok dengan pendapatan mereka menjadi satu lawan satu,” ungkap Ross. Rasio pengeluaran adalah 1: 1 pada simbol kecerdasan buatan terhadap pendapatan adalah model bisnis yang tidak berkelanjutan yang dengan mudah diabaikan oleh narasi “pabrik”.
Kinerja mengubah segalanya
Otak dan Groq tidak bersaing hanya untuk harganya; Ini juga bersaing untuk kinerja. Mereka terutama mengubah apa yang mungkin dalam hal kecepatan penalaran. “Dengan teknologi skala chip yang kami buat, kami dapat 10 kali, kadang -kadang 50 kali, dan kinerja tercepat daripada unit pemrosesan grafis tercepat saat ini,” katanya kepada saya.
Ini bukan peningkatan bertahap. Ini memungkinkan kasus penggunaan yang sama sekali baru. “Kami memiliki pelanggan yang memiliki agen kerja yang mungkin memakan waktu 40 menit, dan mereka ingin hal -hal ini berlanjut dalam waktu yang sebenarnya,” jelas. “Hal -hal ini tidak mungkin, bahkan jika Anda siap membayar bagian atas dolar.”
Perbedaannya menciptakan pasar jenuh yang menantang standardisasi pabrik. Lembaga yang perlu disimpulkan dalam waktu aplikasi yang sebenarnya yang dihadapi pelanggan tidak dapat menggunakan infrastruktur yang sama saat mereka bekerja di antara malam hari.
Leher Botol Nyata: Pusat Energi dan Data
Sementara semua orang berfokus pada pasokan chip, komite mengungkapkan pembatasan pembatasan aktual yang mentransmisikan kecerdasan buatan. “Kapasitas basis data adalah masalah besar. Anda tidak dapat menemukan ruang pusat data di Amerika Serikat,” kata Patel. “Kekuatan adalah masalah besar.”
Tantangan infrastruktur melampaui pembuatan chip hingga pembatasan sumber daya dasar. Patel menjelaskan, “TSMC di Taiwan bisa mendapatkan lebih dari $ 200 juta chip, bukan? Bukan … itu adalah kecepatan yang mengembang adalah konyol.”
Tetapi produksi chip tidak berarti apa -apa tanpa infrastruktur. “Alasan kami melihat masalah besar ini di Timur Tengah, dan sebagian mengapa masing -masing dari kedua perusahaan ini memiliki faktor besar di Timur Tengah, kekuatannya,” ungkap Patel. Stampede global untuk komputasi termasuk “pergi ke seluruh dunia untuk mendapatkan kemana -mana untuk keberadaan energi, di mana pun database ditemukan, di mana pun ada tukang listrik yang dapat membangun sistem listrik ini.”
“Google Success Disaster” menjadi kebenaran semua orang
Ross membagikan kisah bijak dari sejarah Google: “Ada istilah yang menjadi sangat umum di Google pada tahun 2015 yang disebut Success Caraster. Beberapa tim membangun aplikasi amnesti internasional yang mulai bekerja lebih baik daripada manusia untuk pertama kalinya, dan permintaan untuk akun tersebut sangat tinggi, dan mereka perlu menggandakan sidik jari data data internasional dengan cepat atau tiga kali.”
Pola ini sekarang diulangi melalui semua publikasi Amnesty International. Aplikasi gagal mendapatkan daya tarik atau pengalaman tongkat hoki yang segera menyerang batas infrastruktur. Tidak ada daratan tengah, atau kurva penskalaan yang lancar yang diprediksi oleh ekonomi pabrik.
Apa artinya ini bagi strategi AI yayasan
Adapun pemantauan informasi, CISO dan pemimpin kecerdasan buatan, deteksi komite mensyaratkan pemulihan kalibrasi strategis:
Perencanaan membutuhkan model baru. Prediksi tradisional teknologi informasi mengasumsikan pertumbuhan linier. Tenaga kerja Amnesty International melanggar asumsi ini. Ketika aplikasi yang berhasil meningkatkan konsumsi simbol khas sebesar 30 % per bulan, rencana kapasitas tahunan sudah tua di dalam perempat. Lembaga harus diubah dari kursus pembelian tetap menjadi manajemen kapasitas dinamis. Membangun kontrak dengan keputusan impulsif. Pantau penggunaan mingguan, bukan bab. Terima bahwa pola moderasi kecerdasan buatan mirip dengan pola kurva adopsi virus, bukan untuk program program lembaga tradisional.
Angsuran kecepatan permanen. Gagasan bahwa kesimpulan akan mengabaikan harga seragam dari kesenjangan besar dalam kinerja di antara penyedia layanan. Lembaga membutuhkan anggaran untuk kecepatan di mana itu penting.
Arsitektur melebihi peningkatan. Groq dan cerebras tidak menang dengan membuat unit pemrosesan grafis lebih baik. Mereka menang dengan memikirkan kembali arsitektur dasar kecerdasan buatan. Perusahaan yang bertaruh pada segala hal pada infrastruktur GPU mungkin mendapati diri mereka terjebak di koridor yang lambat.
Infrastruktur otoritas adalah strategis. Pendaftaran bukan chip atau perangkat lunak tetapi kilowatt dan pendinginan. Institusi pintar sudah bekerja pada kapasitas energi dan area pusat data untuk tahun 2026 dan seterusnya.
Lembaga infrastruktur yang realistis tidak dapat diabaikan
Komite mengungkapkan fakta dasar: pinjaman pabrik kecerdasan buatan tidak hanya salah, tetapi juga berbahaya. Strategi konstruksi kelembagaan tentang penetapan harga penalaran dan pengiriman pasar yang tidak disatukan yang tidak ada.
Pasar nyata bekerja pada tiga fakta brutal.
- Kelangkaan kapasitas menciptakan kudeta energi, karena pemasok menentukan persyaratan dan lembaga yang meminta alokasi.
- Variasi kualitas, perbedaan antara akurasi 95 % dan 100 %, ditentukan, apakah aplikasi kecerdasan buatan berhasil atau kegagalan bencana.
- Pembatasan infrastruktur, bukan teknologi, menentukan batas menghubungkan dengan transformasi kecerdasan buatan.
Jalan ke depan membutuhkan CISO dan pemimpin kecerdasan buatan untuk berhenti memikirkan seluruh pabrik. Kunci Kapasitas Daya Kunci Sekarang. Alasannya adalah untuk memeriksa kerusakan kualitas tersembunyi. Membangun hubungan penjual berdasarkan keunggulan arsitektur, bukan penghematan dalam biaya marjinal. Lebih penting lagi, menerima pembayaran margin 70 % untuk inferensi yang berkualitas tinggi dan terpercaya mungkin merupakan investasi paling cerdas Anda.
Transform Chip Makers tidak menantang Nvidia. Mereka mengungkapkan bahwa lembaga menghadapi opsi: pembayaran untuk kualitas dan kinerja, atau bergabung dengan pertemuan negosiasi mingguan. Konsensus komite jelas: Keberhasilan membutuhkan kesesuaian beban pekerjaan tertentu dengan infrastruktur yang sesuai alih -alih mengikuti solusi yang sesuai dengan semua orang.
Tautan sumber