Connect with us

Pendapat

GPT-5 gagal dalam tes hype

Published

on

Pekan lalu, pada hari peluncuran GPT-5, AI hype berada pada tingkat yang lebih tinggi sepanjang masa.

Dalam briefing pers, CEO OpenAI Sam Altman mengatakan GPT-5 adalah “sesuatu yang saya tidak pernah ingin kembali,” tonggak sejarah yang mirip dengan iPhone pertama dengan layar retina. Malam sebelum siaran langsung, Altman Diposting Gambar bintang kematian, membangun lebih banyak hype. Di X, pengguna dia menulis bahwa antisipasi “terlihat seperti malam Natal”. Semua mata berada di produsen chatgpt, sementara orang -orang di seluruh industri menunggu untuk melihat apakah iklan akan memberikan atau mengecewakan. Dan dengan sebagian besar akun, wahyu besar akan gagal.

Hype untuk model lama baru Openai telah dibangun selama bertahun-tahun untuk meluncurkan GPT-4. Dalam AMA Reddit dengan Altman dan tim Oktober lalu, pengguna terus bertanya pada tanggal peluncuran GPT-5, mencari detail tentang sumber daya mereka dan apa yang akan membedakannya. Seorang reditor bertanya, “Mengapa GPT-5 memakan waktu begitu lama?” Altman menjawab bahwa komputasi adalah batasan dan bahwa “semua model ini cukup rumit dan kami tidak dapat mengirim sebanyak mungkin hal yang kami inginkan.”

Tetapi ketika GPT-5 muncul di ChatGPT, pengguna tidak terkesan. Kemajuan yang cukup besar yang mereka harapkan tampaknya sebagian besar bertahap, dan keuntungan utama model berada di daerah -daerah seperti biaya dan kecepatan. Namun, dalam jangka panjang, ini bisa menjadi taruhan finansial yang solid untuk Openai – meskipun kurang mencolok.

Orang-orang menunggu dunia GPT-5. (Pengguna x Diposting Setelah jabatan Altman’s Death Star, “semua orang mengubah harapan.”) Dan Openai tidak meremehkan proyeksi ini, Memanggil GPT-5 “Sistem AI terbaiknya” dan “lompatan signifikan dalam kecerdasan” dengan “kinerja cutting -edge dalam pengkodean, matematika, penulisan, kesehatan, persepsi visual, dan banyak lagi.” Altman mengatakan dalam briefing pers bahwa berbicara dengan model “tampaknya berbicara dengan ahli tingkat doktoral.”

Hype ini berkontribusi pada kontras yang kuat dengan kenyataan. Model dengan kecerdasan di tingkat doktoral, misalnya, bersikeras Ada tiga “B” di kata blueberry, bagaimana beberapa pengguna media sosial menemukan? Dan saya akan melakukan itu tidak bisa mengidentifikasi Berapa banyak nama negara termasuk surat “r”? Dia akan Rotule salah Peta AS dengan negara -negara yang diciptakan, termasuk “Jefst baru”, “Micann”, “Nakamia Baru”, “Krizona” dan “Miroinia” dan label Nevada sebagai perpanjangan dari California? Orang -orang yang menggunakan bot untuk dukungan emosional menemukan sistem yang keras dan jauh baru, memprotes begitu tinggi sehingga Openai membawa dukungan ke model yang lebih tua. Meme berlimpah – a mewakili GPT-4 dan GPT-4O sebagai naga yang tangguh dengan GPT-5 di sebelahnya sebagai yang sederhana.

Pengadilan Opini Publik Ahli juga belum memaafkan. Gary Marcus, salah satu guru suara terkemuka di AI dan emeritus psikologi di New York University, Disebut model “Tunggu, kelebihan beban dan luar biasa.” Peter Wildford, salah satu pendiri Institut Kebijakan dan Strategi AI, dia menulis Dalam ulasan Anda, “Apakah ini penghancuran besar yang kami cari? Sayangnya, tidak.” Zvi Mowshowitz, blogger industri AI yang populer, menyebutnya “Model yang bagus, tapi tidak bagus.” Redditor di GPT-5 Reddit Resmi AMA dia menulis“Seseorang mengatakan Sam 5 adalah sampah yang panas.”

Pada hari-hari setelah peluncuran GPT-5, serangan kritik yang tidak penting sedikit penting. Konsensus umum adalah bahwa meskipun GPT-5 tidak sama pentingnya dengan uang muka, ia menawarkan pembaruan biaya dan kecepatan, dan lebih sedikit halusinasi, dan sistem sakelar yang menawarkan untuk secara otomatis mengarahkan konsultasi back-end Anda ke model yang paling masuk akal untuk merespons, sehingga Anda tidak harus memutuskan Anda sepanjang hari. Altman bersandar pada narasi itu, menulis“GPT-5 adalah model paling cerdas yang pernah kami lakukan, tetapi hal utama yang kami tekan adalah kegunaan dunia nyata dan aksesibilitas/aksesibilitas massal.”

Peneliti Openi Christina Kim Diposting Dalam X yang dengan GPT-5, “Kisah Nyata adalah kegunaan. Membantu dengan apa yang orang peduli dengan pengiriman uang, penulisan kreatif dan navigasi dalam informasi kesehatan-dengan lebih banyak ketegasan dan lebih sedikit gesekan. Kami juga memotong halusinasi. Ini lebih baik dikalibrasi, kata ‘Saya tidak tahu’, memisahkan fakta dari anggapan dan dapat memindahkan jawaban dengan kutipan ketika Anda menginginkan” “” “”

Ada pemahaman luas bahwa, jujur saja, GPT-5 telah membuat chatgpt kurang fasih. Posting media sosial viral mengeluh bahwa model baru tidak memiliki nuansa dan kedalaman dalam tulisan mereka, menjadi robot dan dingin. Bahkan dalam materi pemasaran GPT-5 itu sendiri, perbandingan berdampingan dari GPT-4O dan GPT-5 pernikahan roti panggang yang dihasilkan oleh GPT-5 tampaknya tidak seperti kemenangan tidak terbuka untuk model baru-saya secara pribadi lebih suka yang ke-4. Saat Altman tanya redditors Jika mereka mengira GPT-5 lebih baik menulis, dia menerima serangan komentar yang membela model GPT-4O yang sudah pensiun; Dalam satu hari, dia setuju dengan tekanan dan setidaknya untuk sementara mengembalikannya ke chatgpt.

Tetapi ada bagian depan di mana model tampaknya lebih bersinar: pengkodean. Iterasi GPT-5 Saat ini di atas Tabel klasifikasi model AI paling populer dalam kategori pengkodean, dengan Claude melakukan antropik tiba di urutan kedua. Promosi peluncuran Openai menunjukkan game yang dihasilkan AI (bola menyusut dan balap kecepatan mengetik), alat seni piksel, simulator baterai dan penampil lofi. Ketika saya mencoba menggetarkan permainan puzzle dengan alat, itu memiliki banyak kekurangan, tetapi saya menemukan kesuksesan dengan proyek yang lebih sederhana, seperti pelajaran bordir interaktif.

Ini adalah kemenangan besar bagi Openai, karena menghadapi perang pengkodean AI dengan pesaing seperti antropik, Google dan lainnya untuk waktu yang lama. Perusahaan bersedia menghabiskan banyak untuk pengkodean AI, dan ini adalah salah satu generator pendapatan paling realistis untuk startup AI yang membakar uang.

Openai juga menyoroti kehebatan GPT-5 dalam perawatan kesehatan, tetapi ini sebagian besar tidak diuji dalam praktiknya, kami tidak tahu seberapa sukses itu untuk sementara waktu.

Tolok ukur AI semakin berarti semakin sedikit dalam beberapa tahun terakhir, karena mereka sering berubah dan beberapa perusahaan yang memilih hasil yang mereka ungkapkan. Tetapi secara umum, mereka dapat memberi kita citra GPT-5 yang masuk akal. Model ini berkinerja lebih baik daripada pendahulunya dalam banyak tes di industri, tetapi peningkatan ini tidak ada artinya untuk ditulis, menurut banyak orang di industri ini. Sebagai Wildford Meletakkan“Ketika datang ke evaluasi formal, GPT-5 sebagian besar adalah apa yang diharapkan akan ditunggu-tunggu peningkatan bertahap dan tidak ada yang layak meme bintang vagus.”

Tetapi jika sejarah baru -baru ini memiliki sesuatu untuk dikatakan tentang hal itu, peningkatan bertahap kecil ini mungkin lebih mungkin diterjemahkan menjadi laba konkret daripada mengesankan konsumen individu. Perusahaan AI tahu bahwa jalan manufaktur uang terbesar mereka adalah pelanggan perusahaan, kontrak pemerintah dan investasi dan meningkatkan tambahan dalam referensi yang solid, dan berinvestasi dalam memperluas pengkodean dan Halusinasi Pertarungan, adalah cara terbaik untuk memanfaatkan ketiganya.

Ikuti topik dan penulis Dalam cerita ini, lihat lebih banyak seperti ini di umpan beranda pribadi Anda dan menerima dan pembaruan email.


Tautan sumber

Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Pendapat

Korban Utama Mamdani, Tuntutan Trans yang Mendistorsi Realitas, dan Komentar Lainnya

Published

on

Urbanis: Korban utama Mamdani

“Agenda Zohran Mamdani akan berdampak secara tidak proporsional terhadap kelas menengah dan masyarakat New York yang miskin,” memperingatkan Nicole Gelinas, dari City Journal.

Pembekuan harga sewa yang dilakukannya akan membahayakan pemeliharaan gedung dan memaksa tuan tanah untuk membiarkan “unit-unit kosong dalam keadaan kosong tanpa batas waktu daripada menyewakannya kepada penyewa baru dengan kerugian” – dan berisiko menimbulkan “reaksi yang sama radikalnya,” karena “Mahkamah Agung yang semakin konservatif mungkin melihat pembekuan sewa tanpa batas waktu sesuai keinginan walikota” sebagai alasan untuk membatalkan undang-undang sewa sepenuhnya.

Menggratiskan bus “dapat memicu hilangnya pendapatan” bagi MTA, karena penumpang kereta bawah tanah menuntut perlakuan yang sama dan “begitu juga dengan penumpang kereta komuter, yang membayar harga yang jauh lebih tinggi daripada penumpang kereta bawah tanah dan bus untuk bepergian.”

Dia bermaksud untuk mengalihkan “banyak fungsi polisi, termasuk mendekati orang-orang yang tampaknya terganggu di kereta bawah tanah dan di jalanan, ke korps sipil baru yang bertugas menangani kesehatan mental dan pekerja sosial tunawisma.”

Maaf: Tanpa dukungan polisi, warga sipil “akan menghindari interaksi dengan orang-orang yang terlihat sangat gelisah – yaitu orang-orang yang paling membutuhkan bantuan.”

Dari kanan: Trans menuntut untuk memutarbalikkan kenyataan

“Daftar contoh yang terus bertambah” tentang bagaimana “ideologi trans” mendistorsi “keadilan dan keadilan” mencakup “keringanan yang luar biasa” berupa hukuman penjara hanya delapan tahun bagi calon “perempuan trans” Nicholas Roske, calon pembunuh Brett Kavanaugh, khawatir Christine Rosen dari komentar tersebut.

“Aktivis trans” tidak berusaha untuk “meyakinkan mayoritas warga Amerika bahwa tujuan mereka rasional atau adil,” namun “semakin menuntut tidak hanya perlakuan yang setara, namun juga perlakuan khusus.”

Kelompok-kelompok seperti ACLU “telah menjadikan penerimaan ideologi trans sebagai ujian baru bagi inklusi,” dan “politisi Demokrat” dan “media arus utama” dengan tegas “bersikeras untuk menyesuaikan diri.”

“Fantasi berbahaya” yang dimiliki oleh para pendukung dan transgender dapat menjadi “realitas bencana” bagi kita semua.

Konservatif: Taruhan besar Bessent di Argentina

“Pendukung pasar bebas punya alasan kuat untuk merayakan, atau setidaknya menghela nafas lega, atas kinerja bagus partai (Presiden Javier) Milei dalam pemilu paruh waktu Argentina,” catat Jim Geraghty dari National Review.

“Pemerintahan Trump memperdagangkan $20 miliar dalam dolar AS dengan jumlah yang setara dalam peso Argentina” bulan ini, sebuah pertaruhan metaforis” oleh Menteri Keuangan Scott Bessent “bahwa partai Milei akan berkinerja baik dalam jangka menengah dan menjaga negara ini berada pada pemerintahan yang lebih kecil dan jalur yang lebih berorientasi pasar bebas.”

Partai Freedom Advances yang dipimpin Milei meningkatkan keterwakilannya di Kongres lebih dari dua kali lipat, memicu pemulihan peso Argentina; “Sekretaris Bessent, terima penghasilan Anda.”

DC Watch: Kasus ‘Kuat’ Vs. mantan kepala CIA

Dalam rujukan kriminal ke Departemen Kehakiman, Partai Republik menuduh mantan kepala CIA John Brennan berbohong kepada penyelidik Kongres tentang “masalah kolusi Rusia” – dan kasus mereka “kuat.” kata Byron York dari Washington Examiner.

Dalam kesaksiannya pada tahun 2017 dan 23, Brennan mengklaim dokumen anti-Trump Steele palsu yang berasal dari kampanye Hillary Clinton ternyata tidak dasar bagi Penilaian Komunitas Intelijen mengenai permasalahan tersebut dan bahwa ia keberatan jika ada referensi mengenai hal tersebut dalam laporan tersebut.

Namun, dokumen yang baru-baru ini dibuka menunjukkan bahwa “Brennan sebenarnya memaksa analis CIA untuk menggunakannya,” mengabaikan analis yang mencoba menyembunyikan masalah tersebut. Jadi: “FBI dan CIA tahu bahwa dokumen tersebut adalah omong kosong” namun “tetap memasukkannya.”

“Dan kemudian, di bawah sumpah di hadapan Kongres, John Brennan berbohong tentang hal itu.”

Lembaga survei: Partai Demokrat harus mempertahankan posisi tengahnya agar bisa menang

“Jika Partai Demokrat menginginkan peluang untuk memenangkan Gedung Putih pada tahun 2028 atau setelahnya, mereka harus mengikuti kelompok moderat ke jalur tengah politik,” jelaskan Douglas Schoen dan Carly Cooperman di The Hill.

Faktanya adalah bahwa “kandidat berhaluan tengah” yang merayu “pemilih yang ragu-ragu cenderung mendapatkan hasil yang lebih baik dibandingkan mereka yang hanya mengajukan banding pada sebagian besar basis ideologis mereka”.

Tahun lalu, “keseluruhan 17 anggota Partai Demokrat yang memenangkan pemilu di negara bagian atau distrik yang mendukung Presiden Trump” menarik pemilih berhaluan tengah dengan “bergerak ke tengah dalam isu-isu seperti imigrasi, kejahatan dan isu-isu sosial.”

Partai Demokrat harus mengambil “pusat permasalahan yang menjadi perhatian masyarakat – ekonomi, imigrasi dan keamanan,” dan dengan demikian memenangkan kembali “pemilih kelas pekerja yang dibutuhkan Partai Demokrat untuk memenangkan pemilu nasional.”

– Disusun oleh Dewan Editorial Post

Tautan sumber

Continue Reading

Pendapat

Konsumen mempunyai kekuatan untuk mengatasi masalah kantong plastik di California

Published

on

Kepada editor: Atty. Gugatan Jenderal Rob Bonta terhadap produsen kantong plastik tidak diragukan lagi penting (“Kantong plastik yang dijual di toko-toko di California sebenarnya tidak dapat didaur ulang, kata Bonta,” 17 Oktober). Perusahaan kantong plastik harus bertanggung jawab karena telah menyesatkan masyarakat.

Namun perilaku konsumen juga memainkan peran penting. Kenyataan yang menyedihkan adalah kebanyakan orang masih tidak membawa tasnya sendiri ke supermarket. Solusi terhadap masalah kantong plastik hanya memerlukan satu tindakan sederhana: Bawalah tas Anda sendiri. Tanda titik.

Kristen Kessler, Ventura

Tautan sumber

Continue Reading

Pendapat

Rand Paul mengkritik serangan kapal Karibia saat Trump melewati Kongres

Published

on

Dalam hal memberantas masalah narkoba di Amerika, pemerintahan Trump tampaknya telah menukar pengadilan dengan zona tempur. Militer AS telah melakukan serangan udara dan laut terhadap kapal-kapal yang diduga menyelundupkan narkoba di Karibia dan lepas pantai Venezuela.

Pihak berwenang mengatakan operasi ini bertujuan untuk menghentikan “teroris narkotika” sebelum mereka mencapai pantai kita, tapi inilah masalahnya: kita tidak benar-benar tahu siapa yang dibunuh, atau bukti apa yang membuktikan bahwa mereka adalah pengedar narkoba.

Menurut pihak administrasi, sedikitnya 43 orang tewas sejak kampanye ini dimulai. Menteri Pertahanan Pete Hegseth mengatakan militer telah melakukan tindakannya Pukulan ke-10 sejauh ini – dan ada pembicaraan tentang serangan darat yang akan terjadi setelahnya. Senator Lindsey Graham (R-S.C.) bahkan mengatakan kepada CBS News bahwa menurutnya Presiden Trump telah mengambil keputusan “sudah waktunya bagi Maduro untuk pergi” berbicara tentang pemimpin Venezuela dan menyebut serangan darat sebagai “kemungkinan nyata.”

Graham kemudian menggandakan pernyataannya dengan mengatakan militer “Bunuh orang-orang yang ingin meracuni Amerika.”  

Tapi mari kita istirahat. Karena meskipun Graham tampak siap melakukan serangan dan melakukan eskalasi, anggota parlemen lainnya – bahkan dari Partai Republik – juga siap melakukan hal tersebut membunyikan alarm. Senator Rand Paul (R-Ky.), yang sudah lama membela Konstitusi, menyampaikan di “Fox News Sunday” dan mengatakan dia tidak pernah diundang untuk memberikan pengarahan apa pun tentang serangan ini.

“Pengarahan saja tidak cukup untuk mengatasi Konstitusi. Konstitusi mengatakan bahwa ketika Anda berperang, Kongres harus mengambil keputusan. … Perang melawan narkoba, atau perang melawan kejahatan, biasanya ditangani melalui penegakan hukum, dan hingga saat ini mereka mengklaim bahwa orang-orang ini adalah pengedar narkoba … dan kami belum memiliki bukti apa pun. Jadi pada titik ini, kami menyebutnya sebagai pembunuhan di luar proses hukum.”

Paulo tidak berhenti di situ. “Saat ini,” katanya, “inilah yang dilakukan Tiongkok, inilah yang dilakukan Iran tanpa pernah menunjukkan bukti apa pun kepada publik.

Dan itulah intinya: Amerika dibangun berdasarkan checks and balances. Kita harus menjadi negara yang menuntut bukti sebelum menghukum, bukan negara yang mengebom tersangka di laut tanpa proses hukum.

Namun Gedung Putih secara terbuka menyatakan bahwa mereka tidak memerlukan Kongres. truf bahkan kepada wartawan“Kami mungkin akan kembali ke Kongres dan menjelaskan dengan tepat apa yang kami lakukan… tapi kami tidak perlu melakukan itu.”

Jadi izinkan saya menjelaskannya dengan benar. Jika 43 orang terbunuh dalam operasi penegakan hukum, tanpa bukti yang disajikan, tanpa transparansi dan tanpa suara dari Kongres – kita menyebutnya apa sebenarnya? “Perang melawan narkoba” atau “perang tanpa aturan”?

Karena ketika pemerintah memutuskan untuk membunuh siapa pun, maka pemerintah akan mencapnya sebagai penjahat – tanpa pengadilan, tanpa bukti dan tanpa pengawasan – itu bukan unjuk kekuatan. Itu adalah bendera merah.

Setidaknya, warga Amerika berhak mendapatkan jawaban. Siapa yang terbunuh? Mengapa? Dan di bawah otoritas hukum apa? Sampai kita mengetahui hal ini, menyebut “pembunuhan di luar proses hukum” ini tidaklah radikal – ini adalah kenyataan.

Lindsey Granger adalah kontributor NewsNation dan salah satu pembawa acara acara komentar The Hill “Rising.” Kolom ini adalah transkrip komentar siarannya yang telah diedit. 

Tautan sumber

Continue Reading

Trending