Connect with us

Pendapat

GPT-5 gagal dalam tes hype

Published

on

Pekan lalu, pada hari peluncuran GPT-5, AI hype berada pada tingkat yang lebih tinggi sepanjang masa.

Dalam briefing pers, CEO OpenAI Sam Altman mengatakan GPT-5 adalah “sesuatu yang saya tidak pernah ingin kembali,” tonggak sejarah yang mirip dengan iPhone pertama dengan layar retina. Malam sebelum siaran langsung, Altman Diposting Gambar bintang kematian, membangun lebih banyak hype. Di X, pengguna dia menulis bahwa antisipasi “terlihat seperti malam Natal”. Semua mata berada di produsen chatgpt, sementara orang -orang di seluruh industri menunggu untuk melihat apakah iklan akan memberikan atau mengecewakan. Dan dengan sebagian besar akun, wahyu besar akan gagal.

Hype untuk model lama baru Openai telah dibangun selama bertahun-tahun untuk meluncurkan GPT-4. Dalam AMA Reddit dengan Altman dan tim Oktober lalu, pengguna terus bertanya pada tanggal peluncuran GPT-5, mencari detail tentang sumber daya mereka dan apa yang akan membedakannya. Seorang reditor bertanya, “Mengapa GPT-5 memakan waktu begitu lama?” Altman menjawab bahwa komputasi adalah batasan dan bahwa “semua model ini cukup rumit dan kami tidak dapat mengirim sebanyak mungkin hal yang kami inginkan.”

Tetapi ketika GPT-5 muncul di ChatGPT, pengguna tidak terkesan. Kemajuan yang cukup besar yang mereka harapkan tampaknya sebagian besar bertahap, dan keuntungan utama model berada di daerah -daerah seperti biaya dan kecepatan. Namun, dalam jangka panjang, ini bisa menjadi taruhan finansial yang solid untuk Openai – meskipun kurang mencolok.

Orang-orang menunggu dunia GPT-5. (Pengguna x Diposting Setelah jabatan Altman’s Death Star, “semua orang mengubah harapan.”) Dan Openai tidak meremehkan proyeksi ini, Memanggil GPT-5 “Sistem AI terbaiknya” dan “lompatan signifikan dalam kecerdasan” dengan “kinerja cutting -edge dalam pengkodean, matematika, penulisan, kesehatan, persepsi visual, dan banyak lagi.” Altman mengatakan dalam briefing pers bahwa berbicara dengan model “tampaknya berbicara dengan ahli tingkat doktoral.”

Hype ini berkontribusi pada kontras yang kuat dengan kenyataan. Model dengan kecerdasan di tingkat doktoral, misalnya, bersikeras Ada tiga “B” di kata blueberry, bagaimana beberapa pengguna media sosial menemukan? Dan saya akan melakukan itu tidak bisa mengidentifikasi Berapa banyak nama negara termasuk surat “r”? Dia akan Rotule salah Peta AS dengan negara -negara yang diciptakan, termasuk “Jefst baru”, “Micann”, “Nakamia Baru”, “Krizona” dan “Miroinia” dan label Nevada sebagai perpanjangan dari California? Orang -orang yang menggunakan bot untuk dukungan emosional menemukan sistem yang keras dan jauh baru, memprotes begitu tinggi sehingga Openai membawa dukungan ke model yang lebih tua. Meme berlimpah – a mewakili GPT-4 dan GPT-4O sebagai naga yang tangguh dengan GPT-5 di sebelahnya sebagai yang sederhana.

Pengadilan Opini Publik Ahli juga belum memaafkan. Gary Marcus, salah satu guru suara terkemuka di AI dan emeritus psikologi di New York University, Disebut model “Tunggu, kelebihan beban dan luar biasa.” Peter Wildford, salah satu pendiri Institut Kebijakan dan Strategi AI, dia menulis Dalam ulasan Anda, “Apakah ini penghancuran besar yang kami cari? Sayangnya, tidak.” Zvi Mowshowitz, blogger industri AI yang populer, menyebutnya “Model yang bagus, tapi tidak bagus.” Redditor di GPT-5 Reddit Resmi AMA dia menulis“Seseorang mengatakan Sam 5 adalah sampah yang panas.”

Pada hari-hari setelah peluncuran GPT-5, serangan kritik yang tidak penting sedikit penting. Konsensus umum adalah bahwa meskipun GPT-5 tidak sama pentingnya dengan uang muka, ia menawarkan pembaruan biaya dan kecepatan, dan lebih sedikit halusinasi, dan sistem sakelar yang menawarkan untuk secara otomatis mengarahkan konsultasi back-end Anda ke model yang paling masuk akal untuk merespons, sehingga Anda tidak harus memutuskan Anda sepanjang hari. Altman bersandar pada narasi itu, menulis“GPT-5 adalah model paling cerdas yang pernah kami lakukan, tetapi hal utama yang kami tekan adalah kegunaan dunia nyata dan aksesibilitas/aksesibilitas massal.”

Peneliti Openi Christina Kim Diposting Dalam X yang dengan GPT-5, “Kisah Nyata adalah kegunaan. Membantu dengan apa yang orang peduli dengan pengiriman uang, penulisan kreatif dan navigasi dalam informasi kesehatan-dengan lebih banyak ketegasan dan lebih sedikit gesekan. Kami juga memotong halusinasi. Ini lebih baik dikalibrasi, kata ‘Saya tidak tahu’, memisahkan fakta dari anggapan dan dapat memindahkan jawaban dengan kutipan ketika Anda menginginkan” “” “”

Ada pemahaman luas bahwa, jujur saja, GPT-5 telah membuat chatgpt kurang fasih. Posting media sosial viral mengeluh bahwa model baru tidak memiliki nuansa dan kedalaman dalam tulisan mereka, menjadi robot dan dingin. Bahkan dalam materi pemasaran GPT-5 itu sendiri, perbandingan berdampingan dari GPT-4O dan GPT-5 pernikahan roti panggang yang dihasilkan oleh GPT-5 tampaknya tidak seperti kemenangan tidak terbuka untuk model baru-saya secara pribadi lebih suka yang ke-4. Saat Altman tanya redditors Jika mereka mengira GPT-5 lebih baik menulis, dia menerima serangan komentar yang membela model GPT-4O yang sudah pensiun; Dalam satu hari, dia setuju dengan tekanan dan setidaknya untuk sementara mengembalikannya ke chatgpt.

Tetapi ada bagian depan di mana model tampaknya lebih bersinar: pengkodean. Iterasi GPT-5 Saat ini di atas Tabel klasifikasi model AI paling populer dalam kategori pengkodean, dengan Claude melakukan antropik tiba di urutan kedua. Promosi peluncuran Openai menunjukkan game yang dihasilkan AI (bola menyusut dan balap kecepatan mengetik), alat seni piksel, simulator baterai dan penampil lofi. Ketika saya mencoba menggetarkan permainan puzzle dengan alat, itu memiliki banyak kekurangan, tetapi saya menemukan kesuksesan dengan proyek yang lebih sederhana, seperti pelajaran bordir interaktif.

Ini adalah kemenangan besar bagi Openai, karena menghadapi perang pengkodean AI dengan pesaing seperti antropik, Google dan lainnya untuk waktu yang lama. Perusahaan bersedia menghabiskan banyak untuk pengkodean AI, dan ini adalah salah satu generator pendapatan paling realistis untuk startup AI yang membakar uang.

Openai juga menyoroti kehebatan GPT-5 dalam perawatan kesehatan, tetapi ini sebagian besar tidak diuji dalam praktiknya, kami tidak tahu seberapa sukses itu untuk sementara waktu.

Tolok ukur AI semakin berarti semakin sedikit dalam beberapa tahun terakhir, karena mereka sering berubah dan beberapa perusahaan yang memilih hasil yang mereka ungkapkan. Tetapi secara umum, mereka dapat memberi kita citra GPT-5 yang masuk akal. Model ini berkinerja lebih baik daripada pendahulunya dalam banyak tes di industri, tetapi peningkatan ini tidak ada artinya untuk ditulis, menurut banyak orang di industri ini. Sebagai Wildford Meletakkan“Ketika datang ke evaluasi formal, GPT-5 sebagian besar adalah apa yang diharapkan akan ditunggu-tunggu peningkatan bertahap dan tidak ada yang layak meme bintang vagus.”

Tetapi jika sejarah baru -baru ini memiliki sesuatu untuk dikatakan tentang hal itu, peningkatan bertahap kecil ini mungkin lebih mungkin diterjemahkan menjadi laba konkret daripada mengesankan konsumen individu. Perusahaan AI tahu bahwa jalan manufaktur uang terbesar mereka adalah pelanggan perusahaan, kontrak pemerintah dan investasi dan meningkatkan tambahan dalam referensi yang solid, dan berinvestasi dalam memperluas pengkodean dan Halusinasi Pertarungan, adalah cara terbaik untuk memanfaatkan ketiganya.

Ikuti topik dan penulis Dalam cerita ini, lihat lebih banyak seperti ini di umpan beranda pribadi Anda dan menerima dan pembaruan email.


Tautan sumber

Continue Reading
Click to comment

Leave a Reply

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Pendapat

Kolom: Donald Trump bukanlah seorang diktator, namun tujuannya bisa saja lebih buruk

Published

on

Julius Caesar masih memberikan bayangan panjang. Kami memiliki kalender 12 bulan – dan tahun kabisat – berkat Julius. Juli dinamai menurut namanya (walaupun saladnya tidak). Kata “tsar” dan “kaiser”, yang sekarang sudah tidak digunakan lagi, hanya berarti “Caesar”.

Kita juga berterima kasih kepada Kaisar atas ketahanan istilah “diktator”. Dia bukanlah diktator Romawi pertama, hanya dia yang paling terkenal. Di Republik Romawi, gelar dan wewenang “diktator“kadang-kadang diberikan oleh Senat kepada seseorang untuk menangani masalah besar atau keadaan darurat. Biasanya, masa jabatan tidak lebih dari enam bulan – lebih pendek jika krisis diselesaikan – karena orang Romawi membenci apa pun yang berbau monarki.

Ketika Caesar melintasi Rubikon (dari mana ungkapan itu berasal), musuh-musuhnya di Senat melarikan diri. Dengan demikian, senator yang tersisa menobatkannya sebagai diktator selama 11 hari untuk mengadakan pemilu baru. Kediktatoran keduanya berlangsung selama 10 tahun dan akhirnya ia diangkat menjadi diktator seumur hidup.

Pada abad-abad berikutnya, Kaisarisme, bukan kediktatoran, adalah kata yang paling kotor, setidaknya bagi pecinta kebebasan.

Bahkan di Amerika, sang diktator masih memiliki konotasi “pemecah masalah darurat”. Selama Depresi Hebat, banyak orang Amerika mendambakan orang seperti itu. Kolumnis liberal legendaris Walter Lippmann menulis pada awal Depresi Besar: “Kediktatoran yang ringan akan membantu kita melewati saat-saat tersulit di masa depan.”

Pada hari pelantikan Franklin D. Roosevelt pada tahun 1933, New York Herald-Tribune memuat judul yang menyetujui: “Untuk Kediktatoran Jika Diperlukan.” Banyak penasihat dan sekretaris kabinet dijulukidiktator“seperti yang terkadang kita sebut karyawan”raja” – seperti raja narkoba, raja perbatasan, bahkan “raja pekerjaan ramah lingkungan”, dll.

Belakangan, Hitler dan Stalinlah yang menghapus sebagian besar konotasi “Mr. Fix It” dari istilah “diktator”.

Namun kisah peringatan sebenarnya sudah ada sejak awal. Kediktatoran – pemberian kekuasaan tak terbatas dalam keadaan darurat sementara – adalah faktor penentunya Kaisarisme mungkin. Dengan memberi seseorang “kekuasaan sewenang-wenang”Untuk menyatakan perang, memungut pajak, atau membagikan bantuan untuk mempertahankan popularitasnya di kalangan rakyat jelata, godaan untuk menjadi Kaisar terlalu besar.

Beberapa pihak – seperti Cincinnatus, George Washington, atau Abraham Lincoln – mungkin menolak, namun yang diperlukan hanyalah satu orang yang lebih rendah untuk diberikan kekuasaan yang tidak semestinya agar seluruh eksperimen pemerintahan republik runtuh. Ini adalah sejarah republik hingga tahun 1789, itulah sebabnya Benjamin Franklin berkomentar setelah konvensi konstitusi bahwa para perumus telah memberi kita “sebuah republik, jika kita dapat mempertahankannya.”

Para pendirinya mendalami sejarah Romawi. Konstitusi dirancang untuk mencegah godaan semacam itu. Namun para pendiri juga memahami bahwa terkadang seorang presiden harus memiliki kekuasaan yang luar biasa dalam keadaan darurat. Bagaimanapun, institusi seorang diktator membantu melestarikan republik ini selama berabad-abad, hingga Kaisarisme Kaisar mengubahnya menjadi sebuah kerajaan.

Singkatnya, kekuatan darurat hanya diperlukan pada saat keadaan darurat yang nyata. Ada sejarah panjang dimana presiden Amerika mendeklarasikan keadaan darurat bukan untuk menyelesaikan krisis, namun untuk mendapatkan kekuatan yang diberikan oleh krisis. Joe Biden mencoba menggunakan pandemi COVID-19 untuk membatalkan pinjaman mahasiswa senilai $430 miliar yang dia tidak punya wewenang untuk membatalkannya.

Presiden Trump menyatakan ketidakseimbangan perdagangan sebagai darurat nasional. Ia mengklaim bahwa Undang-Undang Kekuatan Ekonomi Darurat Internasional, atau IEEPA, tahun 1977 – sebuah undang-undang yang tidak menyebutkan kata “tarif” – memberinya kekuasaan penuh dan tidak terbatas untuk mengenakan tarif guna menghadapi keadaan darurat tersebut. Dia menggunakan kewenangan ini untuk menghukum Brazil – yang mana kita punya surplus perdagangan — karena pemerintah saat ini sedang menuntut sekutunya yang juga mencoba mencuri pemilu.

Dan minggu lalu, Trump mengumumkan bahwa a iklan pro perdagangan bebas dibeli oleh pemerintah provinsi Ontario di Kanada, menggunakan kata-kata Presiden Reagan – merupakan pembenaran untuk menaikkan tarif di seluruh Kanada sebesar 10%. Selain minyak, kita juga punya surplus perdagangan dengan Kanada. Kami membeli banyak minyak dari Kanada karena mereka menjualnya kepada kami dengan harga di bawah harga pasar.

Ini bukanlah keadaan darurat. Defisit perdagangan juga tidak terjadi secara umum. Apakah keadaan darurat jika Anda mengalami defisit perdagangan dengan supermarket lokal Anda?

Para pengacara Trump berargumentasi bahwa menolak kekuasaan permanen dan tak terbatas yang dimiliki presiden akan menjadi bencana, dan hal ini merupakan argumen Caesarist: Saya harus memiliki kekuatan yang tidak terkendali untuk membuat Anda tetap aman.

IEEPA mewajibkan Kongres untuk meninjau tindakan presiden setiap enam bulan bulan. Tapi anggota Kongres dari Partai Republik mengubah aturan menyangkal kemampuan mereka untuk memeriksa otoritas yang disalahgunakan oleh Trump.

Trump bukanlah seorang diktator, namun seperti yang dipahami Benjamin Franklin, republik-republik gagal bukan karena calon Kaisar yang merebut kekuasaan. Mereka gagal karena para pengecut memberikannya kepada mereka – dengan dalih palsu dalam keadaan darurat.

X: @JonahDispatch

Tautan sumber

Continue Reading

Pendapat

Grokipedia milik Elon Musk diluncurkan dengan halaman Wikipedia hasil kloning AI

Published

on

Kami masih memahami cara kerja Grokipedia.

Sejak tahun 2001, Wikipedia telah menjadi tulang punggung pengetahuan di internet. Diselenggarakan oleh Wikimedia Foundation, situs ini tetap menjadi satu-satunya situs web besar di dunia yang dijalankan oleh organisasi nirlaba. Berbeda dengan proyek-proyek yang lebih baru, kekuatan Wikipedia jelas: kebijakannya transparan, pengawasan sukarela yang ketat, dan budaya perbaikan berkelanjutan yang kuat. Wikipedia adalah ensiklopedia yang ditulis untuk memberi informasi kepada miliaran pembaca tanpa mempromosikan sudut pandang tertentu.

Pengetahuan Wikipedia adalah – dan akan selalu – bersifat manusiawi. Melalui kolaborasi terbuka dan konsensus, orang-orang dari semua latar belakang membangun catatan pemahaman manusia yang hidup dan netral – sebuah catatan yang mencerminkan keberagaman dan keingintahuan kolektif kita. Pengetahuan buatan manusia inilah yang digunakan perusahaan AI untuk menghasilkan konten; bahkan Grokipedia membutuhkan Wikipedia untuk ada.

Independensi nirlaba Wikipedia—tidak ada iklan dan tidak ada penjualan data—juga membedakannya dari alternatif nirlaba. Semua kekuatan ini menjadikan Wikipedia sebagai sumber terpercaya selama lebih dari dua dekade.

Banyak eksperimen untuk membuat versi alternatif Wikipedia telah terjadi sebelumnya; tidak mengganggu pekerjaan atau misi kami. Menjelang ulang tahun Wikipedia yang ke-25, Wikipedia akan terus fokus pada penyediaan pengetahuan gratis dan tepercaya yang dibangun oleh komunitas sukarelawan yang berdedikasi. Untuk informasi lebih lanjut tentang cara kerja Wikipedia, kunjungi kami situs web dan baru seri blog.

Tautan sumber

Continue Reading

Pendapat

Trump perlu mengambil tindakan dan bersikap serius terhadap Ukraina

Published

on

Beberapa kali selama dua minggu terakhir, Presiden Trump telah membalikkan kebijakannya mengenai Ukraina, dan beralih secara liar ke posisi defaultnya menyanjung dan memberikan konsesi kepada Vladimir Putin untuk menekannya agar fleksibel dalam gencatan senjata.

truf kembali memprotes Presiden Ukraina Volodymyr Zelensky karena menolak mengorbankan kedaulatan Ukraina (setelah menyarankan dia bisa mengusir Rusia dari seluruh Ukraina), dan akhirnya berakhir dengan membatalkan pertemuan puncak yang keliru dengan Putinmengesankan sanksi yang telah lama tertunda di dua perusahaan produksi minyak terbesar Rusia.

Trump mungkin tidak menyukai perbandingan tersebut, namun perubahan kebijakannya yang tidak menentu sebagian mencerminkan kebimbangan mantan Presiden Biden mengenai respons yang tepat terhadap agresi Putin.

Biden awalnya mengatakan dia akan menerimanya “sedikit perampokan” oleh Rusia dan menolak zona larangan terbang karena takut memicu “Perang Dunia Ketiga”. Dia memveto penggunaan tank modern AS dan Jerman serta sistem persenjataan Barat lainnya kembali lagi nanti. Dia merusak kemampuan Ukraina untuk menyerang sasaran di wilayah Rusia, sambil mendefinisikan konflik sebagai a perjuangan eksistensial untuk perdamaian di Eropa dan pelestarian tatanan internasional.

Secara keseluruhan, seperti yang dilakukan Putin dan sekutunya di Beijing, Pyongyang, dan Teheran, rangkaian keragu-raguan dan fluktuasi taktis yang dialami Biden dan Trump menunjukkan adanya kebingungan dan kegelisahan strategis AS. Dan ini hanyalah salah satu fase dari apa yang mungkin akan menjadi perang di tiga atau empat front. Trump perlu bertindak sekarang untuk menghindari skenario buruk ini.

Trump harus menyadari bahwa perang di Ukraina bukan sekadar pertikaian kepribadian antara dua orang yang saling bermusuhan “Aku saling membenci” namun pecahnya agresi lintas batas terbesar di Eropa sejak Perang Dunia Kedua. Dia harus tahu bahwa hal ini dimulai (dan berlanjut) hanya karena invasi dan kejahatan perang yang terus dilakukan Rusia, dan bahwa kekuatan musuh lainnya adalah bagian dari serangan anti-Barat.

Benar, konflik ini bermula pada masa lemahnya mandat keamanan nasional Obama-Biden dan Biden-Harris, namun konflik ini semakin parah di bawah pemerintahan Trump-Vance dan berpotensi menyebar. Trump dapat mengubah dinamika ini jika dia akhirnya membebaskan Ukraina dan memberinya kekuatan untuk melakukan apa yang dia katakan dua minggu lalu sebagai kemungkinan yang realistis: mengusir penjajah Rusia.

Tampaknya, Trump melakukan hal ini bukan karena belas kasihan terhadap banyak korban di Ukraina, atau karena kemarahan moral terhadap pelanggaran besar-besaran yang dilakukan Putin terhadap hukum dan norma internasional. Kemungkinan besar, hal ini mencerminkan kekecewaan mereka terhadap reputasi Putin yang pernah dibanggakan sebagai orang kuat yang tahu cara mendapatkan apa yang diinginkannya dan sangat efisien dalam mencapai hal tersebut.

Trump berangkat dari menyebut Putin “jenius” memberi label dia minggu lalu sebagai a “harimau kertas”. Cara Trump menggambarkan kesulitan Rusia saat ini di Ukraina — “Mereka diharapkan menang dalam tiga hari,” katanya bulan lalu di Majelis Umum Perserikatan Bangsa-Bangsa – sepertinya dia kecewa karena Rusia tidak melakukan invasi pada tahun 2022 secepat yang dilakukan di Ukraina timur dan Krimea pada tahun 2014. Mungkin dia sekarang melihat Putin sebagai pecundang yang tak terelakkan – di mata Trump, hal terburuk yang bisa dikatakan tentang seorang pemimpin.

Jika kita menyaksikan kemunculan Trump yang baru, atau setidaknya kebijakan Trump yang baru terhadap Ukraina, hal pertama yang harus dia lakukan adalah mengirimkan Tomahawk yang dia miliki. digantung di depan Ukraina selama beberapa hari yang menggoda sampai Putin, sekali lagi, membujuknya.

Selanjutnya, Amerika harus membujuk sekutu-sekutu Amerika di NATO untuk menggunakan aset-aset Rusia yang dibekukan untuk membeli Tomahawk tambahan dan sistem senjata canggih lainnya guna membebankan biaya yang semakin tidak tertahankan pada Rusia untuk melanjutkan perang. Tiongkok juga harus menanggung dampaknya melalui peningkatan sanksi mendukung agresi Rusia.

Trump juga harus menyampaikan ultimatum publik kepada Putin: kecuali Putin segera setuju untuk mengakhiri perang dan menarik diri sepenuhnya dari Ukraina, AS akan lebih aktif dan terlibat langsung di pihak Ukraina dan melakukan upaya bersama untuk membujuk NATO agar mengakui Ukraina sebagai anggota penuh.

Perkembangan ini akan menunjukkan kekalahan militer dan politik bagi Putin. Untuk menjadikannya selengkap dan bermakna dalam skala global seperti penyerahan tanpa syarat Jepang dan Jerman yang mengakhiri Perang Dunia II, Trump harus memberi tahu rakyat Rusia bahwa, jika mereka memutuskan untuk melepaskan diri dari rezim Putin, Amerika Serikat siap, bersedia dan mampu memimpin negara-negara Barat dalam mendukung upaya tersebut melalui cara-cara yang terang-terangan dan terselubung.

Tawaran ini juga akan mengirimkan pesan kepada Tiongkok, Iran dan Korea Utara bahwa hari-hari mereka dalam meneror negara-negara tetangga dan penduduk mereka sendiri akan segera berakhir. Hasil seperti ini tentu akan membenarkan beberapa Hadiah Nobel bagi Trump – satu Hadiah Nobel untuk setiap tahun di mana salah satu dari empat tiran dunia digulingkan secara damai.

Joseph Bosco menjabat sebagai direktur negara Menteri Pertahanan Tiongkok dari tahun 2005 hingga 2006 dan sebagai direktur bantuan kemanusiaan dan bantuan bencana untuk Asia-Pasifik dari tahun 2009 hingga 2010. Ia adalah anggota non-residen di Institute of Korean American Studies, anggota dewan penasihat untuk Global Taiwan Institute, dan anggota dewan penasihat untuk Koalisi Vandenberg.  

Tautan sumber

Continue Reading

Trending