Pendapat
Openai ditangkap, getaran grafis
Selama siaran langsung GPT-5 pada hari Kamis, Openai menunjukkan beberapa pemberhentian yang membuat model tampak cukup mengesankan-tetapi jika Anda melihat lebih dekat, beberapa grafik sedikit keluar.
Dalam satu, ironisnya menunjukkan seberapa baik GPT-5 dalam “evaluasi kekecewaan antara model”, skala ada di mana-mana. Untuk “pengkodean kekecewaan”, misalnya, grafik yang ditunjukkan pada panggung mengatakan bahwa GPT-5 dengan pemikiran tampaknya menerima kesalahan 50,0 %, tetapi ini dibandingkan dengan skor OpenAI 47,4 % terendah, yang entah bagaimana memiliki bilah yang lebih besar. Openai tampaknya memiliki angka yang akurat untuk bagan ini di Anda Posting blog GPT-5Namun, di mana tingkat kesalahan GPT-5 diberi label 16,5 %.
Dengan bagan iniOpenai menunjukkan di atas panggung bahwa salah satu skor GPT-5 adalah lebih rendah dari O3, tetapi ditampilkan dengan bilah yang lebih besar. Dalam grafik yang sama ini, skor O3 dan GPT-4O berbeda, tetapi ditunjukkan dengan bilah ukuran yang sama. Sudah cukup buruk sehingga CEO Sam Altman berkomentar, menyebutnya “Mega Chart Ferepup”, meskipun ia memperhatikan bahwa versi yang benar ada di posting blog Openai.
Seorang karyawan pemasaran openai juga meminta maafMengatakan, “Kami memperbaiki bagan di blog, alasan kejahatan yang tidak disengaja dari bagan.”
Openai tidak segera menanggapi permintaan komentar. Dan sementara tidak jelas apakah Openai telah menggunakan GPT-5 untuk benar-benar berhenti, itu belum menjadi tampilan yang bagus untuk perusahaan pada peluncuran besar-besaran khususnya ketika mempublikasikan “kemajuan signifikan dalam mengurangi halusinasi” dengan model barunya.