Berita
Teknologi AI baru ini menciptakan konsumen “kembaran digital” dan dapat menghapuskan industri pemindaian tradisional
baru Makalah penelitian Diterbitkan secara diam-diam minggu lalu, laporan ini menguraikan metode terobosan yang memungkinkan model linguistik besar (LLM) untuk mensimulasikan perilaku konsumen manusia dengan akurasi yang menakjubkan, sebuah perkembangan yang dapat membentuk kembali pasar bernilai miliaran dolar. Industri riset pasar. Teknologi ini menjanjikan untuk menciptakan pasukan konsumen artifisial yang tidak hanya dapat memberikan evaluasi produk yang realistis, namun juga alasan kualitatif di balik produk tersebut, dengan skala dan kecepatan yang saat ini tidak dapat dicapai.
Selama bertahun-tahun, perusahaan telah berusaha menggunakan AI dalam riset pasar, namun terhambat oleh kelemahan mendasar: ketika diminta untuk memberikan peringkat numerik pada skala 1 hingga 5, mahasiswa Magister Manajemen memberikan tanggapan yang tidak realistis dan tidak terdistribusi dengan baik. kertas baru, "LLM mereproduksi niat pembelian manusia dengan memunculkan kesamaan semantik dari peringkat Likert," Dikirim ke server pracetak arXiv pada tanggal 9 Oktober, ia mengusulkan solusi elegan yang sepenuhnya menghindari masalah ini.
Tim peneliti internasional yang dipimpin oleh Benjamin F. Mayer mengembangkan metode yang mereka sebut Peringkat Kesamaan Semantik (SSR). Daripada meminta nomor dari LLM, SSR meminta formulir untuk memberikan opini teks kaya tentang produk. Teks ini kemudian diubah menjadi vektor digital — yaitu "Penyematan" – Kemiripannya diukur berdasarkan sekumpulan data referensi yang telah ditentukan sebelumnya. Misalnya saja membalas "Saya pasti akan membeli ini, inilah yang saya cari" Secara linguistik akan lebih dekat dengan pernyataan referensial dari a "5" Klasifikasi pernyataan untuk "1."
Hasilnya luar biasa. Diuji berdasarkan kumpulan data dunia nyata yang sangat besar dari perusahaan perawatan pribadi terkemuka – yang terdiri dari 57 survei produk dan 9.300 tanggapan manusia – metode SSR mencapai 90% keandalan pengujian-pengujian ulang pada manusia. Yang terpenting, distribusi rating yang dihasilkan AI secara statistik hampir tidak dapat dibedakan dari panel manusia. Para penulis menyatakan, "Kerangka kerja ini memungkinkan simulasi riset konsumen yang terukur dengan tetap mempertahankan metrik survei tradisional dan kemampuan interpretasi."
Solusi tepat waktu karena kecerdasan buatan mengancam integritas pengintaian
Perkembangan ini terjadi pada saat yang kritis, karena integritas survei online tradisional semakin terancam oleh kecerdasan buatan. Analisis tahun 2024 Sekolah Pascasarjana Bisnis Universitas Stanford Hal ini menyoroti meningkatnya masalah responden survei manusia yang menggunakan chatbots untuk menghasilkan jawaban mereka. Respons ini ditemukan dihasilkan oleh kecerdasan buatan "Sangat bagus" Terlalu bertele-tele, dan kurang "Snark" dan keaslian reaksi nyata manusia, yang mengarah pada apa yang peneliti sebut a "Kehomogenan" Data yang dapat menyembunyikan masalah serius seperti diskriminasi atau cacat produk.
Penelitian Mayer menawarkan pendekatan yang benar-benar berbeda: Daripada berjuang membersihkan data yang tercemar, ia menciptakan lingkungan terkendali untuk menghasilkan data sintetis beresolusi tinggi dari awal.
"Apa yang kita lihat adalah peralihan dari bertahan ke menyerang." kata seorang analis yang tidak berafiliasi dengan penelitian tersebut. "Makalah Stanford menunjukkan kekacauan yang disebabkan oleh AI yang tidak terkendali dan mencemari kumpulan data manusia. Makalah baru ini menunjukkan urutan dan kegunaan AI yang dikendalikan dengan membuat kumpulan datanya sendiri. Bagi seorang chief data officer, inilah perbedaan antara membersihkan sumur yang tercemar dan memanfaatkan sumber air baru."
Dari teks ke niat: Lompatan teknologi melampaui konsumen buatan
Validitas teknis metode baru ini bergantung pada kualitas penyematan teks, sebuah konsep yang dieksplorasi dalam makalah tahun 2022 di Ilmu Data EPJ. Penelitian ini dilatarbelakangi oleh ketelitian "Membangun validitas" Sebuah kerangka kerja untuk memastikan bahwa penyematan teks – representasi digital dari teks – adalah nyata "Ukur apa yang seharusnya mereka lakukan."
kesuksesan metode RSK Disarankan agar implikasinya secara efektif menangkap nuansa niat membeli. Agar teknologi baru ini dapat diadopsi secara luas, perusahaan harus yakin bahwa model yang mendasarinya tidak hanya menghasilkan teks yang masuk akal, namun juga menghubungkan teks tersebut dengan hasil dengan cara yang kuat dan bermakna.
Pendekatan ini juga mewakili lompatan signifikan dari penelitian sebelumnya, yang sebagian besar berfokus pada penggunaan penyematan teks untuk menganalisis dan memprediksi peringkat dari ulasan online yang ada. A Studi 2022misalnya, mengevaluasi performa model seperti BERT dan word2vec dalam memprediksi skor ulasan di situs ritel, dan menemukan bahwa model baru seperti BERT memiliki performa lebih baik untuk penggunaan umum. Penelitian baru bergerak lebih dari sekedar menganalisis data yang ada untuk menghasilkan wawasan baru yang prediktif sebelum suatu produk mencapai pasar.
Fajar kelompok fokus digital
Bagi pengambil keputusan teknis, dampaknya sangat besar. Kemampuan rotasi a "Kembaran digital" Menargetkan segmen konsumen dan menguji konsep produk, teks iklan, atau variasi kemasan dalam hitungan jam dapat mempercepat siklus inovasi secara signifikan.
Sebagaimana dicatat dalam makalah ini, responden buatan ini juga menyediakan hal yang sama "Umpan balik kualitatif yang kaya menjelaskan peringkat mereka," Menyediakan harta karun berupa data untuk pengembangan produk yang terukur dan dapat ditafsirkan. Meskipun era kelompok fokus khusus manusia masih jauh dari selesai, penelitian ini memberikan bukti paling meyakinkan bahwa kelompok sintetik sudah siap untuk digunakan.
Namun kelayakan komersialnya lebih dari sekedar kecepatan dan skala. Pertimbangkan aspek ekonominya: Panel survei tradisional untuk peluncuran produk nasional mungkin memerlukan biaya puluhan ribu dolar dan memerlukan waktu berminggu-minggu untuk diluncurkan. Simulasi berbasis SSR dapat memberikan wawasan yang sebanding dalam waktu singkat, biaya yang lebih murah, dan kemampuan untuk segera direplikasi berdasarkan hasilnya. Bagi perusahaan yang bergerak dalam kategori barang konsumen yang bergerak cepat – di mana jarak antara konsep dan rak dapat menentukan kepemimpinan pasar – keunggulan kecepatan ini bisa menjadi sangat penting.
Tentu saja ada peringatan. Metode ini telah divalidasi pada produk perawatan pribadi; Kinerjanya dalam pengambilan keputusan pembelian yang kompleks antara bisnis, barang mewah, atau produk dengan budaya spesifik masih belum terbukti. Meskipun penelitian ini menunjukkan bahwa RSK dapat meniru perilaku manusia secara agregat, penelitian ini tidak mengklaim dapat memprediksi pilihan konsumen secara individu. Teknik ini bekerja pada tingkat populasi, bukan pada tingkat orang, yang merupakan perbedaan yang sangat penting untuk aplikasi seperti pemasaran pribadi.
Namun meski dengan keterbatasan ini, penelitian ini menunjukkan titik balik. Meskipun era kelompok fokus yang hanya melibatkan manusia masih jauh dari selesai, makalah ini memberikan bukti paling meyakinkan hingga saat ini bahwa kelompok fokus sintetis sudah siap untuk digunakan. Pertanyaannya bukan lagi apakah kecerdasan buatan dapat meniru emosi konsumen, melainkan apakah perusahaan dapat bergerak cukup cepat untuk memanfaatkan kecerdasan buatan tersebut sebelum pesaing mereka.