Pendapat
Reddit menggugat Perplexity karena diduga menyalin kontennya untuk memberi makan AI
Reddit menggugat Perplexity dan tiga “penyedia layanan pengumpulan data” untuk “menghentikan penghindaran perlindungan data skala industri yang ilegal oleh sekelompok aktor jahat yang akan melakukan apa saja untuk mendapatkan konten berhak cipta yang berharga di Reddit.” sesuai dengan keluhannya.
Perusahaan menyamakan perusahaan pengumpulan data – SerpApi, Oxylabs dan AWMProxy – dengan “calon perampok bank” yang “mengetahui bahwa mereka tidak dapat memasuki brankas bank, membobol truk lapis baja yang mengangkut uang”. Reddit menuduh bahwa Perplexity adalah pelanggan dari “setidaknya satu” perusahaan pengumpulan data, dengan mengatakan bahwa pihaknya akan “tampaknya melakukan apa saja untuk mendapatkan data yang sangat dibutuhkan Reddit untuk menggerakkan ‘mesin respons’ – yaitu, apa saja sebagai tambahan mengadakan kesepakatan langsung dengan Reddit, seperti yang dilakukan beberapa pesaingnya.”
Berdasarkan gugatan tersebut, Reddit mengirimkan surat penghentian dan penghentian kepada Perplexity pada Mei 2024 “menuntut agar mereka berhenti mengumpulkan data dari Reddit.” Meskipun Perplexity mengatakan kepada Reddit pada saat itu bahwa mereka tidak menggunakan konten Reddit untuk melatih model AI dan akan menghormati robots.txt Reddit, setelah surat ini, volume kutipan Reddit tentang Perplexity sebenarnya meningkat. Reddit juga membuat postingan yang hanya dapat dirayapi oleh Google, dan “dalam beberapa jam”, Perplexity “menghasilkan konten” dari postingan tersebut, kata perusahaan tersebut.
“Satu-satunya cara Perplexity dapat memperoleh konten ini dari Reddit dan kemudian menggunakannya dalam ‘mesin respons’ adalah jika Perplexity dan/atau rekan tergugatnya mengumpulkan SERP Google untuk konten ini dari Reddit dan Perplexity kemudian dengan cepat memasukkan data tersebut ke dalam mesin responsnya,” tulis Reddit.
“Perusahaan AI terlibat dalam perlombaan senjata untuk mendapatkan konten manusia yang berkualitas – dan tekanan ini telah memicu ekonomi ‘pencucian data’ skala industri,” kata Ben Lee, kepala bagian hukum Reddit, dalam sebuah pernyataan. “Scraper melewati perlindungan teknologi untuk mencuri data dan kemudian menjualnya kepada pelanggan yang haus akan materi pelatihan. Reddit adalah target utama karena merupakan salah satu kumpulan percakapan manusia terbesar dan paling dinamis yang pernah dibuat.
“Terdakwa Oxylabs UAB, AWM Proxy, dan SerpAI – pengikis data Lituania, bekas botnet Rusia, dan perusahaan yang secara terbuka mengiklankan taktik penghindaran liciknya – adalah contoh klasik dari perilaku ilegal ini,” kata Lee. “Tidak dapat menyalin Reddit secara langsung, mereka menutupi identitas mereka, menyembunyikan lokasi mereka, dan menyamarkan web scraper mereka untuk mencuri konten Reddit dari Google Penelusuran. Kebingungan adalah pelanggan yang bersedia setidaknya salah satu dari scraper ini, memilih untuk membeli data curian daripada membuat perjanjian hukum dengan Reddit sendiri.”
“Kebingungan belum terjawab dalam gugatan tersebut, namun kami akan selalu memperjuangkan hak pengguna atas akses bebas dan adil terhadap pengetahuan publik,” kata Jesse Dwyer, kepala komunikasi di Perplexity. Tepi. “Pendekatan kami tetap berprinsip dan bertanggung jawab karena kami memberikan jawaban faktual dengan AI yang akurat dan tidak akan mentolerir ancaman terhadap keterbukaan dan kepentingan publik.”