Byungchae Ryan Son

Data Sintetis: Ketika Mesin Menjadi Konsumen

  • Bahasa Penulisan: Bahasa Korea
  • Negara Standar: Semua Negaracountry-flag
  • TI

Dibuat: 2024-05-10

Dibuat: 2024-05-10 14:06

"Uji coba ide atau produk bersama konsumen sintetis (AI-generated) dan buat keputusan dengan percaya diri."

Data Sintetis: Ketika Mesin Menjadi Konsumen

Synthetic users yang menyediakan layanan user research tanpa user


Diluncurkan pada Februari lalu, layanan Synthetic Users, sesuai dengan namanya, menyediakan subjek riset pengguna terkait pengembangan produk bukan dari manusia sungguhan, melainkan konsumen virtual yang dihasilkan secara sintetis. Dimungkinkan untuk melakukan wawancara dan survei pada manusia virtual ini, mendapatkan umpan balik terkait pengalaman penggunaan produk, hingga fitur pengaturan situasi spesifik target pelanggan, seperti pasangan Eropa yang telah menjalin hubungan jangka panjang, serta data wawancara terkait sebanyak 100 buah dengan harga 380 dolar AS, yang merupakan penawaran hemat yang luar biasa. Dan, komunitas akademisi yang berlatar belakang antropologi, sosiologi, dan etnografi yang telah mengenal layanan ini memberikan beragam tanggapan, mulai dari rasa tidak nyaman, perasaan terancam, hingga rasa geli.


Hal ini mencakup kekhawatiran bahwa standar identitas, tujuan, kesenangan, dan nilai manusia yang merupakan inti dari riset kualitatif, yang bukan sekadar karya 'sintetis' tetapi proses memahami manusia itu sendiri, dapat dengan mudah direplikasi dan dipahami. Serta pandangan sinis bahwa layanan ini tidak dapat sepenuhnya merepresentasikan situasi sosial-politik yang kompleks beserta interaksi dan saling ketergantungan di dalamnya yang menjadi penyebab masalah nyata yang dihadapi orang-orang.


Sebenarnya, data sintetis bukanlah konsep baru. Data sintetis sangat berguna ketika sulit untuk mengumpulkan kumpulan data, misalnya digunakan dalam simulasi kendaraan virtual pabrikan otomotif untuk meniru perilaku pengemudi dan melatih model dalam berbagai skenario yang luas, atau menduplikasi catatan medis lebih dari 2,7 juta pasien COVID-19 untuk membuat kumpulan data yang mempertahankan karakteristik statistik tetapi tanpa informasi yang dapat mengidentifikasi seseorang sehingga dapat dibagikan dan diteliti dengan cepat oleh peneliti di seluruh dunia.


Namun, dalam situasi saat ini di mana ChatGPT diterapkan pada hampir semua layanan dan menyebar dengan cepat, permintaan data sintetis yang sebelumnya sudah meningkat drastis, memicu peningkatan eksplosif dan cakupannya kini meluas hingga layanan yang mengklaim bahwa kegiatan sehari-hari manusia yang menghasilkan wawasan dapat digantikan oleh data sintetis.


Khususnya, kekhawatiran terkait penggunaan data sintetis yang paling jelas ditunjukkan oleh layanan Synthetic Users adalah ‘kesenjangan dengan realitas’ atau dengan kata lain, kita perlu mendefinisikan ulang ‘data’ dan ‘kebenaran’.


Kita telah hidup di era informasi yang salah, dan semakin sulit untuk memahami asal dan bias dari semua data yang kita lihat. Banjir data sintetis di masa mendatang tidak hanya akan membuat batas antara 'nyata' dan 'buatan' menjadi semakin kabur, tetapi juga akan menyulitkan konsumen data biasa untuk secara kritis mengevaluasi sumber data asli, metode pengumpulan dan manipulasinya, dan pada akhirnya seberapa besar tingkat kepercayaan yang dapat diberikan pada data tersebut.


Oleh karena itu, untuk memastikan bahwa revolusi data sintetis tidak menciptakan dunia yang tidak kita inginkan, hal terpenting yang harus dimulai adalah memperhatikan bahwa data yang paling penting bukanlah data yang besar, melainkan data yang kecil. Saat ini, banyak perusahaan cenderung membuat keputusan berdasarkan semua data yang tersedia, yang disebut 'pengambilan keputusan berbasis data', meskipun kumpulan data tersebut jelas bias atau tidak lengkap. Karena itu, data sintetis harus berasal dari data realitas terbaik yang dapat kita temukan. Selain itu, perlu disajikan kumpulan data awal berkualitas terbaik dengan pemahaman kontekstual yang mendalam tentang apa yang paling penting dalam data dan mengapa hal itu penting.


Karena jika tidak didasarkan pada pemahaman yang teliti tentang fenomena manusia yang paling mendasar saat ini, seperti perbedaan antara apa yang dikatakan dan dilakukan orang atau dampak tak terduga dari tindakan kita terhadap kehidupan, kita berisiko mensimulasikan dunia sosial yang mengancam realitas dengan cara yang merugikan perusahaan dan masyarakat umum.


Data sintetis akan memainkan peran yang jauh lebih besar dalam kehidupan kita di masa depan. Data sintetis memiliki potensi untuk membentuk kembali segala hal, mulai dari algoritma yang membentuk pengalaman kita tentang dunia hingga pemahaman kita tentang data dan realitas. Keputusan penting ini terlalu berisiko untuk diserahkan kepada sebagian ilmuwan data saja, meskipun dengan niat yang baik, dan memerlukan kolaborasi dengan para ahli di bidang ilmu sosial dan humaniora. Hal ini bukan karena data sintetis kurang membantu atau bahkan lebih buruk daripada beberapa kumpulan data saat ini, tetapi karena kekhawatiran akan begitu banyak kemungkinan yang dapat terwujud.



*Artikel ini merupakan salinan asli dariKolom di Koran Elektronikyang diterbitkan pada tanggal 11 April 2023.


Referensi


Komentar0