Szintetikus adatok: A gépek vásárlókká válnak

"Tesztelje ötleteit és termékeit a mesterséges intelligencia által generált fogyasztókkal, és hozzon meg bizalommal döntéseket."

Szintetikus felhasználók (Synthetic users), akik felhasználói kutatási szolgáltatást nyújtanak felhasználók nélkül

A februárban bevezetett Synthetic Users szolgáltatás, nevéhez hűen, a termékfejlesztéssel kapcsolatos felhasználói kutatások célcsoportját valódi emberek helyett generált, virtuális fogyasztók képezik. Lehetővé teszi a virtuális személyekkel való interjúk és kérdőíves felmérések lebonyolítását, valamint a termékhasználattal kapcsolatos visszajelzések gyűjtését. Ezen felül kínál olyan funkciókat, mint a célcsoport specifikus körülményeinek beállítása (pl. egy hosszú távú kapcsolatban élő európai pár), valamint 100 darab kapcsolódó interjúadat 380 dolláros, forradalmian új költségmegtakarítási lehetőséget. A szolgáltatással találkozott antropológiai, szociológiai és humán tudományi szakemberek közösségei pedig vegyes reakciókat fogalmaztak meg: van, aki kellemetlennek, van, aki fenyegetőnek, mások pedig szórakoztatónak találják.

Ez a reakció magában foglalja azt a bizonytalanságot, hogy a „szintetikus” alkotások – nem pedig a személyek megértésével foglalkozó kvalitatív kutatásokban – vajon túlságosan könnyen lemásolhatóak-e az emberi lét alapvető jellemzői, mint a személyazonosság, a cél, az öröm és az értékek. Emellett tartalmazza a cinikus nézőpontokat is, miszerint a szolgáltatás nem képes kellőképpen megjeleníteni a valódi emberek által a valóságban tapasztalt bonyolult szociális, politikai helyzeteket és az azokban fennálló kölcsönös viszonyokat.

Valójában a szintetikus adatok nem új fogalom. Különösen akkor hasznosak, amikor nehéz adatgyűjteményhez jutni. Például az autógyártók virtuális autó szimulációkban használják a vezetői viselkedés utánozására, hogy széleskörű és változatos helyzetekben képezzék a modelleket. Használták már 2,7 millió koronavírusos beteg adatainak lemásolására is, hogy olyan adatkészletet hozzanak létre, amely megőrzi a statisztikai jellemzőket, de anonim marad, így a kutatók gyorsan megoszthatják és felhasználhatják azokat szerte a világon.

Azonban a ChatGPT szinte minden szolgáltatásba való gyors beépülése és terjedése robbanásszerűen növelte a már amúgy is növekvő szintetikus adatigényt, és eljutott oda, hogy vannak, akik azt állítják, hogy a szintetikus adatokkal helyettesíthető az emberi mindennapokból származó ismeretek megszerzése.

Különösen a Synthetic Users szolgáltatás szemlélteti a szintetikus adatok használatával kapcsolatos aggályokat a legvilágosabban:„A valóságtól való eltérés”, azaz a „data” és az „igazság” meghatározásának újragondolására van szükség.

Már most a félretájékoztatás korában élünk, és egyre nehezebb megérteni az általunk látott adatok forrását és elfogultságát. A szintetikus adatok özöne, amely a jövőben várható, nemcsak elmosódottabbá teszi a „valós” és a „mesterséges” közötti határokat, hanem megnehezíti a hétköznapi adatfogyasztók számára, hogy kritikusan értékeljék az eredeti adatok forrását, gyűjtési és manipulációs módszereit, és azt, hogy mekkora mértékben lehet bízni bennük.

Ezért a szintetikus adatok forradalmának nem várt következményei elkerülése érdekében a legfontosabb, hogy a nagy adatok helyett a kis adatokra összpontosítsunk. Manapság sok vállalat hajlamos a „data-alapú döntéshozatalra”, azaz minden elérhető adat alapján hoz döntéseket, még akkor is, ha a használt adatkészlet egyértelműen elfogult vagy hiányos. A szintetikus adatoknak tehát a legjobb, valódi adatokból kell származniuk. Emellett a lehető legjobb minőségű kezdeti adatkészlet biztosítására is szükség van, figyelembe véve az adatokban rejlő legfontosabb elemeket és azok jelentőségét.

Ha nem alapozunk szigorú megértésre a legfrissebb, alapvető emberi jelenségekkel kapcsolatban – például az emberek mondanivalója és tettei közötti különbséggel vagy a viselkedésünk váratlan hatásaival az életünkre –, akkor fennáll a veszélye annak, hogy olyan társadalmi világot szimulálunk, amely a valóságot fenyegeti, és káros a vállalatok és az emberek számára egyaránt.

A szintetikus adatok a jövőben sokkal nagyobb szerepet fognak játszani a mindennapi életünkben. Potenciálisan átalakíthatják a tapasztalatainkat a világról, az algoritmusoktól kezdve az adatok és a valóság megértéséig. Ilyen fontos döntéseket nem szabad egy maroknyi adattudósra bízni, még akkor sem, ha a legjobb szándékok vezérlik őket. Szükség van a társadalomtudományi és humán tudományi szakemberek bevonására a közös munkába. Ez nem csupán azért van így, mert a szintetikus adatok nem segítenek vagy éppen ártanak a jelenlegi adatkészletekhez képest, hanem azért, mert túl sok lehetőség rejlik bennük, ami félelmet kelt.

*Ez a cikk a 2023. április 11-i Elektronikai Újság névjegyes rovataoldalán megjelent cikk eredeti változata.

Hivatkozások

Kutatás valódi emberek fáradsága nélkül

A mesterséges intelligencia állapota

Felhasználói kutatás szintézis nélkül

Szintetikus kutatás és szilícium mintavétel // BrXnd Dispatch 010. kötet
Beszélnünk kell a szintetikus adatokról⁠⁠⁠⁠⁠⁠⁠

Hozzászólások0