Byungchae Ryan Son

Szintetikus adatok: A gépek vásárlókká válnak

  • Írás nyelve: Koreai
  • Országkód: Minden országcountry-flag
  • Informatika

Létrehozva: 2024-05-10

Létrehozva: 2024-05-10 14:06

"Tesztelje ötleteit és termékeit a mesterséges intelligencia által generált fogyasztókkal, és hozzon meg bizalommal döntéseket."

Szintetikus adatok: A gépek vásárlókká válnak

Szintetikus felhasználók (Synthetic users), akik felhasználói kutatási szolgáltatást nyújtanak felhasználók nélkül


A februárban bevezetett Synthetic Users szolgáltatás, nevéhez hűen, a termékfejlesztéssel kapcsolatos felhasználói kutatások célcsoportját valódi emberek helyett generált, virtuális fogyasztók képezik. Lehetővé teszi a virtuális személyekkel való interjúk és kérdőíves felmérések lebonyolítását, valamint a termékhasználattal kapcsolatos visszajelzések gyűjtését. Ezen felül kínál olyan funkciókat, mint a célcsoport specifikus körülményeinek beállítása (pl. egy hosszú távú kapcsolatban élő európai pár), valamint 100 darab kapcsolódó interjúadat 380 dolláros, forradalmian új költségmegtakarítási lehetőséget. A szolgáltatással találkozott antropológiai, szociológiai és humán tudományi szakemberek közösségei pedig vegyes reakciókat fogalmaztak meg: van, aki kellemetlennek, van, aki fenyegetőnek, mások pedig szórakoztatónak találják.


Ez a reakció magában foglalja azt a bizonytalanságot, hogy a „szintetikus” alkotások – nem pedig a személyek megértésével foglalkozó kvalitatív kutatásokban – vajon túlságosan könnyen lemásolhatóak-e az emberi lét alapvető jellemzői, mint a személyazonosság, a cél, az öröm és az értékek. Emellett tartalmazza a cinikus nézőpontokat is, miszerint a szolgáltatás nem képes kellőképpen megjeleníteni a valódi emberek által a valóságban tapasztalt bonyolult szociális, politikai helyzeteket és az azokban fennálló kölcsönös viszonyokat.


Valójában a szintetikus adatok nem új fogalom. Különösen akkor hasznosak, amikor nehéz adatgyűjteményhez jutni. Például az autógyártók virtuális autó szimulációkban használják a vezetői viselkedés utánozására, hogy széleskörű és változatos helyzetekben képezzék a modelleket. Használták már 2,7 millió koronavírusos beteg adatainak lemásolására is, hogy olyan adatkészletet hozzanak létre, amely megőrzi a statisztikai jellemzőket, de anonim marad, így a kutatók gyorsan megoszthatják és felhasználhatják azokat szerte a világon.


Azonban a ChatGPT szinte minden szolgáltatásba való gyors beépülése és terjedése robbanásszerűen növelte a már amúgy is növekvő szintetikus adatigényt, és eljutott oda, hogy vannak, akik azt állítják, hogy a szintetikus adatokkal helyettesíthető az emberi mindennapokból származó ismeretek megszerzése.


Különösen a Synthetic Users szolgáltatás szemlélteti a szintetikus adatok használatával kapcsolatos aggályokat a legvilágosabban:„A valóságtól való eltérés”, azaz a „data” és az „igazság” meghatározásának újragondolására van szükség.


Már most a félretájékoztatás korában élünk, és egyre nehezebb megérteni az általunk látott adatok forrását és elfogultságát. A szintetikus adatok özöne, amely a jövőben várható, nemcsak elmosódottabbá teszi a „valós” és a „mesterséges” közötti határokat, hanem megnehezíti a hétköznapi adatfogyasztók számára, hogy kritikusan értékeljék az eredeti adatok forrását, gyűjtési és manipulációs módszereit, és azt, hogy mekkora mértékben lehet bízni bennük.


Ezért a szintetikus adatok forradalmának nem várt következményei elkerülése érdekében a legfontosabb, hogy a nagy adatok helyett a kis adatokra összpontosítsunk. Manapság sok vállalat hajlamos a „data-alapú döntéshozatalra”, azaz minden elérhető adat alapján hoz döntéseket, még akkor is, ha a használt adatkészlet egyértelműen elfogult vagy hiányos. A szintetikus adatoknak tehát a legjobb, valódi adatokból kell származniuk. Emellett a lehető legjobb minőségű kezdeti adatkészlet biztosítására is szükség van, figyelembe véve az adatokban rejlő legfontosabb elemeket és azok jelentőségét.


Ha nem alapozunk szigorú megértésre a legfrissebb, alapvető emberi jelenségekkel kapcsolatban – például az emberek mondanivalója és tettei közötti különbséggel vagy a viselkedésünk váratlan hatásaival az életünkre –, akkor fennáll a veszélye annak, hogy olyan társadalmi világot szimulálunk, amely a valóságot fenyegeti, és káros a vállalatok és az emberek számára egyaránt.


A szintetikus adatok a jövőben sokkal nagyobb szerepet fognak játszani a mindennapi életünkben. Potenciálisan átalakíthatják a tapasztalatainkat a világról, az algoritmusoktól kezdve az adatok és a valóság megértéséig. Ilyen fontos döntéseket nem szabad egy maroknyi adattudósra bízni, még akkor sem, ha a legjobb szándékok vezérlik őket. Szükség van a társadalomtudományi és humán tudományi szakemberek bevonására a közös munkába. Ez nem csupán azért van így, mert a szintetikus adatok nem segítenek vagy éppen ártanak a jelenlegi adatkészletekhez képest, hanem azért, mert túl sok lehetőség rejlik bennük, ami félelmet kelt.



*Ez a cikk a 2023. április 11-i Elektronikai Újság névjegyes rovataoldalán megjelent cikk eredeti változata.


Hivatkozások


Hozzászólások0

Az SK C&C bemutatja a 'Soluer LLMOps' platformot, amely támogatja a testreszabott sLLM-ek implementációját az ügyfelek számáraAz SK C&C piacra dobta a 'Soluer LLMOps' platformot, amely lehetővé teszi a vállalkozások számára, hogy testreszabott, kis méretű nagyméretű nyelvi modelleket (sLLM) építsenek. A platform lehetővé teszi az sLLM-ek egyszerű létrehozását húzás-és-elengedés
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (SeenThis.kr)

May 20, 2024