Byungchae Ryan Son

Dane syntetyczne: Maszyny stają się konsumentami

  • Język oryginalny: Koreański
  • Kraj: Wszystkie krajecountry-flag
  • TO

Utworzono: 2024-05-10

Utworzono: 2024-05-10 14:06

Testuj pomysły i produkty wraz ze sztuczną inteligencją generującymi konsumentów i podejmuj decyzje z pewnością.

Dane syntetyczne: Maszyny stają się konsumentami

Synthetic users oferujący usługi badań użytkowników bez udziału rzeczywistych użytkowników


Uruchomiona w lutym usługa Synthetic Users, zgodnie ze swoją nazwą, oferuje do badań użytkowników w kontekście rozwoju produktu nie prawdziwych ludzi, a wygenerowanych wirtualnych konsumentów. Możliwe jest przeprowadzanie wywiadów i ankiet z wirtualnymi osobami, a także uzyskiwanie opinii na temat doświadczeń z produktem. Usługa oferuje również funkcję konfigurowania konkretnych scenariuszy dla docelowych grup odbiorców, np. pary z Europy w długotrwałym związku, oraz powiązane dane z wywiadów (100 wywiadów za 380 USD), co stanowi przełomowe rozwiązanie w zakresie redukcji kosztów. W środowisku akademickim, wśród osób zajmujących się antropologią, socjologią i etnografią, usługa spotkała się z różnorodnymi reakcjami, od wyrażenia dezaprobaty i poczucia zagrożenia po uznanie jej za interesującą.


Obejmuje to niepokój, że w badaniach jakościowych, które skupiają się na rozumieniu ludzi, a nie „syntetycznych” dzieł, kryteria dotyczące tożsamości, celów, przyjemności i wartości człowieka mogą być zaskakująco łatwo kopiowane i interpretowane. Dodatkowo pojawiają się sceptyczne opinie, że usługa nie jest w stanie w pełni odzwierciedlić złożonych społeczno-politycznych kontekstów, w których kształtują się problemy ludzi w rzeczywistości, wraz z towarzyszącymi im interakcjami i wzajemnymi zależnościami.


W rzeczywistości syntetyczne dane nie są nowym pojęciem. Szczególnie przydatne są w sytuacjach, gdy trudno jest uzyskać zestaw danych. Na przykład w branży motoryzacyjnej, podczas symulacji wirtualnych samochodów, służą do imitowania zachowań kierowców, umożliwiając trenowanie modeli w szerokim zakresie scenariuszy. Zostały również wykorzystane do stworzenia zestawu danych bez informacji identyfikacyjnych, który zachowuje cechy statystyczne, ale eliminuje dane osobowe, na podstawie zduplikowanych danych 2,7 miliona pacjentów z COVID-19. Dzięki temu naukowcy z całego świata mogli szybko udostępniać i analizować dane.


Jednak obecna sytuacja, w której ChatGPT jest wdrażany w niemal wszystkich usługach i rozprzestrzenia się w szybkim tempie, doprowadziła do gwałtownego wzrostu popytu na dane syntetyczne, który przybrał charakter wybuchowy. W efekcie pojawiły się usługi, które twierdzą, że dane syntetyczne mogą zastąpić codzienną pracę ludzi w zakresie pozyskiwania informacji.


W szczególności usługa Synthetic Users wyraźnie ukazuje obawy związane z wykorzystaniem danych syntetycznych, a mianowicie:„Różnicę w stosunku do rzeczywistości”, innymi słowy, konieczność ponownego zdefiniowania pojęć „dane” i „prawda”.


Żyjemy już w erze fałszywych informacji, a zrozumienie źródła i stronniczości wszystkich danych, które widzimy, staje się coraz trudniejsze. Nadchodząca powódź danych syntetycznych nie tylko jeszcze bardziej rozmyje granice między „rzeczywistością” a „sztucznością”, ale także utrudni przeciętnemu odbiorcy danych krytyczne ocenianie źródła danych, sposobu ich gromadzenia i manipulacji, a w konsekwencji – określenie stopnia ich wiarygodności.


Dlatego, aby zapobiec sytuacji, w której rewolucja danych syntetycznych doprowadzi do powstania świata, którego nie zamierzaliśmy, musimy skupić się na małych danych, a nie na dużych. Obecnie wiele firm koncentruje się na tzw. „podejmowaniu decyzji opartych na danych”, które polegają na podejmowaniu decyzji na podstawie wszystkich dostępnych danych, nawet jeśli dane te są obarczone stronniczością lub są niekompletne. Dlatego dane syntetyczne powinny wywodzić się z najlepszych dostępnych danych rzeczywistych. Ponadto należy zapewnić najwyższej jakości początkowy zestaw danych wraz z pogłębionym kontekstowym zrozumieniem tego, co jest najważniejsze w danych i dlaczego jest to ważne.


Jeśli nie będzie to oparte na głębokim zrozumieniu podstawowych zjawisk ludzkich, takich jak różnica między tym, co ludzie mówią, a tym, co robią, lub nieprzewidziane konsekwencje naszego działania w życiu, ryzykujemy symulację świata społecznego, który zagraża rzeczywistości w sposób szkodliwy zarówno dla firm, jak i dla zwykłych ludzi.


Dane syntetyczne będą odgrywać coraz większą rolę w naszym życiu. Mają potencjał do przekształcenia wszystkiego, od algorytmów kształtujących nasze doświadczenia ze światem po nasze rozumienie danych i rzeczywistości. Podejmowanie takich kluczowych decyzji, nawet przy najlepszych intencjach, jest zbyt ryzykowne, by powierzać je wyłącznie niektórym naukowcom zajmującym się danymi. Konieczna jest współpraca ze specjalistami z dziedzin nauk społecznych i humanistycznych. Nie wynika to z faktu, że dane syntetyczne są mniej pomocne lub gorsze niż niektóre obecne zestawy danych, ale raczej z obawy przed zbyt wieloma możliwościami, które mogą się urzeczywistnić.



*Ten artykuł jest oryginalną wersją opublikowaną 11 kwietnia 2023 r. w kolumnie gazety elektronicznej.


Literatura


Komentarze0