![translation](https://cdn.durumis.com/common/trans.png)
Dit is een door AI vertaalde post.
Synthetische gegevens: machines worden consumenten
- Taal van de tekst: Koreaans
- •
-
Referentieland: Alle landen
- •
- Informatietechnologie
Selecteer taal
Samengevat door durumis AI
- De Synthetic Users-dienst, gelanceerd in februari, is een gebruikeronderzoeksdienst die gebruikmaakt van virtuele consumenten. Deze dienst biedt aanzienlijke kostenbesparingen ten opzichte van traditioneel onderzoek onder echte mensen, maar er is ook bezorgdheid over het feit dat de essentie van de menselijke identiteit, waarden en ervaringen mogelijk niet volledig worden gereflecteerd.
- Synthetische data worden in verschillende sectoren gebruikt, waaronder autosimulaties en data van COVID-19-patiënten. Met de opkomst van ChatGPT is de vraag naar synthetische data explosief gestegen.
- Om te voorkomen dat de synthetische datarevolutie een negatieve impact heeft op onze samenleving, is het noodzakelijk om synthetische data te genereren op basis van realistische gegevens met een diepgaand contextueel begrip. Samenwerking met experts op het gebied van sociale wetenschappen en geesteswetenschappen is van cruciaal belang.
"Test ideeën en producten met behulp van AI-gesynthetiseerde consumenten en neem met vertrouwen beslissingen."
Synthetic users, die user research diensten aanbieden zonder echte gebruikers
De Synthetic Users-service, die in februari werd gelanceerd, biedt zoals de naam al doet vermoeden, voor productontwikkeling en gerelateerd gebruikersonderzoek, niet echte mensen, maar gegenereerde virtuele consumenten. Met virtuele mensen kun je interviews en enquêtes uitvoeren, feedback krijgen over productgebruik en zelfs functies voor het instellen van specifieke situaties voor doelgroepen, zoals Europese koppels in een langdurige relatie, en gerelateerde interviewgegevens voor 100 interviews voor $ 380. Dit resulteert in een baanbrekende kostenbesparing. Degenen die deze dienst hebben ervaren, zoals antropologen, sociologen en antropologen, hebben gemengde reacties op deze ontwikkeling.
Deze reacties omvatten ongenoegen, onzekerheid en amusement. Het gaat niet om het begrijpen van 'gesynthetiseerde' creaties, maar om kwalitatief onderzoek, het begrijpen van mensen zelf, en de angst dat de normen voor de essentie van de mens, doelstellingen, plezier en waarden gemakkelijk kunnen worden gekopieerd en begrepen. Dit wordt gecombineerd met een cynische kijk dat de complexiteit van de sociale en politieke context waarin echte mensen worden geconfronteerd met alledaagse problemen, en de onderlinge relaties, niet volledig kunnen worden gerepliceerd.
In feite is dit soort synthetische data niet nieuw. Synthetische data is vooral nuttig wanneer het verzamelen van datasets moeilijk is. Bijvoorbeeld, bij virtuele autosimulaties van autofabrikanten, wordt het gedrag van bestuurders nagebootst om modellen te trainen in een breed scala aan situaties. Of 2,7 miljoen medische dossiers van COVID-19-patiënten zijn gedupliceerd om datasets te creëren met dezelfde statistische kenmerken, maar zonder identificeerbare gegevens, zodat onderzoekers ze over de hele wereld snel kunnen delen en bestuderen.
De snelle proliferatie van ChatGPT in bijna alle diensten creëert echter een explosieve groei van de vraag naar synthetische gegevens, die al snel aan het toenemen was, en de reikwijdte strekt zich nu uit tot diensten die beweren dat zelfs de dagelijkse routines van mensen die inzichten genereren, kunnen worden vervangen door synthetische gegevens.
De Synthetic Users-service illustreert het duidelijkst de bezorgdheid over het gebruik van synthetische gegevens, namelijk het 'gat tussen realiteit en synthese', wat aantoont dat we de definitie van 'gegevens' en 'waarheid' opnieuw moeten definiëren.
We leven al in een tijdperk van desinformatie, en het wordt steeds moeilijker om de bron en de vooroordelen te begrijpen van alle gegevens die we zien. De overvloed aan synthetische gegevens die ons te wachten staat, zal de scheidslijn tussen 'echt' en 'kunstmatig' niet alleen vaag maken, maar ook het vermogen van gewone consumenten van gegevens om kritisch te beoordelen en te bepalen waar de oorspronkelijke gegevens vandaan komen, hoe ze worden verzameld en gemanipuleerd, en uiteindelijk wat het vertrouwen moet zijn, te ondermijnen.
Om te voorkomen dat de synthetische datarevolutie een wereld creëert die we niet beoogden, moeten we beginnen met het benadrukken van 'kleine data' in plaats van grote data. Tegenwoordig zien we dat veel bedrijven de neiging hebben om te focussen op zogenaamde 'data-gestuurde besluitvorming', waarbij ze beslissingen nemen op basis van alle beschikbare gegevens, zelfs als de datasets duidelijk bevooroordeeld of onvolledig zijn. Daarom moet synthetische data worden afgeleid van de beste realistische gegevens die we kunnen vinden. Dit vereist ook het leveren van datasets van de hoogste kwaliteit, samen met een diepgaand contextueel begrip van wat het belangrijkste is in de gegevens en waarom het belangrijk is.
Zonder een strikte interpretatie van de meest recente fundamentele menselijke fenomenen, zoals het verschil tussen wat mensen zeggen en doen, of de onvoorziene impact van ons leven op onze acties, bestaat het risico om de werkelijkheid te bedreigen door de sociale wereld te simuleren op een manier die schadelijk is voor zowel bedrijven als particulieren.
Synthetische data zal in de toekomst een steeds groter deel van ons leven uitmaken. Het heeft het potentieel om alles opnieuw te definiëren, van de algoritmen die onze ervaring van de wereld vormgeven tot ons begrip van gegevens en realiteit. Het risico is te groot om zulke belangrijke beslissingen over te laten aan een paar datawetenschappers, hoe goed hun bedoelingen ook zijn. We zullen moeten samenwerken met experts op het gebied van sociale wetenschappen en geesteswetenschappen. Dit komt niet omdat synthetische data niet beter of slechter is dan sommige huidige datasets, maar vanwege de angst voor de enorme mogelijkheden die het heeft.
*Dit artikel is een originele bron van het artikel dat op 11 april 2023 werd gepubliceerd in het elektronische krantenartikel.
Referenties