Ceci est un post traduit par IA.
Données synthétiques : les machines deviennent des consommateurs
- Langue de rédaction : Coréen
- •
- Pays de référence : Tous les pays
- •
- Technologies de l'information
Choisir la langue
Texte résumé par l'IA durumis
- Le service Synthetic Users, lancé en février dernier, propose une recherche utilisateur utilisant des consommateurs virtuels. Il offre des avantages en termes de réduction des coûts par rapport aux recherches menées auprès d'humains réels, mais suscite des inquiétudes quant à sa capacité à refléter fidèlement l'identité et les valeurs humaines.
- Les données synthétiques sont utilisées dans divers domaines, notamment la simulation automobile, les données sur les patients atteints de COVID-19, et l'essor de ChatGPT a considérablement accru leur demande.
- Afin de prévenir les impacts négatifs de la révolution des données synthétiques sur notre société, il est crucial de générer des données synthétiques basées sur des données réelles et une compréhension contextuelle approfondie, et de collaborer avec des experts en sciences sociales et en sciences humaines.
"Testez des idées ou des produits avec des consommateurs synthétiques d'IA et prenez des décisions en toute confiance."
Synthetic users, un service de recherche utilisateur sans utilisateurs
Lancé en février dernier, le service Synthetic Users, comme son nom l'indique, propose des consommateurs virtuels générés comme sujets de recherche utilisateur liés au développement de produits, plutôt que des humains réels. Il est possible de mener des entretiens et des enquêtes auprès de ces personnes virtuelles, et d'obtenir des commentaires sur leurs expériences d'utilisation des produits. Il est également possible de définir des situations spécifiques à des clients cibles, comme un couple européen en relation longue durée, et de fournir des données d'entretien associées pour un coût réduit de 380 $ pour 100 données d'entretien, une avancée significative. De plus, la communauté des spécialistes en anthropologie sociale, sociologie et anthropologie qui ont eu accès à ce service a réagi de différentes manières, exprimant à la fois le malaise, l'inquiétude ou le plaisir.
Il s'agit de l'incertitude de savoir si, plutôt que des créations « synthétiques », la recherche qualitative, qui consiste à comprendre les personnes elles-mêmes, ne conduirait pas à ce que des critères fondamentaux liés à l'identité humaine, aux objectifs, au plaisir et aux valeurs soient facilement copiés et compris. Elle comprend également des points de vue cyniques selon lesquels les situations sociopolitiques complexes et les relations interdépendantes qui créent les problèmes auxquels les personnes réelles sont confrontées dans la vie réelle ne peuvent pas être suffisamment réalisées.
En fait, ces données synthétiques ne sont pas un concept nouveau. Les données synthétiques sont particulièrement utiles lorsqu'il est difficile de collecter des ensembles de données. Par exemple, elles sont utilisées pour simuler des véhicules virtuels dans des simulations de véhicules automobiles afin d'entraîner des modèles dans un large éventail de situations et d'imiter le comportement des conducteurs. Elles ont également été utilisées pour créer des ensembles de données qui reproduisent les caractéristiques statistiques de 2,7 millions de dossiers de patients atteints de COVID-19, mais qui ne contiennent aucune information identifiable, permettant aux chercheurs du monde entier de partager et d'étudier rapidement ces données.
Cependant, la situation actuelle, où ChatGPT est appliqué à presque tous les services et se propage rapidement, a conduit à une explosion de la demande de données synthétiques, qui était déjà en forte hausse, et a même donné naissance à des services qui affirment que les données synthétiques peuvent maintenant remplacer la vie quotidienne des personnes qui recherchent des idées.
En particulier, le service Synthetic Users met en évidence les inquiétudes concernant l'utilisation des données synthétiques, à savoir : l'« écart avec la réalité », c'est-à-dire la nécessité de redéfinir les notions de « données » et de « vérité ».
Nous vivons déjà à l'ère de la désinformation, et il est de plus en plus difficile de comprendre la source et les préjugés de toutes les données que nous voyons. La vague de données synthétiques qui se profilera à l'horizon ne fera que brouiller davantage les frontières entre le « réel » et l'« artificiel », et rendra plus difficile pour les consommateurs de données ordinaires de juger de manière critique la source des données d'origine, les méthodes de collecte et de manipulation, et, par conséquent, le degré de confiance qu'ils doivent accorder aux données.
Par conséquent, la première étape la plus importante pour éviter que la révolution des données synthétiques ne génère un monde que nous ne voulons pas est de se concentrer sur les petites données plutôt que sur les grandes données. Aujourd'hui, de nombreuses entreprises ont tendance à se concentrer sur ce qu'on appelle la « prise de décision fondée sur les données », qui consiste à prendre des décisions en fonction de toutes les données disponibles, même si les ensembles de données sont biaisés ou incomplets. Par conséquent, les données synthétiques doivent provenir des meilleures données réelles que nous pouvons trouver. De plus, cela nécessite de fournir un ensemble de données initiales de la meilleure qualité possible, ainsi qu'une compréhension contextuelle approfondie de ce qui est le plus important dans les données et pourquoi.
Si elle n'est pas fondée sur une compréhension rigoureuse des phénomènes humains fondamentaux les plus récents, comme l'écart entre ce que les gens disent et ce qu'ils font, ou l'impact imprévu de notre vie sur nos actions, il y a un risque de simuler un monde social qui menace la réalité, en nuisant aux entreprises et au public.
À l'avenir, les données synthétiques joueront un rôle encore plus important dans notre vie quotidienne. Elles ont le potentiel de remodeler tout, des algorithmes qui façonnent notre expérience du monde à notre compréhension des données et de la réalité. Le risque est trop élevé pour que ces décisions importantes, aussi bien intentionnées soient- elles, soient laissées entre les mains de quelques scientifiques des données. Une collaboration avec des experts en sciences sociales et en sciences humaines sera nécessaire. Cela n'est pas dû au fait que les données synthétiques ne sont pas plus utiles ou sont pires que certains ensembles de données actuels, mais plutôt à la peur de ce qu'elles pourraient accomplir.
*Cet article est la version originale d'un article publié dansKolumne des Wirtschaftsmagazinsam 11. April 2023.
Références