Esta é uma postagem traduzida por IA.
Dados Sintéticos: Máquinas se Tornam Consumidores
- Idioma de escrita: Coreana
- •
- País de referência: Todos os países
- •
- TI
Selecionar idioma
Texto resumido pela IA durumis
- O serviço Synthetic Users, lançado em fevereiro, utiliza consumidores virtuais para pesquisas de usuários, oferecendo economia de custos em comparação com pesquisas com pessoas reais, mas levanta preocupações sobre a capacidade de refletir adequadamente a identidade, valores e outros aspectos inerentes ao ser humano.
- Os dados sintéticos são utilizados em diversas áreas, como simulações de carros e registros de pacientes com COVID-19, e a demanda tem crescido exponencialmente, especialmente com o surgimento do ChatGPT.
- Para evitar que a revolução dos dados sintéticos tenha impactos negativos na sociedade, é crucial que os dados sintéticos sejam gerados com base em dados reais, com uma profunda compreensão contextual e em colaboração com especialistas em ciências sociais e humanidades.
"Teste ideias ou produtos com consumidores sintéticos de IA e tome decisões com confiança."
Synthetic users, um serviço de pesquisa de usuários sem usuários reais
O serviço Synthetic Users, lançado em fevereiro, fornece consumidores virtuais gerados como alvo para pesquisa de usuário relacionada ao desenvolvimento de produtos, como o próprio nome sugere. É possível conduzir entrevistas e pesquisas com humanos virtuais, obter feedback sobre a experiência de uso do produto e configurar situações específicas do cliente alvo, como casais europeus que estão em um relacionamento de longo prazo, e obter dados de entrevista relacionados a esses, com uma redução drástica de custos de US$ 380 para 100 dados de entrevista. E as comunidades de estudantes de antropologia, sociologia e antropologia que tiveram contato com esse serviço estão expressando uma variedade de reações, como desconforto, sensação de crise ou diversão.
Isso inclui a ansiedade de que a identidade, o propósito, o prazer e os valores inerentes às pessoas, que são trabalhos que compreendem não apenas criações "sintéticas", mas as pessoas em si, em pesquisas qualitativas, podem ser copiados e compreendidos com mais facilidade do que se imagina, e a visão cínica de que as situações sociopolíticas complexas que formam os problemas que as pessoas realmente enfrentam no mundo real e os relacionamentos interdependentes não serão totalmente implementados.
Na verdade, esses dados sintéticos não são um conceito novo. Dados sintéticos são particularmente úteis quando é difícil obter conjuntos de dados, como no caso de fabricantes de automóveis, que usam simulações de veículos virtuais para imitar o comportamento do motorista e treinar modelos em uma ampla gama de situações, ou para criar conjuntos de dados que possuem as mesmas características estatísticas, mas sem informações de identificação, replicando dados de registros de 2,7 milhões de pacientes com COVID-19, para que pesquisadores de todo o mundo possam compartilhar e pesquisar rapidamente.
No entanto, a situação atual, em que o ChatGPT está sendo aplicado a quase todos os tipos de serviços e se espalhando rapidamente, fez com que a demanda por dados sintéticos, que já estava aumentando rapidamente, explodisse, e seu escopo agora se estende a serviços que argumentam que até mesmo a vida cotidiana das pessoas que obtêm insights pode ser substituída por dados sintéticos.
Em particular, a preocupação com o uso de dados sintéticos que o serviço Synthetic Users revela mais claramente é a "lacuna com a realidade", ou seja, a necessidade de repensar a definição de "dados" e "verdade".
Já vivemos em uma era de desinformação, e está se tornando cada vez mais difícil entender a origem e o viés de todos os dados que vemos. A enxurrada de dados sintéticos que virá apenas tornará a linha entre "real" e "artificial" mais tênue, mas também tornará mais difícil para os consumidores de dados comuns avaliar criticamente a origem dos dados originais, os métodos de coleta e manipulação e, consequentemente, até que ponto devem confiar.
Portanto, para garantir que a revolução dos dados sintéticos não crie um mundo que não desejamos, precisamos começar com dados pequenos, não grandes. Hoje, muitas empresas tendem a se concentrar na tomada de decisões "baseadas em dados", que se baseiam em todos os dados disponíveis, apesar de conjuntos de dados enviesados ou incompletos serem evidentes. Portanto, os dados sintéticos devem derivar dos melhores dados do mundo real que podemos encontrar. Além disso, é necessário fornecer um conjunto de dados inicial de alta qualidade, juntamente com uma profunda compreensão contextual do que é importante nos dados e por quê.
Se não estivermos baseados em uma compreensão rigorosa dos fenômenos humanos fundamentais, como a diferença entre o que as pessoas dizem e fazem ou as influências inesperadas da vida em nosso comportamento, corremos o risco de simular um mundo social que ameaça a realidade de uma forma que prejudica as empresas e o público em geral.
No futuro, os dados sintéticos farão parte cada vez maior do nosso dia a dia. Eles têm o potencial de remodelar tudo, desde os algoritmos que moldam nossa experiência do mundo até nossa compreensão de dados e realidade. Deixar decisões tão importantes nas mãos de alguns cientistas de dados, mesmo com as melhores intenções, é arriscado demais. É necessário trabalhar com especialistas nas áreas de ciências sociais e humanidades. Isso não se deve ao fato de que os dados sintéticos não são úteis ou piores do que alguns conjuntos de dados atuais, mas sim ao medo de que eles possam realizar muitas possibilidades.
*Este artigo é uma tradução do original publicado emColuna assinada no Jornal Eletrônicoem 11 de abril de 2023.
Referências