Dados Sintéticos: Máquinas se Tornam Consumidoras

Teste ideias e produtos com confiança com consumidores sintéticos de IA.

Usuários sintéticos que fornecem serviços de pesquisa de usuários sem a presença de usuários reais

Lançado em fevereiro, o serviço Synthetic Users, como o nome sugere, oferece consumidores virtuais gerados como público-alvo para pesquisas de usuários relacionadas ao desenvolvimento de produtos, em vez de humanos reais. É possível realizar entrevistas e pesquisas com esses humanos virtuais, obter feedback sobre a experiência de uso do produto e até mesmo definir cenários específicos para o cliente-alvo, como casais europeus em um relacionamento de longo prazo, além de obter dados de entrevistas relacionados por US$ 380 para 100 entrevistas, proporcionando uma economia de custos inovadora. E a comunidade de especialistas em etnografia, sociologia e antropologia que teve acesso a esse serviço tem apresentado reações diversas, como desconforto, sensação de ameaça ou até mesmo diversão.

Isso inclui a ansiedade de que a identidade, o propósito, o prazer e os valores inerentes ao ser humano, que são o foco da pesquisa qualitativa, que não é sobre artefatos 'sintéticos', mas sobre a compreensão das pessoas em si, possam ser copiados e compreendidos com mais facilidade do que se imagina, e uma perspectiva cínica de que não será possível representar completamente as complexas situações sociopolíticas e as inter-relações nas quais os problemas do mundo real são criados e que as pessoas enfrentam.

Na verdade, esses dados sintéticos não são um conceito novo. Os dados sintéticos são particularmente úteis quando é difícil obter conjuntos de dados, como em simulações virtuais de carros, onde o comportamento do motorista é simulado para treinar modelos em uma ampla gama de situações, ou na replicação de mais de 2,7 milhões de registros de pacientes com COVID-19 para criar conjuntos de dados sem informações de identificação, mas com as mesmas características estatísticas, permitindo que pesquisadores de todo o mundo compartilhem e estudem dados rapidamente.

No entanto, a situação atual, em que o ChatGPT está sendo aplicado a uma ampla gama de serviços e se espalhando rapidamente, acelerou a demanda por dados sintéticos, que já estava crescendo, e expandiu seu escopo a ponto de serviços que afirmam que a vida cotidiana das pessoas que obtêm insights também pode ser substituída por dados sintéticos.

Em particular, a preocupação com o uso de dados sintéticos mais claramente revelada pelo serviço Synthetic Users éa 'lacuna entre o mundo real e o virtual', ou seja, a necessidade de redefinir o que são 'dados' e 'verdade'.

Já vivemos em uma era de informações imprecisas e está se tornando cada vez mais difícil entender a origem e o viés de todos os dados que vemos. A enxurrada de dados sintéticos que surgirá tornará a linha entre 'real' e 'artificial' ainda mais tênue, além de tornar mais difícil para o consumidor comum avaliar criticamente a origem dos dados originais, como eles foram coletados e manipulados e, por fim, até que ponto devem ser confiáveis.

Portanto, para evitar que a revolução dos dados sintéticos gere um mundo que não desejamos, precisamos começar focando nos dados pequenos em vez de nos grandes dados. Hoje, muitas empresas tendem a se concentrar na chamada 'tomada de decisão baseada em dados', que consiste em tomar decisões com base em todos os dados disponíveis, mesmo que conjuntos de dados tendenciosos ou incompletos sejam óbvios. Portanto, os dados sintéticos devem ser derivados dos melhores dados reais que podemos encontrar. Além disso, precisamos fornecer o conjunto de dados inicial da melhor qualidade possível, juntamente com uma compreensão profunda do contexto do que é mais importante nos dados e por que é importante.

Isso ocorre porque, se não for baseado em uma compreensão rigorosa dos fenômenos humanos mais recentes e fundamentais, como a diferença entre o que as pessoas dizem e o que fazem ou o impacto inesperado da vida em nossas ações, corremos o risco de simular um mundo social que ameaça a realidade de uma forma que prejudica tanto as empresas quanto o público em geral.

Os dados sintéticos se tornarão uma parte muito maior de nossas vidas no futuro. Tem o potencial de remodelar tudo, desde os algoritmos que moldam nossas experiências do mundo até nossa compreensão de dados e realidade. O risco de deixar essas decisões importantes apenas para alguns cientistas de dados, mesmo com as melhores intenções, é muito grande, e a colaboração com especialistas em ciências sociais e humanidades será necessária. Isso não se deve ao fato de que os dados sintéticos não são úteis ou até piores do que alguns conjuntos de dados atuais, mas sim ao medo do enorme potencial que eles podem alcançar.

*Este artigo é a versão original do conteúdo publicado em 11 de abril de 2023 no coluna assinada no jornal eletrônico.

Referências

Pesquisa sem a dor de cabeça de pessoas reais

O Estado da União da IA

Pesquisa de usuários sem a síntese

Pesquisa Sintética e Amostragem de Silício // Despacho BrXnd vol. 010
Precisamos falar sobre dados sintéticos⁠⁠⁠⁠⁠⁠⁠

Comentários0