"Pruebe ideas y productos con consumidores sintéticos y tome decisiones con confianza."
Synthetic users que proporciona servicios de investigación de usuarios sin usuarios reales
El servicio Synthetic Users, lanzado en febrero, ofrece, como su nombre indica, consumidores virtuales generados en lugar de humanos reales para la investigación de usuarios relacionada con el desarrollo de productos. Es posible realizar entrevistas y encuestas con personas virtuales, obtener comentarios sobre la experiencia de uso del producto, configurar situaciones específicas de clientes objetivo, como parejas europeas en relaciones a largo plazo, y obtener un ahorro de costes innovador, con 380 dólares por 100 conjuntos de datos de entrevistas relacionados. Las comunidades de antropólogos, sociólogos y etnógrafos que han accedido a este servicio han expresado una variedad de reacciones, desde molestia e inquietud hasta diversión.
Esto incluye la inquietud de que los criterios relacionados con la identidad, el propósito, el disfrute y el valor inherentes a las personas, que son el foco de la investigación cualitativa (que no se centra en creaciones "sintéticas", sino en la comprensión de las personas mismas), puedan ser copiados y comprendidos con mayor facilidad de lo que se cree, así como una perspectiva cínica de que no pueden representar adecuadamente la compleja situación sociopolítica y las relaciones interpersonales que dan lugar a los problemas que las personas experimentan en la vida real.
En realidad, estos datos sintéticos no son un concepto nuevo. Los datos sintéticos son especialmente útiles cuando es difícil obtener conjuntos de datos, como en el caso de las simulaciones virtuales de automóviles que imitan el comportamiento del conductor para entrenar modelos en una amplia gama de situaciones, o en la replicación de registros de más de 2,7 millones de pacientes con COVID-19 para crear un conjunto de datos sin información de identificación que conserve las características estadísticas originales, lo que permite a los investigadores de todo el mundo compartir e investigar rápidamente los datos.
Sin embargo, la situación actual, en la que ChatGPT se está extendiendo rápidamente a casi todos los servicios de todos los sectores, ha provocado una explosión de la demanda de datos sintéticos que ya estaba en aumento, y esta tendencia ha dado lugar a servicios que afirman que incluso la vida cotidiana de las personas que obtienen información puede ser reemplazada por datos sintéticos.
En particular, la preocupación más evidente relacionada con el uso de datos sintéticos que plantea el servicio Synthetic Users esla "brecha con la realidad", lo que indica la necesidad de una nueva definición de "datos" y "verdad".
Ya vivimos en una época de información errónea, y cada vez es más difícil entender el origen y los sesgos de todos los datos que vemos. La avalancha de datos sintéticos que se avecina no solo difuminará aún más la línea entre lo "real" y lo "artificial", sino que también dificultará que el consumidor de datos promedio evalúe críticamente el origen de los datos originales, la forma en que se recopilaron y manipularon, y, en última instancia, hasta qué punto debe confiar en ellos.
Por lo tanto, para evitar que la revolución de los datos sintéticos cree un mundo que no deseemos, el primer paso más importante es prestar atención al hecho de que los datos pequeños, no los datos grandes, son la clave. Hoy en día, muchas empresas tienden a centrarse en la llamada "toma de decisiones basada en datos", en la que toman decisiones basándose en todos los datos disponibles, aunque el conjunto de datos sea claramente sesgado o incompleto. Por lo tanto, los datos sintéticos deben derivarse de los mejores datos del mundo real que podamos encontrar. Además, se debe proporcionar el conjunto de datos inicial de la mejor calidad posible junto con una comprensión contextual profunda de qué es lo más importante en los datos y por qué es importante.
Si no se basa en una comprensión profunda de los fenómenos humanos fundamentales más recientes, como la diferencia entre lo que la gente dice y lo que hace, o el impacto inesperado de la vida en nuestras acciones, corremos el riesgo de simular un mundo social que amenaza la realidad de una manera que perjudica tanto a las empresas como a los individuos.
Los datos sintéticos desempeñarán un papel mucho más importante en nuestra vida diaria en el futuro. Tiene el potencial de remodelar todo, desde los algoritmos que dan forma a nuestra experiencia del mundo hasta nuestra comprensión de los datos y la realidad. El riesgo de dejar estas decisiones cruciales, por muy buenas que sean las intenciones, en manos de unos pocos científicos de datos es demasiado grande, y se requiere la colaboración con expertos en ciencias sociales y humanidades. Esto no se debe simplemente a que los datos sintéticos no sean útiles o sean peores que algunos conjuntos de datos actuales, sino a que existe un temor a su gran potencial.
*Este artículo es la versión original del artículo publicado el 11 de abril de 2023 en columna firmada en el periódico electrónico.
Referencias
Comentarios0