Esta es una publicación traducida por IA.
Datos sintéticos: las máquinas se convierten en consumidoras
- Idioma de escritura: Coreano
- •
- País de referencia: Todos los países
- •
- Tecnología de la información
Seleccionar idioma
Texto resumido por la IA durumis
- El servicio Synthetic Users, lanzado en febrero, utiliza consumidores virtuales para la investigación de usuarios y ofrece un importante ahorro de costos en comparación con la investigación con personas reales. Sin embargo, se ha planteado la preocupación de que no pueda reflejar adecuadamente la identidad y los valores inherentes a los humanos.
- Los datos sintéticos se utilizan en diversos campos, como la simulación de automóviles, los datos de registros de pacientes con COVID-19 y, en particular, la aparición de ChatGPT ha provocado un aumento exponencial de la demanda.
- Para evitar que la revolución de los datos sintéticos tenga impactos negativos en nuestra sociedad, es fundamental generar datos sintéticos basados en datos reales con una profunda comprensión contextual y colaborar con expertos en ciencias sociales y humanidades.
"Pruebe ideas o productos con consumidores sintéticos de IA y tome decisiones con confianza."
Synthetic users, que ofrece un servicio de investigación de usuarios sin usuarios
El servicio Synthetic Users, que apareció en febrero, ofrece, como su nombre lo indica, consumidores virtuales generados como objetivo de la investigación de usuarios relacionada con el desarrollo de productos en lugar de personas reales. Es posible realizar entrevistas y encuestas con humanos virtuales, obtener comentarios sobre la experiencia de uso del producto, y obtener efectos de reducción de costos innovadores, como la función de configuración de situaciones específicas de clientes objetivo, como parejas europeas que mantienen relaciones a largo plazo, y 100 conjuntos de datos de entrevistas relacionados por US$ 380. Y la comunidad de especialistas en antropología, sociología y antropología que se ha encontrado con este servicio está respondiendo con una variedad de reacciones, desde "desagradable" y "inquietante" hasta "divertido".
Esto incluye la inquietud de que la identidad, el propósito, el placer y los valores inherentes a los humanos no se copien e interpreten tan fácilmente como se cree en la investigación cualitativa, que es un trabajo para comprender a las personas en sí mismas en lugar de creaciones "sintéticas", y la mirada cínica de que no se podrán implementar completamente las complejas situaciones sociopolíticas y las relaciones de mutuo entendimiento que constituyen los problemas que las personas reales enfrentan en la vida real.
De hecho, estos datos sintéticos no son un concepto nuevo. Los datos sintéticos son particularmente útiles cuando es difícil obtener conjuntos de datos. Por ejemplo, se utilizan para simular automóviles virtuales en la fabricación de automóviles, entrenando modelos en una amplia gama de situaciones imitando el comportamiento de los conductores, o se han utilizado para crear conjuntos de datos que tienen las mismas características estadísticas pero no información identificable al replicar registros de más de 2,7 millones de pacientes con COVID-19, permitiendo que los investigadores de todo el mundo compartan e investiguen rápidamente.
Sin embargo, la situación actual en la que ChatGPT se está aplicando rápidamente a servicios en casi todos los campos ha llevado a un aumento explosivo en la demanda de datos sintéticos que ya estaba aumentando, y ha dado lugar a servicios que argumentan que incluso la vida diaria de las personas que obtienen información se puede reemplazar con datos sintéticos.
En particular, la preocupación relacionada con el uso de datos sintéticos que el servicio Synthetic Users revela más claramente es la "brecha con la realidad", es decir, la necesidad de redefinir las definiciones de "datos" y "verdad".
Ya vivimos en una era de desinformación, y cada vez es más difícil entender la fuente y los sesgos de todos los datos que vemos. La inundación de datos sintéticos que se avecina no solo hará que la línea entre "real" e "artificial" sea más borrosa, sino que también dificultará que los consumidores de datos comunes evalúen críticamente la fuente de los datos originales, los métodos de recolección y manipulación, y, en última instancia, hasta qué punto deben confiar en ellos.
Por lo tanto, el comienzo más importante para evitar que la revolución de los datos sintéticos cree un mundo que no pretendemos es prestar atención al hecho de que no se trata de datos grandes, sino de datos pequeños. Hoy en día, muchas empresas tienden a centrarse en la llamada "toma de decisiones basada en datos", tomando decisiones basadas en todos los datos disponibles, aunque los conjuntos de datos sean sesgados o incompletos. Por lo tanto, los datos sintéticos deben provenir de los mejores datos reales que podamos encontrar. Además, se debe proporcionar un conjunto inicial de datos de la mejor calidad posible, junto con una comprensión contextual profunda de qué es lo más importante en los datos y por qué.
Si no se basa en una comprensión rigurosa de los fenómenos humanos fundamentales, como la diferencia entre lo que las personas dicen y hacen, o el impacto inesperado de la vida en nuestras acciones, corremos el riesgo de simular un mundo social que amenaza la realidad de una manera que perjudica a las empresas y al público en general.
Los datos sintéticos jugarán un papel mucho más importante en nuestra vida diaria en el futuro. Tiene el potencial de reconstruir todo, desde los algoritmos que dan forma a nuestra experiencia del mundo hasta nuestra comprensión de los datos y la realidad. A pesar de las mejores intenciones, es demasiado arriesgado dejar estas decisiones cruciales solo en manos de algunos científicos de datos. Se requerirá la colaboración con expertos en ciencias sociales y humanidades. Esto no se debe a que los datos sintéticos no sean útiles o peores que algunos conjuntos de datos actuales, sino al miedo de que puedan lograr demasiadas posibilidades.
*Este artículo es el original del contenido publicado en elColumna con nombre de Electronic Timesel 11 de abril de 2023.
Referencias