![translation](https://cdn.durumis.com/common/trans.png)
Это сообщение переведено AI.
Синтетические данные: машины становятся потребителями
- Язык написания: Корейский
- •
-
Базовая страна: Все страны
- •
- ИТ
Выбрать язык
Текст, резюмированный ИИ durumis
- Сервис Synthetic Users, запущенный в феврале, предлагает пользовательские исследования с использованием виртуальных потребителей, что позволяет значительно сократить затраты по сравнению с исследованиями на реальных людях, но вызывает опасения, что он не сможет должным образом отразить прирожденную идентичность, ценности и т. д. людей.
- Синтетические данные используются в различных областях, таких как моделирование автомобилей, данные о пациентах с COVID-19, и особенно в связи с появлением ChatGPT, их спрос резко возрастает.
- Чтобы синтетическая революция данных не оказала негативного влияния на наше общество, необходимо генерировать синтетические данные на основе реальных данных, опираясь на глубокое контекстное понимание, а также важна кооперация с экспертами в области общественных и гуманитарных наук.
"Используйте синтетических потребителей с ИИ для тестирования идей или продуктов и принимайте решения с уверенностью."
Synthetic users, предоставляющий услуги пользовательских исследований без пользователей
Сервис Synthetic Users, появившийся в феврале, как следует из его названия, предлагает для исследования пользователей, связанных с разработкой продуктов, не реальных людей, а сгенерированных виртуальных потребителей. С виртуальными людьми можно проводить интервью и опросы, получать отзывы о пользовании продуктами, а также есть возможность задавать конкретные настройки для целевой аудитории, например, пары из Европы, которые долгое время состоят в отношениях, а также получать данные 100 интервью за 380 долларов, что является революционным сокращением затрат. Этот сервис вызвал разнообразные реакции в сообществах этнографов, социологов и антропологов, от неприятия и тревоги до веселья.
Это связано с тем, что в качественных исследованиях, которые связаны не с «синтезированными» произведениями, а с пониманием самого человека, возникает чувство тревоги по поводу того, что такие фундаментальные основы, как человеческая идентичность, цели, удовольствие и ценности, могут быть скопированы и поняты намного проще, чем кажется. В то же время наблюдается скептическое отношение к тому, что сложная социально-политическая ситуация, в которой формируются проблемы, с которыми сталкиваются реальные люди, и взаимосвязи между ними, не будут реализованы в полной мере.
На самом деле синтетические данные — это не новая концепция. Синтетические данные особенно полезны в тех случаях, когда трудно получить набор данных, например, в имитационном моделировании автомобилей для моделирования поведения водителей, что позволяет обучать модели в большом количестве разнообразных ситуаций, или же для создания набора данных, который содержит статистические характеристики, но лишен идентификационной информации, с помощью репликации записей более 2,7 миллионов пациентов с COVID-19, что позволяет исследователям по всему миру быстро обмениваться и проводить исследования.
Однако в настоящее время, когда ChatGPT внедряется практически во все сферы и быстро распространяется, это стало причиной взрывного роста спроса на синтетические данные, который и так уже был значительным, и привело к появлению услуг, которые утверждают, что синтетические данные теперь могут заменить даже повседневную жизнь людей, которые получают информацию.
В частности, сервис Synthetic Users наиболее явно демонстрирует опасения, связанные с использованием синтетических данных, а именно «разрыв с реальностью», то есть необходимость переосмысления определения «данных» и «правды».
Мы уже живем в эпоху дезинформации, и становится все труднее понимать источник и предвзятость всех данных, которые мы видим. Поступающий поток синтетических данных будет не только усиливать размывание границ между «реальностью» и «искусственным», но и затруднит для обычных потребителей данных критическую оценку источника исходных данных, способов их сбора и манипулирования, а в конечном итоге и степени их надежности.
Поэтому для того, чтобы синтетическая революция данных не создала мир, который мы не хотели бы видеть, нам нужно обратить внимание на то, что не большие данные, а маленькие данные являются самым важным. Сегодня многие компании склонны сосредоточиваться на так называемом «принятии решений на основе данных», основанном на всех доступных данных, даже несмотря на очевидные предвзятость или неполноту набора данных. Поэтому синтетические данные должны основываться на лучших реальных данных, которые мы можем найти. Кроме того, необходимо обеспечить наивысшее качество исходного набора данных в сочетании с глубоким контекстуальным пониманием того, что является самым важным в данных и почему.
Если это не будет основано на строгих знаниях самых последних основных человеческих явлений, например, разницы между словами и действиями или непредвиденного влияния жизни на наше поведение, то существует риск имитации социального мира, который угрожает реальности для компаний и обычных людей.
В будущем синтетические данные станут еще более важной частью нашей жизни. Они имеют потенциал переосмыслить все, от алгоритмов, формирующих наш опыт мира, до нашего понимания данных и реальности. Риск доверять принятие таких важных решений, даже с лучшими намерениями, некоторым специалистам по данным слишком велик. Необходимо сотрудничество со специалистами в области социальных и гуманитарных наук. Это связано не с тем, что синтетические данные не помогают или даже хуже существующих наборов данных, а с тем, что они могут реализовать слишком много возможностей, что вызывает страх.
*Эта статья является оригинальной версией колонкі на сайте Electronic Newspaperопубликованной 11 апреля 2023 года.
Ссылки