これはAIが翻訳した投稿です。
言語を選択
durumis AIが要約した文章
- 2月にリリースされたSynthetic Usersサービスは、仮想消費者を利用したユーザーリサーチサービスであり、実際の人間を対象としたリサーチと比べてコスト削減効果が大きい一方で、人間の本来のアイデンティティや価値を正しく反映できないという懸念が提起されています。
- 合成データは、自動車シミュレーション、新型コロナウイルス感染者記録データなど、さまざまな分野で活用されており、特にChatGPTの登場により需要が爆発的に増加しています。
- 合成データ革命が私たちの社会に悪影響を与えないようにするためには、現実のデータを基盤として、深い文脈的理解に基づいて合成データを生成する必要があり、社会科学および人文科学分野の専門家との協力が重要です。
「AI合成消費者と一緒にアイデアや製品をテストし、自信を持って意思決定をしましょう。」
ユーザーのいないユーザーリサーチサービスを提供するSynthetic users
2月に登場したSynthetic Usersサービスは、その名前の通り、製品開発に関連するユーザーリサーチの対象を、実際のユーザーではなく、生成された仮想消費者にするサービスです。 仮想のユーザーを対象にインタビューやアンケートを実施することができ、製品の使用経験に関するフィードバックも得ることができます。 また、長年交際しているヨーロッパのカップルなどのターゲット顧客の具体的な状況設定機能や、関連するインタビューデータ100件を380ドルという画期的なコスト削減効果も提供しています。 そして、このサービスに触れた民族誌学、社会学、人類学の専門家のコミュニティからは、不快だ、危機感を感じるとか、面白いだなど、様々な反応が寄せられています。
これは、'合成された'創作物ではなく、人間そのものを理解する作業である質的リサーチにおいて、人間の本来のアイデンティティ、目的、喜び、価値に関する基準が、思った以上に簡単にコピーされ、理解されてしまうのではないかという不安感と、実際の人々が現実で経験する厄介な問題が構成される複雑な社会政治的状況や相互の利害関係を十分に実現できないのではないかという冷笑的な視点を包含しています。
実際、このような合成データは新しい概念ではありません。 合成データは、自動車メーカーの仮想自動車シミュレーションにおける運転行動を模倣して、広範かつ多様な状況でモデルをトレーニングしたり、270万人以上のCOVID-19患者の記録データを複製して、統計的な特性は同一であるが、識別情報のないデータセットを作成し、世界中の研究者が迅速に共有して研究できるように使用されたり、データセットが不足している場合に特に役立ちます。
しかし、ChatGPTがほぼすべての分野のサービスに適用され、急速に普及している現状は、すでに急増していた合成データの需要をさらに爆発的に増加させるきっかけとなり、その範囲は、インサイトを得る人間の日常生活までが合成データで代替できるようになったと主張するサービスを生み出すまでになりました。
特にSynthetic Usersサービスが最も明確に示している合成データ利用に関する懸念は、『現実との乖離』、つまり、『データ』と『真実』に関する定義を新しくする必要があることを確認させるものです。
私たちはすでに間違った情報の時代に生きており、私たちが見ているすべてのデータのソースとバイアスを理解することがますます難しくなっています。 今後押し寄せる合成データの洪水は、『現実』と『人工』の境界をさらに曖昧にするだけでなく、一般のデータ消費者が、元のデータのソース、収集方法、操作方法、結果としてどの程度まで信頼すべきかを批判的に評価することをさらに難しくするでしょう。
そのため、合成データ革命が私たちが意図しない世界を生み出さないようにするためには、大きなデータではなく、小さなデータに注目することが最も重要な始まりとなります。 今日、多くの企業は、偏っているか不完全なデータセットが明らかなにもかかわらず、使用可能なすべてのデータに基づいて意思決定を行う、いわゆる『データに基づく意思決定』に集中する傾向が見られます。 そのため、合成データは、私たちが見つけられる最高の現実データから生まれるべきです。 また、このとき、データの中で最も重要なものは何か、なぜ重要なのかについての深い文脈的な理解とともに、可能な限り最高の品質の初期データセットを提供する必要があります。
人々が言うことと行動することのずれ、あるいは私たちが取る行動に対する人生の予想外の影響など、最も最近の根本的な人間の現象についての厳格な理解を基にしていない場合、会社や一般の人々にとって有害な方法で現実を脅かす社会世界をシミュレートする危険性があります。
今後、合成データは私たちの日常生活のさらに大きな部分を占めることになるでしょう。 私たちの経験を形作るアルゴリズムから、データと現実に関する理解に至るまで、すべてを再構成する可能性を秘めています。 これらの重要な決定を、どんなに良い意図を持っていても、一部のデータサイエンティストだけに委ねるにはリスクが大きすぎます。 社会科学や人文科学分野の専門家との協力が必要です。 これは、合成データが現在のいくつかのデータセットよりも役に立たないか、むしろ悪いためではなく、むしろ、あまりにも多くの可能性を実現できるという恐怖に起因しています。
*この記事は2023年4月11日付の電子新聞の署名コラムに掲載された内容の原文です。
References