これはAIが翻訳した投稿です。
言語を選択
durumis AIが要約した文章
- OpenAIは、テキストを入力してAI動画を制作する新しいサービスSoraを公開しました。これは、テキストによる抽象化とパラメータ空間との 接続によって、現実的な動画を作成することができます。
- Soraはまだ限界はありますが、OpenAIは6年間のAI学習を通じて、より現実的な動画を制作する計画です。怪物の起源に見られるように、 AI生成の画像と動画は、社会的な伝達において重要な役割を果たすでしょう。
- 特に、脱文脈化された画像の社会的な消費現象と共に、何を観るかではなく、どのように観るかという変化が必要になります。技術の未来を論じる 際に、人間の身体に対する問いは、ますます複雑化し、重要性を増していくでしょう。
先週の週末、Open AIは新しいサービスSoraを公開した。Soraは、テキストを入力してAI動画を作成できるため、公開直後からレビューアーから称賛を受けている。公開されたデモ動画は、数行の簡単なテキストだけで作成されており、ハンバーガーを食べる中年男性のスローモーション動画、二人の人物が歩く日本の街並みを捉えた俯瞰ショットなど、CMや映画で企画・演出・撮影されたシーンに匹敵するレベルの高い現実感を示している。
Open AIは、同日に公開された技術レポートでSoraをワールドシミュレーターと表現した。テキストによる抽象化とパラメータ空間との連携により、このレベルの現実的な抽象化が可能になったということは、今後のGPTモデルの推論能力に多大な影響を与えるとともに、人間の社会に出現したAIの影響力という観点から見ても、その意義は計り知れない。
Prompt: Step-printing scene of a person running, cinematic film shot in 35mm.
しかし、Soraにはまだ多くの課題も存在する。人がクッキーを一口かじったが、その後クッキーにかじった跡が消えてしまうシーンや、ランニングマシンの上を走っている人が、操作盤がある前方ではなく後方を向いたまま、ぎこちない足で走っているシーンなど、ユーザーが提示したプロンプト内の空間的な詳細、時間経過による変化などを正確に理解し、表現することに欠けている部分が見られる。このような原因と結果の関連する事例や、複雑なシーンにおける物理学の表現に苦労していることは、AIがまだ世界を正しく理解できていないことの証拠でもある。しかし、Open AIは、3,500万枚の高解像度の写真や動画を保有するShutterstockとの契約を通じて、今後6年間AIを学習させる計画であると2023年の発表で述べており、今後AI生成イメージや動画が、より人間が作成した現実世界のレベルに近づくと予想することも難しくはない。
イギリスの考古学者デイビッド・ウェングロウは、2013年に発表した著書『モンスターの起源』の中で、古代エジプトからメソポタミア文明、地中海鉄器時代に至るまで、都市が形成され、文明が活発に花開いて政治・商業ネットワークが拡大した時代には、幻想的で複合的な非現実的な生物の視覚イメージが作られ、広がらない地域はなかったと主張している。
Images of fantastic creatures from the Pazyryk and Tuekta kurgans, South Russia
ライオンの胴体にワシの頭と翼が加わったグリフィン、人間の身体と牛の頭が合わさったミノタウロスなどの合成獣のグラフィック描写は、当時の住民によって様々な壁画や文献に記録され、当時のエリート層の正当化のために拡大された交易路に沿って伝えられてきたという。この様々な種の四肢や他の特徴を分離し、それらを再結合して、目に見えない拡張された世界に対応する存在のイメージを作るという現象は、生産活動において、自分たちが「全体」であると考えていた血縁関係中心の視点が、拡張された社会変化に伴い、これまで出会ったことのない人々との分業の増加によって、自らが「部分」であるという認識と、それに伴う恐怖に結びついて発生したと解釈することができる。つまり、合成物の創作と技術の発展によって確認された自己認識との関係の発見こそが、彼が共有しようとするメッセージの一つである。
我々は、昨年からMidjourney、DALL-EなどのAI画像生成プログラムを通じて、ローマ時代のスパイダーマン像、馬に乗って月面を移動する宇宙飛行士、3本腕で絵を描いているロボットなど、人間の身体の限界を超えた興味深いながらも奇妙な画像を数多く見てきた。そして今回発表されたSoraによって、AI生成動画の普及がさらに加速すると考えられる。重要なのは、人類史初期の記録とともに繰り返されてきたモンスター、つまり合成物の描写と社会的伝達がいま、生成AIの時代で再演されているということだ。この流れは、単にトレンドという言葉で片付けるにはあまりにも重く、この時代の世界を包み込んでいる「バイブ」と言えるだろう。 この表現は新しくはないが、我々が今、AI時代に向かって注目すべき転換期に差し掛かっているように思えるため、この流れをもっと真剣に受け止める必要がある。
長い形式の論証、説明が存在できないX、最も多く消費され、中毒性のあるYouTube、TikTok内のショート動画は、文脈化されていないイメージの社会的消費現象を証明する。ますます瞬間的で連想的な詩的なイメージが重要になってきており、これは곧既存の解釈に関する視点が覆されたことを示していることを意味する。
要するに、何をみるかではなく、どのようにみるかという変化が必要である。
身体に関連するトレンドや現象について、もっと意味論的に、分析的に、初期とは異なるアプローチを選択する必要がある。ゲスやカルバンクラインのマーケティングキャンペーンに登場するモデル軍団の美学ではなく、様々な身体そのままを堂々と表現するランジェリーブランドの哲学が認められ、男性か女性か分からない唇の上のピンク色の口紅のイメージが10代の若者にとって効果的な戦略の象徴となる時代だ。技術の未来を想像し、技術の発展について議論する時、常に存在するのが人間の身体である。人間の身体をどのようにみるかという問いは、今後ますます複雑化し、重要になっていく。
参考文献