Byungchae Ryan Son

AI時代的「身體」:如何看待?

  • 撰写语言: 韓国語
  • 基准国家: 所有国家country-flag
  • 信息技术

撰写: 2024-05-16

撰写: 2024-05-16 14:19

上週末,Open AI 發布了新的服務 Sora。Sora 允許用戶輸入文字生成 AI 影片,一經發布便獲得了評論家的讚譽。公開的演示影片僅需幾行簡單的文字即可製作,例如中年男子慢動作吃漢堡的畫面、俯瞰日本街道上兩個人散步的鏡頭等等,這些影片呈現出的真實感堪比廣告或電影中經過精心策劃、拍攝的場景。


Open AI 在同一天發布的技術報告中將 Sora 描述為世界模擬器。如果透過文字抽象化與參數空間的連結,就能夠實現如此逼真的抽象化,那麼未來 GPT 模型的推理能力將會受到極大的影響,其意義在於 AI 對人類社會的影響力方面,可謂意義重大。

https://play-tv.kakao.com/embed/player/cliplink/rv4bqfvi1rq49f96sh1gmfm02@my?service=daum_brunch&section=article&showcover=1&showinfo=0&extensions=0&rel=0

提示:跑步者的逐幀畫面,以35毫米膠片拍攝的電影風格鏡頭。

然而,Sora 仍然存在許多局限性。例如,一個人咬了一口餅乾,但隨後餅乾上的咬痕消失了;或者一個人正在跑步機上跑步,但他的身體卻朝向跑步機的後方,而非控制面板的方向,並且肢體動作顯得僵硬。這些例子表明,Sora 在理解和呈現使用者提供的提示中的空間細節、隨時間推移發生的變化等方面存在不足。這種原因和結果之間的關聯性,以及在複雜場景中實現物理學的困難,都證明了 AI 仍然無法真正理解世界。但考慮到 Open AI 在 2023 年宣布與擁有 3500 萬張高解析度照片和影片的 Shutterstock 簽訂合約,並計劃在未來六年內繼續訓練 AI,因此預計未來 AI 生成的影像和影片將會越來越接近人類製作的真實水平。


英國考古學家大衛·溫格羅於 2013 年出版的著作《怪物的起源》中指出,從原始埃及到美索不達米亞文明,再到地中海鐵器時代,在城市形成、文明蓬勃發展以及政治和商業網絡擴展的時期,幻想且複雜的非現實生物的視覺形象在各個地區都廣泛出現。

AI時代的「身體」:如何看待?

來自俄羅斯南部帕齊里克和圖埃克塔古墓的奇幻生物圖像


例如,獅身鷹首獸(Griffin)、牛頭人身獸(Minotaur)等合成怪物的圖像描述被當時的人們記錄在各種壁畫和文獻中,並隨著擴展的貿易路線傳播,以維護當時精英階層的合法地位。這種將不同物種的四肢或其他特徵分離並重新組合,以創造出對應於看不見的擴展世界的存在形象的現象,可以解釋為:在生產活動中,以親屬關係為中心的『整體』觀念轉變為擴展的社會變革,導致與從未謀面的人們之間的勞動分工增加,從而產生了作為『部分』的自我意識,以及由此產生的恐懼。換句話說,合成物的創作與技術發展所揭示的自我意識與關係的發現,是他想要傳達的訊息之一。


我們從去年開始,透過 Midjourney、DALL-E 等 AI 圖像生成程式,已經見識了無數有趣且怪誕的影像,例如羅馬時代的蜘蛛人雕像、騎馬在月球表面行進的太空人、擁有三隻手臂的機器人繪畫等等,這些影像都突破了人類身體的限制。而這次發布的 Sora 將進一步加速 AI 生成的影片的普及。重要的是,在生成式 AI 時代,早期人類歷史記錄中反覆出現的怪物,也就是合成物的描述和社會傳播,正在重演。 這種趨勢可以用『氛圍』(vibe)來形容,它超越了單純的趨勢這個詞所能表達的範圍,是當今世界瀰漫的一種氣息。儘管這個詞並不新鮮,但我們似乎正處於通往 AI 時代的一個值得注意的轉折點,因此我們需要更認真地看待這種趨勢。


在 YouTube、TikTok 等平台上,由於缺乏長篇論證或說明的空間,短影片盛行,這證明了脫離語境的影像在社會上被廣泛消費的現象。越來越多的瞬間、聯想性的詩意影像變得重要,這也意味著關於資訊的解讀觀點,也就是什麼被視為資訊,正在發生逆轉。


簡而言之,我們需要改變的是『看什麼』,而是『如何看』。


對於與身體相關的趨勢或現象,我們需要選擇更具意義、更具分析性的方法來進行研究。在 Guess、Calvin Klein 等品牌的行銷活動中,模特兒軍團的美學逐漸被淡化,取而代之的是內衣品牌宣揚各種身體的自信,以及模糊性別的唇膏圖像成為吸引青少年的有效策略。當我們想像技術的未來和討論技術的發展時,人類的身體必然存在其中。『如何看待人類的身體』這個問題將會變得越來越複雜和重要。


參考資料



评论0