![translation](https://cdn.durumis.com/common/trans.png)
这是AI翻译的帖子。
选择语言
durumis AI 总结的文章
- OpenAI 发布了名为 Sora 的全新 AI 视频生成服务,该服务可以通过文本输入生成 AI 视频, 并通过文本的抽象化和参数空间的连接来创造逼真的视频。
- Sora 仍然存在局限性,但 OpenAI 计划通过 6 年的 AI 学习来制作更逼真的视频。 正如《怪兽的起源》中所展示的那样,AI 生成的图像和视频将在社会传播中发挥重要作用。
- 尤其是在去语境化图像的社会消费现象中,需要改变的是如何观看而不是看什么。 在讨论技术未来时,对人类身体的质疑将变得更加复杂和重要。
上週末,Open AI 推出了新服務 Sora。Sora 允許使用者輸入文字以製作 AI 影片,因此一推出就受到評論家的讚譽。由幾行簡單的文字製作而成的公開演示影片,例如中年男性慢動作吃漢堡的影片,以及從高角度拍攝的兩個行人在日本街頭散步的影片,其逼真的程度可與 CF 或電影中精心策划、導演並拍攝的場景相媲美。
Open AI 在同一天發布的技術報告中將 Sora 描述為「世界模擬器」。透過文字進行抽象化,並將其與參數空間連接起來,如果能以這種方式實現如此逼真的抽象化,那麼未來 GPT 模型的推理能力將會受到極大的影響,其意義在於 AI 出現在人類社會中的影響力方面,無疑是巨大的。
提示:一个人跑步的步步打印场景,用 35mm 拍摄的电影场景。
然而,Sora 仍然存在許多局限性。例如,一個人咬了一口餅乾,但之後餅乾上卻沒有留下咬痕,或者一個人在跑步機上跑步,卻面向後方而不是操作面板,並且以奇怪的肢體動作跑步。這表明,AI 在準確理解和呈現使用者提供的提示中的空間細節、隨時間推移發生的變化等方面仍有不足。這種原因和結果的連接案例,以及在複雜場景中實現物理學的困難,證明了 AI 仍然無法完全理解世界。但考慮到 Open AI 在 2023 年宣布,他們與擁有 3500 萬張高解析度照片和影片的 Shutter Stock 簽訂了合約,未來 6 年將繼續訓練 AI,因此預計未來 AI 生成的圖像和影片將會越來越接近人類在現實世界中製作的水平。
英國考古學家大衛·溫格羅在 2013 年出版的《怪獸的起源》一書中指出,從原始埃及到美索不達米亞文明,再到地中海鐵器時代,在城市形成、文明蓬勃發展、政治和商業網路擴張的時期,奇幻而複雜的非現實生物的視覺形象在各個地方出現。
来自俄罗斯南部巴泽雷克和图克塔库尔干的梦幻生物图像
獅子的身體、鷹的頭和翅膀,以及人身牛頭的彌諾陶洛斯等合成怪獸的圖像描述,被當時的人們記錄在各種壁畫和文獻中,並隨著擴大的貿易路線傳播,以作為當時精英地位的正當性。將各種生物的四肢或其他特徵分離,並將其重新組合,以創造出對應於不可見的擴展世界的存在的形象,這種現象是基於親屬關係中心的「整體」觀念向擴展的社會變革的轉變,以及由此產生的與從未見過的人們增加的分工,從而自我意識到「部分」所帶來的恐懼有關。換句話說,合成物的創造與技術發展所證實的自我意識之間的關係的發現,是他想要傳達的信息之一。
我們從去年開始就已經通過 Midjourney、DALL-E 等 AI 圖像生成程序,看到了羅馬時代的蜘蛛俠雕像、騎著馬在月球表面移動的宇航員、用三隻手臂繪畫的機器人等突破人類身體極限的有趣而怪異的圖像。而這次發布的 Sora 將加速更多 AI 生成影片的普及。重要的是,在人類早期歷史的記錄中,怪獸,即合成物的描述和社會傳播,正在當今的生成式 AI 時代重現。這種趨勢可以用「氛圍」來形容,這種「氛圍」超越了單純的「潮流」的概念,籠罩著當今世界。雖然這種表達方式並不新鮮,但我們認為現在正處於 AI 時代來臨的重要轉折點,因此有必要更加認真地看待這種趨勢。
沒有長篇論證或說明存在的 X,以及被大量消費和具有高度成癮性的 YouTube、TikTok 短視頻,證明了去脈絡化的圖像在社會中的消費現象。越來越多的瞬間和聯想性的視覺形象變得重要,這意味著關於什麼是信息的傳統解釋相關觀點被顛覆了。
總之,需要改變的是如何看,而不是看什麼。
對於與身體相關的趨勢或現象,我們應該選擇更具意義和分析性的早期方法。在 Guess、Calvin Klein 的營銷活動中,模特軍團的美學被認可,而以不同身體自然形態為特色的內衣品牌哲學被認可,在嘴唇上塗著粉紅色口紅,讓人難以辨別性別的形象,成為了青少年時代的有效策略的象徵。在想像技術的未來和討論技術進步時,人類身體總是與之並存。我們如何看待人體這個問題將會越來越複雜,也越來越重要。
參考資料